PDA

View Full Version: Googles computerkraft forædler oversættelsesværktøj



brubros
09-03-10, 18:43
Nyheder artiklen genoptrykt fra The New York Times avis.

På et møde hos Google i 2004, vendte diskussionen til en e-mail, virksomheden havde modtaget fra en fan i Sydkorea. Sergey Brin, en Google-grundlægger, løb budskabet gennem en automatisk oversættelsestjeneste, at selskabet havde licens.

Budskabet sagde Google var en favorit søgemaskine, men resultatet læses: "Det skiver rå fisk sko, den ønsker. Google grønne løg ting! "

Mr. Brin sagde Google burde kunne gøre det bedre. Seks år senere, den gratis Google Translate tjeneste håndterer 52 sprog, mere end noget tilsvarende system, og folk bruger det hundreder af millioner af gange om ugen for at oversætte web-sider og anden tekst.

"Hvad du ser på Google Translate er state of the art" i computerens oversættelser, der ikke er begrænset til et bestemt emne eller område, siger Alon Lavie, en associeret forskningsprofessor i Language Technologies Institute ved Carnegie Mellon University.

Googles bestræbelser på at ekspandere ud over at søge på internettet er blevet mødt med blandet succes. Dens digitale bøger Projektet er blevet hængt op i retten, og indførelsen af sit sociale netværk, Buzz, rejste privatliv frygt. Det mønster tyder på, at det sommetider kan fejltrin, når den forsøger at udfordre erhvervsmæssige traditioner og kulturelle konventioner.

Men Google er hurtigt anledning til øverste lag af oversættelsen virksomhed er en påmindelse om, hvad der kan ske, når Google slipper sin brute-force computerkraft på komplekse problemer.

Det netværk af datacentre, at den er bygget til web søgninger kan nu være, når surret sammen, verdens største computer. Google er ved hjælp af denne maskine til at skubbe grænserne for oversættelse teknologi. Sidste måned, for eksempel, sagde, at det var det arbejder på at kombinere sit oversættelsesværktøj med billede analyse, så en person til, sige, tage en mobiltelefon foto af en menu i tysk og få en øjeblikkelig engelsk oversættelse.

"Maskinoversættelse er et af de bedste eksempler, der viser Googles strategiske vision," sagde Tim O'Reilly, grundlægger og administrerende direktør for den teknologi, forlaget O'Reilly Media. "Det er ikke noget, at nogen andre tager meget alvorligt. Men Google forstår noget om data, som ingen andre forstår, og det er villig til at foretage de nødvendige investeringer for at håndtere den slags komplekse problemer forud for markedet. "

Oprettelse af en oversættelse maskine har længe været set som en af de hårdeste udfordringer i kunstig intelligens. I årtier har forsøgt dataloger ved hjælp af et regelbaseret tilgang - at undervise i computer sproglige regler for to sprog og give den de nødvendige ordbøger.

Men i midten af 1990'erne, begyndte forskere begunstige en såkaldt statistisk metode. De fandt, at hvis de fodres computeren tusinder eller millioner af passager og deres menneskelige-genereret oversættelse, kan det lære at lave præcise gæt om, hvordan du oversætte nye tekster.

Det viser sig, at denne teknik, som kræver enorme mængder af data og masser af computing hestekræfter, er lige op Googles gyde.

"Vores infrastruktur er meget velegnet til dette," Vic Gundotra, en vice president for engineering hos Google, sagde. "Vi kan tage tilgange, som andre ikke engang kan drømme om."

Automatiseret oversættelse systemer er langt fra perfekt, og selv Googles vil ikke sætte menneskelige oversættere ud af et job helst snart. Eksperter siger, at det er yderst vanskeligt for en computer at bryde en sætning i dele, og derefter oversætte og samle dem.

Men Googles service er god nok til at formidle essensen af en nyhedsartikel, og det er blevet en hurtig kilde til oversættelser for millioner af mennesker. "Hvis du har brug for en rå-og klar til oversættelse, det er det rette sted at gå," sagde Philip Resnik, en maskinoversættelse ekspert og lektor i lingvistik ved University of Maryland, College Park.

Ligesom sine rivaler i marken, har især Microsoft og IBM, Google fodret sin oversættelse motor med udskrifter af FN-sag, som er oversat af mennesker i seks sprog, og de af Europa-Parlamentet, som er oversat til 23. Dette råmateriale bruges til at træne til de mest almindelige sprog.

Men Google har gennemsøgt teksten til internettet, samt data fra sin bog, scanning-projektet og andre kilder, at bevæge sig ud over disse sprog. For mere obskure sprog, har det udgivet en "værktøjskasse", som hjælper brugerne med oversættelser og derefter tilføjer disse tekster til sin database.

Google tilbyder kunne sætte en bule i salget af virksomhedens oversættelses-software fra firmaer som IBM, men automatiseret oversættelse er aldrig vil sandsynligvis være en stor Moneymaker, i hvert fald ikke af de standarder af Googles annoncering forretning. Alligevel kunne Googles indsats betaler sig på flere måder.

Fordi Google-annoncer er allestedsnærværende på nettet, noget, der gør det lettere for folk at bruge internettet til gavn for virksomheden. Og det kan føre til spændende nye applikationer. I sidste uge, at selskabet sagde, at det ville bruge talegenkendelse til at generere billedtekster til engelsksprogede YouTube-videoer, som så kan oversættes til 50 andre sprog.

"Denne teknologi kan gøre den sproglige barriere gå væk," siger Franz Och, en ledende forsker ved Google, der leder virksomhedens maskinoversættelse team. "Det ville tillade nogen at kommunikere med andre."

Mr. And, en tysk forsker, som tidligere arbejdede på University of Southern California, sagde, at han oprindeligt var tilbageholdende med at slutte sig til Google, frygtede det ville behandle oversættelse som et sideprojekt. Larry Page, Google øvrige stifter, kaldet til at berolige ham.

"Han dybest set siger, at dette er noget, som er meget vigtigt for Google," Mr. And mindede for nylig. Mr. And underskrevet den i 2004 og blev hurtigt i stand til at sætte Mr. Page løfte på prøve.

Mens mange oversættelse systemer som Googles brug op til en milliard ord i teksten for at skabe en model af et sprog, Google gik meget større: et par 100 milliarder engelske ord. "De modeller bliver bedre og bedre jo mere tekst, du behandler," Mr. And sagde.

Indsatsen pote. Et år senere, Google vundet en regering-run konkurrence, der tester avancerede oversættelse systemer.

Google har brugt en lignende tilgang - enorm computerkraft, dynger af data og statistik - til at tackle andre komplekse problemer. I 2007, for eksempel det begyndte at tilbyde 800-GOOG-411, en gratis directory assistance tjeneste, der fortolker talt anmodninger. Det er tilladt Google at indsamle de stemmerne fra millioner af mennesker, så det kunne blive bedre til at genkende talt engelsk.

Et år senere, Google frigivet en søgning-by-voice system, der var lige så god som dem, der tog andre virksomheder år at bygge.

Og i slutningen af sidste år introducerede Google en tjeneste kaldet Goggles, der analyserer mobiltelefon fotos, der matcher dem til en database med mere end en milliard online-billeder, herunder billeder af gader taget for sin Street View tjeneste.

Mr. And erkendte, at Googles oversættelse systemet stadig behov for forbedring, men han sagde, at det var ved at blive bedre hurtigt. "Den nuværende kvalitetsforbedringer kurven er stadig temmelig stejl," sagde han.

Original artiklen ... (Http://www.nytimes.com/2010/03/09/technology/09translate.html?hp)

vBET
10-03-10, 18:10
God artikel:)

wowglider.de
05-07-10, 16:23
Jeg tror også det er nogle gange forbløffende hvor god oversættelse er.

newsoftw
26-08-10, 14:56
rart Mate **********... takket

vinnz21
14-09-10, 23:29
Har du indlæg, at artiklen i nogle mapper kammerat?

malasar
19-11-17, 08:38
Jeg tror også det er nogle gange forbløffende hvor god oversættelse er.

Automatic Translations (Powered by Google, Microsoft®, Yandex, SDL Language Cloud, IBM Watson and Apertium):
AfrikaansAlbanianArabicBelarusianBulgarianCatalanChineseCroatianCzechDanishDutchEnglishEstonianFilipinoFinnishFrenchGalicianGermanGreekHaitian CreoleHebrewHindiHungarianIcelandicIndonesianIrishItalianJapaneseKoreanLatvianLithuanianMacedonianMalayMalteseNorwegianPersianPolishPortugueseRomanianRussianSerbianSlovakSlovenianSpanishSwahiliSwedishTaiwaneseThaiTurkishUkrainianVietnameseWelshYiddish
Languages translations supported by vBET 4.9.99