PDA

View Full Version: Googles datakraft foredler Translation Tool



brubros
09-03-10, 18:43
Nyhetsartikkel gjengitt fra The New York Times.

I et møte hos Google i 2004, snudde diskusjonen til en e-postmelding selskapet hadde mottatt fra en fan i Sør-Korea. Sergey Brin, en Google-grunnlegger, løp budskapet gjennom en automatisk oversettelse tjeneste som selskapet hadde lisens for.

Meldingen sa at Google var en favoritt søkemotor, men resultatet lyde: "skiver rå fisk sko den ønsker. Google grønn løk thing! "

Mr. Brin sa Google burde kunne gjøre bedre. Seks år senere, håndterer sin gratis Google Translate tjeneste 52 språk, mer enn noen lignende system, og folk bruker det hundrevis av millioner av ganger i uken for å oversette websider og annen tekst.

"Hva du ser på Google Translate er state of the art" i datamaskinen oversettelser som ikke er begrenset til et bestemt fagområde, sier Alon Lavie, førsteamanuensis forskning professor i Language Technologies Institute ved Carnegie Mellon University.

Googles forsøk på å ekspandere utover søke på nettet har møtt med blandet suksess. Den digitale bøker prosjektet har vært hengt opp i retten, og innføring av sitt sosiale nettverk, Buzz, oppvokst privatliv frykt. Mønsteret tyder på at det noen ganger kan feilsteg når den prøver å utfordre virksomheten tradisjoner og kulturelle konvensjoner.

Men Google er raskt stige til øverste lag av oversettelsen virksomheten er en påminnelse om hva som kan skje når Google slipper løs sin brute-force datakraft på komplekse problemer.

Nettverket av datasentre at det bygges for websøk kan nå være, når surret sammen, verdens største datamaskin. Google bruker denne maskinen til å presse grensene på oversettelse teknologi. Sist måned, for eksempel, sa det var det med å kombinere sin oversettelse verktøy med bildeanalyse, slik at en person til, si, ta en mobiltelefon bilde av en meny i tysk og få en umiddelbar engelsk oversettelse.

"Machine oversettelse er en av de beste eksemplene som viser Google strategiske visjon," sier Tim O'Reilly, grunnlegger og administrerende direktør av teknologien forlaget O'Reilly Media. "Det er ikke noe som noen andre tar svært alvorlig. Men Google forstår noe om data som ingen andre forstår, og det er villig til å gjøre de investeringer som er nødvendig for å takle slike komplekse problemer i forkant av markedet. "

Opprette en oversettelse maskin har lenge vært sett på som en av de tøffeste utfordringene innen kunstig intelligens. I flere tiår prøvd dataforskere hjelp av en regelbasert tilnærming - undervisning datamaskinen den språklige regler av to språk og gi den nødvendig ordbøker.

Men på midten av 1990-tallet begynte forskere favoriserer en såkalt statistisk tilnærming. De fant ut at hvis de fôres datamaskinen tusener eller millioner av passasjer og deres menneske-genererte oversettelser, kan det lære å lage nøyaktige gjetninger om hvordan å oversette nye tekster.

Det viser seg at denne teknikken, som krever store mengder data og massevis av databehandling hestekrefter, er rett opp Googles smug.

"Vår infrastruktur er svært godt egnet til dette," Vic Gundotra, en visepresident for engineering på Google, sa. "Vi kan ta tilnærminger som andre ikke engang kan drømme om."

Automatisk oversettelse systemer er langt fra perfekt, og selv Googles vil ikke sette menneskelige oversettere ut av en jobb når som helst snart. Eksperter sier det er svært vanskelig for en datamaskin å bryte en setning i deler, så oversette og montere dem.

Men Googles tjeneste er god nok til å formidle essensen av en nyhetsartikkel, og det har blitt en rask kilde for oversettelser for millioner av mennesker. "Hvis du trenger en rough-and-klar oversettelse, er det stedet å gå," sier Philip Resnik, en maskin oversettelse ekspert og førsteamanuensis i lingvistikk ved University of Maryland, College Park.

Som sine rivaler i feltet, har særlig Microsoft og IBM, Google matet sin oversettelse motor med transkripsjoner av FN-forhandlingene, som er oversatt av mennesker inn i seks språk, og de av Europaparlamentet, som er oversatt til 23. Dette råstoffet blir brukt til å trene systemer for de vanligste språkene.

Men Google har avfettet teksten av nettet, samt data fra sin bok skanning prosjekt og andre kilder, til å gå utover disse språkene. For mer obskure språk, har det gitt ut en "verktøykasse" som hjelper brukerne med oversettelser og deretter legger disse tekstene til sin database.

Googles tilbud kan sette en bulk i salget av bedriftens oversettelse programvare fra selskaper som IBM Men automatisert oversettelse er aldri trolig bli en stor Moneymaker, i hvert fall ikke av standarden på Googles annonsering virksomhet. Likevel kan Google innsats betale seg på flere måter.

Fordi Googles annonser er allestedsnærværende online, noe som gjør det enklere for folk å bruke nettet fordelene selskapet. Og systemet kan føre til interessante nye applikasjoner. Forrige uke, sier selskapet at det ville bruke talegjenkjenning til å generere bildetekster for engelskspråklig YouTube-videoer, som kan da bli oversatt til 50 andre språk.

"Denne teknologien kan gjøre språkbarrieren gå bort", sier Franz Och, en rektor forsker ved Google som leder selskapets machine translation team. "Det ville tillate noen å kommunisere med noen andre."

Mr. Och, en tysk forsker som tidligere jobbet ved University of Southern California, sa han var i utgangspunktet motvillig til å bli med Google, fryktet det ville behandle oversettelse som et sideprosjekt. Larry Page, Googles andre grunnlegger, kalt til å berolige ham.

"Han i utgangspunktet sagt at dette er noe som er svært viktig for Google," Mr. Och tilbakekalt nylig. Mr. Och signert i 2004 og var snart i stand til å sette Mr. Page løfte på prøve.

Mens mange oversettelse systemer som Googles bruk opp til en milliard ord tekst for å lage en modell av et språk, gikk Google mye større: noen få hundre milliarder engelske ord. "Modellene blir bedre og bedre jo mer tekst du prosessen," Mr. Och sa.

Innsatsen betalte seg. Et år senere vant Google en statlig konkurranse som tester sofistikerte oversettelse systemer.

Google har brukt en lignende tilnærming - enorm datakraft, hauger av data og statistikk - for å takle andre komplekse problemer. I 2007 for eksempel, begynte det å tilby 800-GOOG-411, en gratis katalog assistanse tjeneste som tolker snakket forespørsler. Det tillates Google å samle stemmene til millioner av mennesker, så det kan bli bedre på å gjenkjenne snakket engelsk.

Et år senere, ga Google et søk-by-voice system som var like gode som de som tok andre selskaper år å bygge.

Og sent i fjor, introduserte Google en tjeneste som heter Goggles som analyserer cellphone bilder, matchende dem til en database med mer enn en milliard bilder på nettet, inkludert bilder av gater tatt for sin Street View-tjeneste.

Mr. Och erkjente at Googles oversettelse system fortsatt er behov for forbedring, men han sa det ble bedre raskt. "Den nåværende kvalitetsforbedring kurven er fortsatt ganske bratt," sa han.

Original artikkelen ... (Http://www.nytimes.com/2010/03/09/technology/09translate.html?hp)

vBET
10-03-10, 18:10
God artikkel:)

wowglider.de
05-07-10, 16:23
Jeg synes også det er noen ganger utrolig hvor god oversettelse er.

newsoftw
26-08-10, 14:56
fin mate **********... takket

vinnz21
14-09-10, 23:29
Visste du innlegg som artikkelen i noen kataloger kompis?

malasar
19-11-17, 08:38
Jeg synes også det er noen ganger utrolig hvor god oversettelse er.

Automatic Translations (Powered by Google, Microsoft®, Yandex, SDL Language Cloud, IBM Watson and Apertium):
AfrikaansAlbanianArabicBelarusianBulgarianCatalanChineseCroatianCzechDanishDutchEnglishEstonianFilipinoFinnishFrenchGalicianGermanGreekHaitian CreoleHebrewHindiHungarianIcelandicIndonesianIrishItalianJapaneseKoreanLatvianLithuanianMacedonianMalayMalteseNorwegianPersianPolishPortugueseRomanianRussianSerbianSlovakSlovenianSpanishSwahiliSwedishTaiwaneseThaiTurkishUkrainianVietnameseWelshYiddish
Translations by vB Enterprise Translator 4.10.1