המאמר נדפס חדשות מן העיתון ניו יורק טיימס.

בפגישה ב-Google בשנת 2004, בדיון פנה בהודעת דואר אלקטרוני החברה קיבלה מ מאוורר בדרום קוריאה. סרגיי ברין, ממייסדי גוגל, ניהל את המסר באמצעות שירות תרגום אוטומטי כי החברה מורשה.

ההודעה אמרה גוגל היה מנוע החיפוש המועדף, אבל התוצאה נכתב: "הנעליים פרוסות דג נא שהוא רוצה. Google בצל ירוק דבר! "

מר ברין אמר גוגל צריך להיות מסוגל לעשות יותר טוב. שש שנים לאחר מכן, גוגל חופשי שלו תרגם השירות מטפל 52 שפות, יותר מאשר כל מערכת דומה, אנשים משתמשים בו מאות מיליוני פעמים בשבוע לתרגם דפי אינטרנט וטקסטים אחרים.

"מה שאתה רואה ב-Google Translate היא מדינה של אמנות" בתרגום המחשב כי הם לא רק בתחום מסויים, אמר אלון לביא, פרופסור עמית מחקר של טכנולוגיות שפה המכון באוניברסיטת קרנגי מלון.

המאמצים של גוגל להתרחב מעבר לחיפוש באינטרנט נפגשו עם הצלחה מעורבת. פרויקט הספרים הדיגיטלי שלה כבר ניתק בבית המשפט, לבין המבוא של הרשת החברתית שלה, באז, העלה חששות לפרטיות. דפוס מציע כי זה יכול לפעמים צעד מוטעה כאשר הוא מנסה לקרוא תיגר על מוסכמות ומסורות עסקיים ותרבותיים.

אבל העלייה המהירה של גוגל בצמרת העסקית התרגום הוא תזכורת של מה יכול לקרות כאשר גוגל משחרר כוח כוח פראי שלה מחשוב על בעיות מורכבות.

רשת של מרכזי נתונים שהוא נבנה עבור חיפושים באינטרנט ניתן עתה, כאשר תקף יחד, המחשב הגדול ביותר בעולם. גוגל משתמשת במכונה כי לדחוף את גבולות על טכנולוגיית התרגום. בחודש שעבר, למשל, הוא אמר שזה עובד לשלב כלי התרגום שלה עם ניתוח התמונה, מה שמאפשר לאדם, נניח, לקחת תמונה הסלולר של תפריט בגרמנית לקבל תרגום לאנגלית מיידיות.

"תרגום מכונה הוא אחד הדוגמאות הטובות ביותר המציגה חזון אסטרטגי של גוגל", אמר טים או 'ריילי, המייסד והמנכ"ל של המו"ל הטכנולוגיה אוריילי מדיה. "זה לא משהו שמישהו אחר לוקח ברצינות רבה. אבל גוגל מבינה משהו על נתונים שאף אחד אחר לא מבין, והוא מוכן לבצע את ההשקעות הדרושות כדי להתמודד עם בעיות מסוג זה מורכב לפני השוק ".

יצירת מכונת התרגום כבר זמן רב לראות את אחד האתגרים הקשים ביותר בתחום הבינה המלאכותית. במשך עשרות שנים ניסו מדענים המחשב באמצעות גישה מבוססת כללים - ללמד את המחשב את הכללים הלשוניים של שתי השפות ולתת לו את המילונים הצורך.

אבל באמצע 1990, החוקרים החלו להעדיף גישה שנקרא סטטיסטית. הם גילו כי אם הם האכילו את המחשב או אלפי מיליוני הקטעים ותרגומים האנושי שנוצר שלהם, זה יכול ללמוד לעשות ניחושים מדויק על איך לתרגם טקסטים חדשים.

מתברר כי טכניקה זו, אשר דורש כמויות עצומות של נתונים והרבה כוחות סוס מחשוב, צודק בסמטה של גוגל.

"התשתית שלנו היא מאוד מתאימים לכך", אמר ויק גונדוטרה, סגן נשיא להנדסה בגוגל,. "אנחנו יכולים לקחת גישות שאחרים לא יכולים אפילו לחלום."

מערכות תרגום אוטומטי רחוקים מלהיות מושלמת, וגם גוגל לא ישימו מתרגמים אנושיים מובטלת בזמן הקרוב. מומחים אומרים כי קשה מאוד עבור מחשב לשבור משפט לחלקים, ואז לתרגם אותם מחדש.

אבל השירות של גוגל הוא מספיק טוב כדי להעביר את המהות של מאמר חדשותי, והוא הפך למקור מהיר תרגומים עבור מיליוני אנשים. "אם אתה צריך תרגום מחוספס-and-מוכן, זה המקום ללכת," אמר פיליפ רזניק, תרגום מכונה מומחה פרופסור לבלשנות באוניברסיטת מרילנד, קולג' פארק.

כמו יריבותיה בתחום, בעיקר מיקרוסופט ו-IBM, גוגל נמאס מנוע התרגום שלה עם תמלילי ההליכים האומות המאוחדות, אשר מתורגמים על ידי בני אדם לשש שפות, אלה של הפרלמנט האירופי, אשר מתורגמים 23. חומר גלם זה משמש הרכבת מערכות עבור השפות הנפוצות ביותר.

אבל גוגל סרקו את הטקסט של האינטרנט, כמו גם נתוני פרויקט סריקת ספרים ומקורות נוספים, לנוע אל מעבר השפות הללו. עבור שפות מעורפל יותר, כך פרסמה את "ארגז הכלים" המסייע למשתמשים עם תרגום ולאחר מכן מוסיף את הטקסטים באתר שלה.

קורבן של גוגל יכולה לשים שקע במכירות של תוכנת התרגום של החברה מחברות כמו יבמ אבל התרגום האוטומטי הוא לא צפוי להיות אווזה שמטילה ביצי זהב גדול, לפחות לא על פי אמות המידה של עסקי הפרסום של גוגל. עם זאת, המאמצים של גוגל יכול לשלם בכמה דרכים.

מכיוון שהמודעות של Google בכל מקום באינטרנט, דבר שמקל על אנשים להשתמש ביתרונות האינטרנט של החברה. וזה המערכת עלולה להוביל יישומים חדשים ומעניינים. בשבוע שעבר, החברה הודיעה כי השימוש בזיהוי דיבור כדי ליצור כיתובים בשפה האנגלית עבור קטעי וידאו, אשר יכול אז 50 יתורגם לשפות אחרות.

"טכנולוגיה זו יכולה להפוך את מחסום השפה ללכת", אמר פרנץ יופי, מדען ראשי בחברת גוגל אשר מוביל תרגום מכונה של החברה הצוות. "זה היה לאפשר לכל אחד לתקשר עם מישהו אחר."

מר יופי, חוקר גרמני אשר בעבר עבד באוניברסיטת דרום קליפורניה, אמר שהוא לא רצה בתחילה להצטרף גוגל, מחשש שזה יתייחס תרגום כפרויקט צדדי. לארי פייג', המייסד השני של גוגל, המכונה להרגיע אותו.

"הוא בעצם אמר כי זה משהו חשוב מאוד עבור גוגל", נזכר מר Och לאחרונה. מר Och שנחתם ב בשנת 2004 ועד מהרה היה מסוגל לשים את ההבטחה עמוד של מר במבחן.

בעוד מערכות תרגום רבים כמו גוגל להשתמש עד מיליארד המילים של הטקסט כדי ליצור מודל של שפה, הלך גוגל הרבה יותר: כמה 100000000000 מילים באנגלית. "המודלים הופכים יותר ויותר את הטקסט יותר את התהליך," אמר מר Och.

המאמץ השתלם. כעבור שנה, זכה בתחרות Google הממשלה להפעיל כי בדיקות מערכות תרגום מתוחכמת.

גוגל נקטה בגישה דומה - כוח מחשוב עצום, ערימות של נתונים סטטיסטיים - כדי להתמודד עם בעיות מורכבות אחרות. בשנת 2007, למשל, החלו להציע 800-GOOG-411, מדריך חינם שירות סיוע המתרגמת בקשות המדוברת. זה איפשר גוגל לאסוף את קולותיהם של מיליוני אנשים כל כך זה יכול להשתפר הכרה אנגלית מדוברת.

כעבור שנה, פרסמה גוגל מערכת החיפוש אחר הקול הזה היה טוב כמו אלה לקחו שנים חברות אחרות לבנות.

וגם בסוף השנה שעברה, הציגה גוגל שירות שנקרא משקפי מגן המנתחת תמונות הסלולר, התאמת אותם למסד נתונים של יותר ממיליארד תמונות מקוונים, כולל תמונות של רחובות נלקח השירות שלה-Street View.

מר Och הודה כי מערכת התרגום של גוגל עדיין זקוקה לשיפור, אבל הוא אמר שזה היה מקבל מהר יותר טוב. "עקומת שיפור איכות הנוכחי הוא עדיין תלול מאוד", אמר.

המאמר המקורי ...