Nalazite se
Članak
Objavljeno: 29.04.2012. 10:57

Google Translate 

Franz Och: Google dnevno prevede milijun knjiga

Znanstvenik Googlea prisjeća se razvoja automatskog strojnog prevođenja.

Franz Och: Google dnevno prevede milijun knjiga

Franz Jozef Och, njemački znanstvenik u Google Research, koji zadnjih 6 godina razvija automatsko prevođenje (Google Translate), na službenom Googleovom blogu piše o zanimljivostima vezanim uz razvoj čuvenog prevoditelja koji zasigurno često koristite, a ukoliko imate potrebu prevođenja tekstova s nekih egzotičnih jezika, bez njega gotovo ne možete živjeti.

Čak i ako se susrećete sa smiješnim Googleovim prijevodima spam mailova u kojima vas netko informira da ste osvojili milijun dolara, ne možete poreći da je Google Translate izvrstan alat, koji doduše ne može zamijeniti "živog" prevoditelja, ali nam uvelike olakšava pristup informacijama iz čitavog svijeta.

 Razvoj weba je doveo kolektivno znanje pod prste milijardi ljudi. Uz običan vrlo kratki upit u tražilicu, možete pristupiti web stranicama na serverima koji su tisućama kilometara udaljeni u drugim zemljama, ili pročitati poruku nekog s druge strane svijeta.

No što se dešava ukoliko je ta osoba Hindu, Afrikanac ili Islanđan, a vi govorite samo engleski, ili obrnuto?

Još 2001. godine Google je pokrenuo servis koji je mogao prevoditi 8 jezika na engleski i obrnuto. Koristio je tada najinovativniju komercijalnu strojnu translaciju (MT), no kvaliteta prijevoda nije bile previše dobra i ništa se nije poboljšavalo prvih nekoliko godina.

No 2003. godine, nekoliko Googleovih inženjera je odlučilo podići kvalitetu prevođenja, kao i prevođenje većeg broja jezika. Tada sam se i ja uključio. Radio sam kao znanstvenik na projektima DARPA-e (američke znanstvene vojne agencije) i razvijao novi pristup strojnom prevođenju, koje "uči" iz podataka, što je obećavalo znatno kvalitetnije prevođenje.

Jednog sam dana dobio poziv Googleovih ljudi koji su me uvjerili (naime ja sam bio skeptičan), da takav pristup baziran na podacima može funkcionirati na razini Googlea.

Pridružio sam se Googleu i započeli smo s potpunim preoblikovanjem sustava prevođenja. Googleova masivna računalna infrastruktura i sposobnost "drobljenja" velike količine setova web podataka doveli su do velikih rezultata.

To je bila točka prekretnica. Otkrila nam je koliko efikasan može biti pristup baziran na podacima.

No u to vrijeme naš sustav je bio prespor da bi se koristio kao praktičan servis. Trebalo nam je 40 sati i 1.000 računala da bi preveli 1.000 rečenica. Stoga smo se fokusirali na brzinu, pa je godinu kasnije sustav mogao prevesti rečenicu za manje od sekunde i to u znatno boljoj kvaliteti.

U ranoj 2006. smo pokrenuli prve jezike, najprije kineski, a potom arapski, te smo naš statistički MT pristup predstavili u travnju, a sljedećih 6 godina smo se fokusirali na kvalitetu prijevoda i pokrivenost jezicima.

Danas možemo prevoditi između 64 različita jezika, uključujući neke koji su vrlo slabo prisutni na webu, poput bengalskog, baskijskog, svahilija, jidiša, pa čak i esperanta.

Danas imamo više od 200 milijuna mjesečnih aktivnih korisnika na translate.google.com (pa čak i na drugim mjestima na kojima možete koristiti naše prevođenje, poput Chromea, mobilnih aplikacija, YouTubea, itd).

Ljudi sve više pristupaju Google Translateu u pokretu (jezična barijera je uvijek najveća prepreka kad putujete), pa smo primijetili kako se naš mobilni promet svake godine učetverostručuje, a naši korisnici su doista globalni. Više od 92 posto prometa dolazi izvan SAD-a.

Svakog dana prevodimo otprilike toliko teksta koliko možete pronaći u milijunu knjiga. Ako to kažem na drugi način, sve što svi profesionalni prevoditelji prevedu u čitavoj godini, naš sustav prevede u jednom danu.

Stoga mogu slobodno reći da je najveći dio prijevoda na našem planetu odradio Google Translate (ne možemo govoriti o galaksiji, jer nas je tamo Douglas Adamsova “Babel ribica" najvjerojatnije nadmašila).

Naravno, što se tiče preciznih prijevoda, ništa ne može pobijediti ljudske prevoditelje. Mi vjerujemo kako strojno prevođenje potiče ljude da više govore svojim jezicima, te da čim više sudjeluju u globalnim konverzacijama, a stručnjaci za prevođenje su sada važniji nego ikada prije.

Mi zamišljamo budućnost u kojoj svatko na svijetu može koristiti i dijeliti svaku informaciju, bez obzira na kojem jeziku bila ili gdje se pojavila.

Želimo srušiti jezičnu barijeru gdje god se ispriječi između ljudi, te ne možemo dočekati da vidimo što će nam donijeti idućih 6 godina.

Piše: Franz Och, Distinguished Research Scientist, Google Translate

Vezani sadržaji
Komentari

Učitavam komentare ...

Učitavam













       

*/-->