Google govori 41 jezikov

Matej Huš

28. feb 2009 ob 10:00:56

Google postaja iz dneva v dan boljši poliglot, saj mu inženirji in lingvisti pridno dodajajo nove jezike, ki jih razume. Z zadnjim dodatkom turščine, tajščine, madžarščine, estonščine, albanščine in galicijščine podpira prevajanje med 41 jeziki v poljubni kombinaciji (torej 1640 dvojic). Google trdi, da s tem dosega materne jezike 98 odstotkov vseh uporabnikov, kar je impresivna številka. Odveč je poudariti, da Google že od lani prevaja tudi v slovenščino in iz nje, kar so podjetni nigerijski lopovi že začeli izkoriščati.

Google ni prvi niti edini ponudnik strojnih prevodov na spletu, je pa zagotovo največji, najobširnejši in najbolj znani. Že dolgo časa je naokrog Babelfish oz. riba babilonka, ki jo je prvi odkril Arthur Dent, Slovenci pa se lahko za angleško-slovenske in obratne prevode zatečemo tudi k Amebisovi rešitvi. Prevajanje med jeziki je zahteven problem, ker jeziki uporabljajo različne načine opisa sveta, tako da ni moč postaviti bijektivne preslikave ali pa prevajati besedo po besedo. Zvedavejši bralci si lahko preberajo tudi kaj o Sapir-Whorfovi hipotezi, ki sta jo postavila ameriška antropologa in predpostavlja, da jezik determinira naše dojemanje sveta in razmišljanje, in več o strojnem prevajanju.

Osnovne informacije o delovanju Google Translate v seznamu pogosto postavljenih vprašanj ponuja že sam. Ideja, ki so jo razvili, se razlikuje od načina učenja tujih jezikov ljudi in tudi prvih strojnih prevajalnikov. Namesto pomnjenja pravil, izjem in besedišča dajo Googlu prežvečiti goro besedil v tarčnem jeziku skupaj s človeškim prevodom v drug jezik. S pomočjo statističnih prijemov potem Google poskuša sestaviti čim boljši korpus s kolokacijami za prevajanje. Ideja niti ni tako nenavadna, saj se ljudje na podoben način, seveda brez prevodov, učijo maternega jezika. To je tudi razlog, da branje izboljšuje rabo jezika.

Prevodi seveda niso niti približno popolni ali primerljivi z izdelki človeških strokovnjakov, a so še vedno zelo uporabni za prvo idejo, o čem govori nek tekst v nam nerazumljivem jeziku. Tega se zaveda tudi Google, zato je ob vsakem prevodu tudi možnost Predlagajte boljši prevod. Očitno je sicer, da Googlu nekateri jeziki ležijo bolje od drugih, saj angleški I don't have any plans povsem pravilno posloveni v Nimam načrtov, medtem ko nemški Ich habe nichts vor napak prevede v Nimam nič proti. Take napake so posebej zoprne, saj je stavek semantično zgrešen, slovnično pa pravilen, tako da zlahka zavede. S kakšnimi zahtevnejšimi strukturami, denimo vrivanjem zaimkov med glagolsko osnovo in obrazilo v portugalščini Eu abraçar-te-ei (Objel te bom), pa se popolnoma zadavi in odgovori z I objemu si, hej.