» »

Google govori 41 jezikov

Google govori 41 jezikov

Slo-Tech - Google postaja iz dneva v dan boljši poliglot, saj mu inženirji in lingvisti pridno dodajajo nove jezike, ki jih razume. Z zadnjim dodatkom turščine, tajščine, madžarščine, estonščine, albanščine in galicijščine podpira prevajanje med 41 jeziki v poljubni kombinaciji (torej 1640 dvojic). Google trdi, da s tem dosega materne jezike 98 odstotkov vseh uporabnikov, kar je impresivna številka. Odveč je poudariti, da Google že od lani prevaja tudi v slovenščino in iz nje, kar so podjetni nigerijski lopovi že začeli izkoriščati.

Google ni prvi niti edini ponudnik strojnih prevodov na spletu, je pa zagotovo največji, najobširnejši in najbolj znani. Že dolgo časa je naokrog Babelfish oz. riba babilonka, ki jo je prvi odkril Arthur Dent, Slovenci pa se lahko za angleško-slovenske in obratne prevode zatečemo tudi k Amebisovi rešitvi. Prevajanje med jeziki je zahteven problem, ker jeziki uporabljajo različne načine opisa sveta, tako da ni moč postaviti bijektivne preslikave ali pa prevajati besedo po besedo. Zvedavejši bralci si lahko preberajo tudi kaj o Sapir-Whorfovi hipotezi, ki sta jo postavila ameriška antropologa in predpostavlja, da jezik determinira naše dojemanje sveta in razmišljanje, in več o strojnem prevajanju.

Osnovne informacije o delovanju Google Translate v seznamu pogosto postavljenih vprašanj ponuja že sam. Ideja, ki so jo razvili, se razlikuje od načina učenja tujih jezikov ljudi in tudi prvih strojnih prevajalnikov. Namesto pomnjenja pravil, izjem in besedišča dajo Googlu prežvečiti goro besedil v tarčnem jeziku skupaj s človeškim prevodom v drug jezik. S pomočjo statističnih prijemov potem Google poskuša sestaviti čim boljši korpus s kolokacijami za prevajanje. Ideja niti ni tako nenavadna, saj se ljudje na podoben način, seveda brez prevodov, učijo maternega jezika. To je tudi razlog, da branje izboljšuje rabo jezika.

Prevodi seveda niso niti približno popolni ali primerljivi z izdelki človeških strokovnjakov, a so še vedno zelo uporabni za prvo idejo, o čem govori nek tekst v nam nerazumljivem jeziku. Tega se zaveda tudi Google, zato je ob vsakem prevodu tudi možnost Predlagajte boljši prevod. Očitno je sicer, da Googlu nekateri jeziki ležijo bolje od drugih, saj angleški I don't have any plans povsem pravilno posloveni v Nimam načrtov, medtem ko nemški Ich habe nichts vor napak prevede v Nimam nič proti. Take napake so posebej zoprne, saj je stavek semantično zgrešen, slovnično pa pravilen, tako da zlahka zavede. S kakšnimi zahtevnejšimi strukturami, denimo vrivanjem zaimkov med glagolsko osnovo in obrazilo v portugalščini Eu abraçar-te-ei (Objel te bom), pa se popolnoma zadavi in odgovori z I objemu si, hej.

30 komentarjev

Poldi112 ::

Arthur Dent ni odkril Ribe babilonke, niti ni bil prvi - bil je zgolj prvi zemljan, ki je prišel v stik z njo.

Dober članek, a se nisem mogel upreti :)
Where all think alike, no one thinks very much.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.

Zgodovina sprememb…

  • spremenil: Poldi112 ()

bluefish ::

Na račun tega je seveda vse več mail prevar, v zadnjem tednu samo na ST kar tri. Moraš pa biti precej neumen, da nasedeš pol slovničnemu sporočilu.

Thomas ::

Thomas transtlator test:

SLO:"Sonce vzidi spet jutri zjutraj, potem ko boš nocoj zašlo!"
-->
ENG:"Sun vzidi again tomorrow morning, then when you went tonight!"
-->
back to SLO:"Nedelja vzidi spet jutri zjutraj, potem ko si šel danes!"

No, tole še ni lih dobr. Moral bi skleniti z začetim, potem bi bilo pa good.

Sej bo, samo vprašanje časa je.
Man muss immer generalisieren - Carl Jacobi

squngy ::

Pa si predlagal bolši prevod? :P

Utk ::

No ja, če imaš tam eno kitajščino ali švedščino in si jo prevedeš z googlom, boš razumel o čem se gre in to je čisto dovolj. Nekih bralnih užitkov pa verjetno ne boš doživel. Meni je že zdaj google translate za slovenščino čisto vredu, sigurno bo pa še boljši. Verjetno je tudi med angleščino in nemščino dosti boljši.

phong ::

Thomas:
zakaj ne prevedeš kakšnega še bolj poetičnega verza. Al pa kar kakšno arhaično Trubarjevo besedilo polno metafor. To pa bi google translate že moral razumet ;D

KuntaKinte ::

google translate največ uporabljam za kakšne egzotične jezike,tam pa za enkrat zmrzne

JurijTurnsek ::

Thomas transtlator test:

SLO:"Sonce vzidi spet jutri zjutraj, potem ko boš nocoj zašlo!"
-->
ENG:"Sun vzidi again tomorrow morning, then when you went tonight!"
-->
back to SLO:"Nedelja vzidi spet jutri zjutraj, potem ko si šel danes!"

No, tole še ni lih dobr. Moral bi skleniti z začetim, potem bi bilo pa good.

Sej bo, samo vprašanje časa je.


Vsak prevajalec ti bo povedal, da je v primeru, da prevedeni stavek lahko popolnoma natančno prevedeš v izvirnik, prevod slab, npr. dobeseden. Strojno prevajanja ne bo doseglo človeškega, ker trenutno deluje po omejen številu metod. Če pa komu uspe sestaviti seznam vseh dejavnikov (teh je orgomno), na katere smo prevajalci pozorni ko prevajamo, napiše algoritme in nato vsak dan posodablja definicije iz ostale podatke v bazi, pa bi to morda bilo mogoče. Ampak v to bi šlo toliko dela, da bi lahko prav vse prevajalce, ki bi ob tem bili ob službo, preusmerili v posodabljanje teh baz.

Verjetno pa tudi to ne bi bilo mogoče, saj 100% pravilen prevod ni mogoč in zato lahko enako besedilo različno prevede mnogo prevajalcev z minimalnimi odstopanji v pomenu.
http://www.slatnaskejta.com

Thomas ::

100% prevod je težaven tako za stroj, kot za človeka.

Saj tisti znameniti "since the police had no water tight case" --> "ker policija ni imela vodotesne skrinje" ni prevedel Google, ampak mesen prevajalec.

Je pa samo vprašanje časa, kdaj bo Google boljši od vseh človeških velemojstrov prevajanja.
Man muss immer generalisieren - Carl Jacobi

squngy ::

Nikoli, ker če bo googel napredoval, bo to zato ker ga bodo dopolnjevali "vsi človeški velemojstri prevajanja"

Utk ::

Več glav več ve. Prevaja pa samo ena.

Thomas ::

Ja ... več glav polni Google kot katerokoli glavo človeškega prevajalca.

Tako, da je samo vprašanje časa.
Man muss immer generalisieren - Carl Jacobi

squngy ::

Kar pomeni, da bo google lahko postal bolši od vsakega prevajalca, ne pa vseh :P

Gandalfar ::

Kar pomeni, da bo google lahko postal bolši od vsakega prevajalca, ne pa vseh :P


Ni potrebno, vazno da je "good enough"

Utk ::

Kar pomeni, da bo google lahko postal bolši od vsakega prevajalca, ne pa vseh :P

"Vsi" prevajalci se bojo lahko primerjali z googlom, ko jih boš ti "vse" zbral na kupo. To pa ne bo nikdar. Vse na kup lahko zbere samo google.
Drugač pa v tej novici piše, da se google tega ni lotil na klasičen način, s pravili itd, ampak z umetno inteligenco. Kratkoročno bi bila pravila bolj uspešna, na dolgi rok pa sigurno ne. Čez 10 let bomo lahko samo gledali in se čudili...no, jaz se ne bom, nekateri prevajalci se bojo.

Zgodovina sprememb…

  • spremenil: Utk ()

squngy ::

Lol, od kadaj so uporabniki s predlogi umetna inteligenca :D

Btw. google, dobi svoje začetne prevode ravno s pravili. Razlika je v temu, da naj bi pravila sam ugotovil iz veliko tekstov in njihovimi prevodi.

"ko jih boš ti "vse" zbral na kup" ampak če bi pa jih... Sicer pa jih ne rabim, samo wikipage jim naredim in zrihtam skype.
Google je pa zastonj in instantno hiter, zato je tako ali tako v svoji ligi.

Edit. (brez kakeršne koli veze z mojim ali katerim koli drugim postom): Sem se malo igral s tem prevajalcem in zgleda ima še nekaj problemov s skloni in množino:
-my cars -> moj avtomobilov
-I stopped my cars. -> Nehal sem moje avtomobile.
-I sued my neighbor. -> I toži moj sosed.

Zgodovina sprememb…

  • spremenil: squngy ()

Atos ::

od kadaj so uporabniki s predlogi umetna inteligenca

Razlika je v temu, da naj bi pravila sam ugotovil iz veliko tekstov in njihovimi prevodi.

Tu si si kr sam odgovoril. Umetna inteligenca nujno potrebuje input (userjev ali kogarkoli oz. česarkoli že), ker se od teh nauči kaj je prav in kaj narobe. Bolje rečeno, se nauči, da to kar ni bilo prav naslednjič popravi in celo izboljša.

Kar pomeni, da bo google lahko postal bolši od vsakega prevajalca, ne pa vseh :P

Če stvar (katerakoli) deluje na princupu umetne inteligence je edino vprašanje, če je skupen compjuting power umetne inteligence večji kot skupni compjuting power ljudi (v tem primeru prevajalcev). In tu si upam rečti, da je. Drugo je nepomembno, ker bo v prvem primeru UI prej ali slej prehitel ljudi.

roli ::

Edit. (brez kakeršne koli veze z mojim ali katerim koli drugim postom): Sem se malo igral s tem prevajalcem in zgleda ima še nekaj problemov s skloni in množino:
-my cars -> moj avtomobilov
-I stopped my cars. -> Nehal sem moje avtomobile.
-I sued my neighbor. -> I toži moj sosed.


Tole pa naredi presis:
my cars -> moji avti
I stopped my cars -> Ustavil sem svoje avte
I sued my neighbor -> Tožil sem svojega soseda

Torej gre presisu malenkost bolje kot googlu. Sicer pa sam večinoma uporabljam presis če res rabim kak prevod pa mi ni jasno kaj bi bil. Za druge jezike pa google in prevajanje v angleščino.
http://www.r00li.com

Utk ::

squngy pač ne ve kaj je umetna inteligenca. Prav to, da pravila sam ugotovi iz tekstov je inteligenca. Enako se uči tudi človek. Nekaj se nauči tudi iz pravopisa in ne vem česa vse, to daš lahko tudi googlu not, ampak to ni dost. Človek mora obdelat dosti primerov, šele potem zna prevajat. In google bo slej ko prej obdelal več primerov kot jih je sposobno obdelat milijon prevajalcev. Ko bo še dost močan, da bo lahko na hitro dost dobro preanaliziral besedilo, bo tudi zelo dobro prevajal. Tu kaj dost dela več ni, je večina že narjenega, samo dost inputa in dosti moči ali časa mu moraš dat. In če pogledate zadnji Nedeljski, je oglas googla nekaj v zvezi s knjigami, ki jih bojo preskenirali. Ko dajo not vse knjige, in njihove prevode...samo vprašanje časa.

Jst ::

Me prav zanima obdobje, če/ko bo google* ugotovil kakšna radikalna pravila, ki bodo veljala za 99% jezikov, kakšne smešne razloge bo dajala opozicija "da je v primeru računalniških prevodov to sicer res, ampak da ne velja za človeškega prevajalca..." Takrat bodo padale še zadnje domine.

*google or alike
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

Utk ::

No, če ne bomo v nekem doglednem času videli na tv-ju avtomatsko generiranih podnapisov, potem smo ga najebali. Ker pomeni, da ne moremo naredit niti tega kar vemo, da je možno. Kako bomo potem šele nardili stvari, ki jih rabimo, pa zaenkrat ne vemo, če so možne.

JurijTurnsek ::

Ja ... več glav polni Google kot katerokoli glavo človeškega prevajalca.

Tako, da je samo vprašanje časa.


Več glav več ve, to je jasno. Vendar pa polnijo računalnik, ki mu je vse potrebno razložiti na najbolj neumen način. Trenutno sem 4. letnik študija prevajalstva angleščine in računalništva in imam veliko stika z obem področjema. Poznam veliko teorij, ki skušajo razložiti kateri vsi dejavniki vplivajo na to, kako bomo nekaj prevedli in kako bi lahko najboljšo teorijo sploh implementirali, če se prevodoslovci o tem ne bodo nikoli strinjali.

Poleg tega pa se vprašajte koliko predlogov bodo v Google dodali šolani prevajalci z leti izkušenj in koliko vandali. Dobro namernih ljudi pa je vsak dan manj, saj tudi bolj pomembni projekti, kot je Wikipedija ne rastejo več eksponentno.
http://www.slatnaskejta.com

Utk ::


Poleg tega pa se vprašajte koliko predlogov bodo v Google dodali šolani prevajalci z leti izkušenj in koliko vandali. Dobro namernih ljudi pa je vsak dan manj, saj tudi bolj pomembni projekti, kot je Wikipedija ne rastejo več eksponentno.

Not bomo dali "vse" prevedene knjige in članke. No, čim več. To bo naredil že google s svojim skeniranjem knjig. V bistvu to že dela. Imajo ogromno poskeniranih knjig, ki jih seveda ne morejo kar objavit, jih pa lahko uporabljajo za to.
Katera "teorija se bo implementirala" se bo odločla umetna inteligenca. Prevajalci v tem ne sodelujejo drugače kot s tem, da prevajajo knjige. No, trenutno google ne dela čisto tako. Še zmeraj je dosti ročnih posegov v njegova pravila. Ko teh več ne bo, bojo prevodi tako dobri, da jih ljudje več enostavno ne bojo znali izboljšat z novimi pravili. Potem bo minilo še malo časa, in ne bojo več niti opazili, da je treba še kaj izboljšat.
Seveda se bo pa še zmeraj našla skupina prevajalcev, ki bo trdila, da bi oni to prevedli drugače, seveda "boljše"...dokler jim ne bo nekdo podtaknil njigovega prevoda izpred nekaj let, ki se ga ne bojo več spomnili:)

Zgodovina sprememb…

  • spremenil: Utk ()

squngy ::

@CrniE
Pomojem si ti malo narobe predstavljaš kaj dela google.

"It does not apply grammatical rules, since its algorithms are based on statistical analysis rather than traditional rule-based analysis."

Google translate se NE uči slovničnih pravil. On samo zbira vzorce stavkov in jih veže med različnimi jeziki.

(btw. če ti remu praviš inteligenca je to tvoj problem)

JurijTurnsek ::


Poleg tega pa se vprašajte koliko predlogov bodo v Google dodali šolani prevajalci z leti izkušenj in koliko vandali. Dobro namernih ljudi pa je vsak dan manj, saj tudi bolj pomembni projekti, kot je Wikipedija ne rastejo več eksponentno.

Not bomo dali "vse" prevedene knjige in članke. No, čim več. To bo naredil že google s svojim skeniranjem knjig. V bistvu to že dela. Imajo ogromno poskeniranih knjig, ki jih seveda ne morejo kar objavit, jih pa lahko uporabljajo za to.
Katera "teorija se bo implementirala" se bo odločla umetna inteligenca. Prevajalci v tem ne sodelujejo drugače kot s tem, da prevajajo knjige. No, trenutno google ne dela čisto tako. Še zmeraj je dosti ročnih posegov v njegova pravila. Ko teh več ne bo, bojo prevodi tako dobri, da jih ljudje več enostavno ne bojo znali izboljšat z novimi pravili. Potem bo minilo še malo časa, in ne bojo več niti opazili, da je treba še kaj izboljšat.
Seveda se bo pa še zmeraj našla skupina prevajalcev, ki bo trdila, da bi oni to prevedli drugače, seveda "boljše"...dokler jim ne bo nekdo podtaknil njigovega prevoda izpred nekaj let, ki se ga ne bojo več spomnili:)


Na splošno se strinjam, vendar je prevod knjige segmentacijsko nemogoče združiti z izvirnikom, poleg tega pa imajo taki prevodi popolnoma drugačne parametre kot večina drugih prevodov - torej je znanje, ki ga od tam pridobi reačunalnik, skoraj nezdružljivo z zahtevami drugih besedil.

Povej kaj konkretnega oz. dokaži, da veš o čem govoriš - prevajanje ni neko enostavno prepisovanje, tudi če se tako zdi.
http://www.slatnaskejta.com

Utk ::

@CrniE
Pomojem si ti malo narobe predstavljaš kaj dela google.

"It does not apply grammatical rules, since its algorithms are based on statistical analysis rather than traditional rule-based analysis."

Google translate se NE uči slovničnih pravil. On samo zbira vzorce stavkov in jih veže med različnimi jeziki.

(btw. če ti remu praviš inteligenca je to tvoj problem)

Kdo je reku, da se uči slovničnih pravil? To je učenje iz pravopisa, slovarja, ali kako že temu rečejo lingvisti, tudi to je verjeto vstavljeno v google, ampak to ni vse, kot tudi ti samo iz tega ne bi znal kaj dost prevest. On se uči, kot si napisal, iz vzorcev stavkov. To so tudi pravila. Google z umetno inteligenco išče pravila med prevodi med dvema jezikoma (dvema, in nič več), ki njemu nekaj pomenijo, človeškemu prevajalcu pa prav nič. Vsaj misli tako. Umetna inteligenca najde pravila, za katera noben prevajalec ne bi dal roke v ogenj, da držijo. Točno to je inteligenca. Temu ne jaz tako pravim, temu se tako reče. In v resnici to je inteligenca. Če jaz tebi pokažem sliko tvoje matere, in ženske, ki ji je čisto podobna, ti boš vedel katera je tvoja mama, tudi če ne boš znal tega z besedami opisat, po katerih pravilih si prišel do tega. Ker si inteligenten. Program zna poiskat pravila, po katerih bo ločil tvojo mater od neke podobne ženske, in bo znal opisat ta pravila, čeprav bojo tebi, ko boš pogledal ta pravila, popolnoma nelogična. Ampak vseeno držijo. Temu se reče umetna inteligenca, nič drugega. In to ni moja definicija, ampak tako je. Tudi ti po zelo podobnih pravilih prideš do zaključka na kateri sliki je tvoja mama, samo da se tega ne zavedaš.
V UI ni nobene magije, samo pravila. Tudi če nam niso najbolj logična. Bistveno pri UI je pa to, da pride sama do pravil, ne pa da jih not dodaja prevajalec. Zaenkrat jih dodajajo še tudi ročno, ampak slej ko prej to ne bo več potrebno.
Sicer je pa zelo žalostno, da človek, ki ima diplomo iz česarkoli, ne ve niti osnovnih principov učenja. Človeškega učenja, kaj šele strojnega.

Zgodovina sprememb…

  • spremenil: Utk ()

squngy ::

No zelo rad bi končno videl nek link, do vira ki mu tako zaupaš in ti trdi da ima google AI. Še posebaj ker ti zgoraj točno piše, da google uporablja statistiko. (če pravila jezika niso napisana v pravopisu, še ne pomeni, da niso slovnična pravila)

Drugače sem, preden sem prejšni post napisal, že dvakrat začel pisati razlago AI pa sem se premislil. Raje sam poglej kak ZNANSTVENI članek o tem.
Po pravici povedano zelo dvomim, da GT uporablja kak odločitveni model (še toliko bolj če izhaja iz statistik), kaj šele pravo umetno inteligenco...

smash ::

AI so pravila...tako kot so pravila za vsako stvar v tvoji glavi

_Enterprise_ ::

Ko bo strojno prevajanje dovolj razvito, da bo popolnoma razumelo pomen samo enega jezika, bomo dobili AI, naprednejšo od človeka. Ne rabimo nobenih supreračunalnikov. Tko da tale Google translate ni za spregledat.

Azrael ::

Le kaj bo naslednja stopnjn,ko bodo tu prišli do konca, mogoče nekaj podobnega Skype, ki bo prevajalo on the fly?

O kreganju, tega stroj ne bo zmogel...
Pa še ena dobra razprava na S-T: Česa računalnik ne bo nikoli mogel, kar človek pa lahko?
Nekoč je bil Slo-tech.

Zgodovina sprememb…

  • zavarovalo slike: gzibret ()


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Google Translate se je naučil spolskosti jezikov (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
5412614 (8971) jype
»

Človeški jezik (strani: 1 2 )

Oddelek: Znanost in tehnologija
7317219 (13534) kuall
»

Google razvija ribo babilonko

Oddelek: Novice / Apple iPhone/iPad/iPod
2611219 (9852) Jst
»

Google govori 41 jezikov

Oddelek: Novice / Omrežja / internet
306231 (4951) Azrael
»

Računalnik-prevajalec (strani: 1 2 )

Oddelek: Znanost in tehnologija
717877 (7174) Tear_DR0P

Več podobnih tem