»

Vsi jeziki zmorejo 39 bitov na sekundo

Hitrost govora (SR) in informacijska gostota (ID) sta lepo korelirani

Slo-Tech - V stereotipih je zasidrano dejstvo, da Italijani govorijo hitro, medtem ko so Nemci počasnejši govorci. Italijani uspejo v sekundo stlačiti do devet zlogov, Nemci pa se običajno zadovoljivo s petimi do šestimi. Toda to ne pomeni, da Italijani v časovni enoti povedo več informacij. Raziskava, ki so jo opravili na sedemnajstih jezikih iz devetih jezikovnih družin, kaže, da so jeziki po celem svetu presenetljivo konstantni v hitrosti prenosa informacij. Večinoma pri običajnem govoru informacije predajamo s hitrostjo 39 bitov na...

40 komentarjev

Google Translate podpira slovenščino tudi na fotografijah

Android Central - Google je izdal novo verzijo aplikacije za prevajanje Google Translate, ki prinaša številne novosti. Med njimi je tudi podpora za več kot 60 jezikov (skupno jih je sedaj 88), kjer deluje prevajanje s kamero. S kamero na telefonu lahko namreč preprosto fotografiramo nek napis, Google Translate pa bo optično prepoznal besedilo in ga prevedel. Odslej je to možno tudi za slovenščino. Prav tako je možno kot ciljni jezik izbrati katerikoli, medtem ko je bila doslej to le angleščina. Izvorni jezik pa aplikacija po novem prepozna sama.

Izboljšana je tudi kakovost prevodov. Googlov trdi, da je zaradi uporabe nevronskih mrež (Neural Machine Translation) količina napak nižja za 85 odstotkov. S tem se kakovost prevodov v aplikaciji približuje tistim v Google Lens in spletni verziji...

3 komentarji

Google Translate se je naučil spolskosti jezikov

Slo-Tech - Eden največjih problemov pri prevajanju besedil je različna količina informacij, ki je vgrajena v posamezne besede v različnih jezikih. Ko prevajamo iz jezika, kjer ima beseda ali stavek več informacij, kot jih potrebuje ciljni jezik, lahko informacijo preprosto izpustimo, če ni pomembna in običajna. Teže pa je v obratni smeri, ko ciljni jezik terja informacijo, ki je v izvirniku nimamo. Včasih jo poznamo iz konteksta, pri kratkih odlomkih, posameznih stavkih ali besedah, pa tega ne vemo.

Primerov je več. Medtem ko ima slovenščina splošen izraz za babico, v švedščini enotne besede ni. Obstaja babica po očetovi strani (farmor) in po materini (mormor). Prevajalec se mora odločiti, katero bo uporabil. Včasih informacijo zahteva že sam ustroj jezika -...

54 komentarjev

Microsoftova umetna inteligenca prevaja kitajščino kot ljudje

Slo-Tech - Razvoj strojnega prevajanja je že dolga leta v središču pozornosti znanstvenikov, ki se ukvarjajo z umetno inteligenco, in v zadnjem letu so rezultati resnično osupljivi. Microsoft pa sedaj trdi, da so uspeli razviti sistem za prevajanje iz kitajščine, katerega rezultati so tako dobri kot pri človeškem prevajalcu. Na osnovnem korpusu besedil newstest2017 je rezultat enako kakovosten, kot če bi prevajal človek, so ocenili neodvisni strokovnjaki.

Xuedong Huang, ki je pri Microsoftu zadolžen za področje jezika in prevajanja, pravi, da gre za pomemben mejnik pri analizi človeškega jezika. Dodaja, da je bil to vseskozi cilj in sanje celotne ekipe, niso pa si mislili, da ga bodo tako hitro dosegli. Ming Zhou iz Microsoft Research Asia ob tem opozarja, da jim je to uspelo...

75 komentarjev

Simulacije pokazale, zakaj so veliki jeziki obširnejši in preprostejši

Slo-Tech - Angleščina je težka, angleška slovnica pa ni. Besedišče v angleškem jeziku je eno najbolj razgibanih in med največjimi na svetu, medtem ko so stavčne strukture v povprečju preproste. Na drugi strani so jeziki, kamor sodi tudi slovenščina, ki nimajo tako obširnega besedišča, a imajo zelo zapleteno slovnico s številnimi pregibnimi vrstami. Zdi se, da so jeziki z velikim številom govorcev kompleksni v besedišču in preprosti v slovnici (angleščina,...

43 komentarjev

Google Translate razume več kot sto jezikov in 99 odstotkov ljudi

Slo-Tech - Morda je strojno prevajanje res še neprimerljivo s človeškim, a če imamo pred seboj tekst v kitajščini, je tudi Google Translate precej boljši kot nič. In v desetih letih obstoja se je od začetne ruščine, kitajščine in arabščine naučil že več kot sto jezikov, če upoštevamo zadnje novosti. Google Translate se je namreč naučil še 13 jezikov, tako da sedaj razume bolj ali manj uspešno že 103 jezike, med katerimi je seveda že vrsto let tudi slovenščina.

Google po novem razume tudi amharščino, korzijščino, frizijščino, kirgiščino, havajščino, kurdščino, luksemburščino,...

20 komentarjev

Skype posluša in govori že šest jezikov

Microsoft - Microsoftov Skype postaja pravi poliglot, saj se je naučil tekoče poslušati še dva jezika, so sporočili iz Microsofta. Sedaj razume tudi nemško in francosko, že na začetku je znal angleško in špansko, vmes pa so ga naučili tudi italijansko in kitajsko (mandarinščino). To pomeni, da lahko Skype Translator sedaj razume govorjeno besedo približno 30 odstotkov vseh ljudi, kar je osupljiva številka.

Poleg šestih jezikov, ki jih razume v govorjeni obliki, Skype razume 50 jezikov v pisani obliki, med njimi tudi slovensko. Prepoznavanje govora in prevajanje potekata v Microsoftovih strežnikih, zato morajo uporabniki soglašati s snemanjem pogovora in pošiljanjem v Microsoft. Tam se posnetki tudi shranijo, a zgolj z namenom izboljšanja...

8 komentarjev

Jezik vpliva na varčevanje, ukvarjanje s športom, kajenje

Slo-Tech - Zamisel, da materni jezik v veliki meri vpliva na naše dojemanje sveta in posledično ravnanje v njem, ni nova. Že Wittgenstein je namreč leta 1921 v svojem Logično-filozofskem traktatu zapisal Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt (Meje mojega jezika so meje mojega sveta) in na koncu izpeljal Wovon man nicht sprechen kann, darüber muss man schweigen (O čemer človek ne more govoriti, o tem mora molčati). Utemeljitelj jezikoslovnega strukturalizma in semiotike Ferdinand de Saussure je leta 1916 to povedal nekoliko drugače, in sicer Si les mots tenus pour des concepts préexistants eux auraient des équivalents exacts dans la signification d'une langue au prochain et ce n'est pas aussi (Če bi besede opisovale predhodno obstoječe pojme,...

43 komentarjev

Facebook preizkuša avtomatično prevajanje komentarjev

ZDNet - Najbolj razširjena in uporabna spletna storitev za prevajanje med različnimi jeziki je gotovo Google Translate, ki dokazuje, da se strojni prevodi po kakovosti vsaj počasi približujejo človeškim prevodom; še zlasti to velja, če en jezik v paru angleščina. Na svoji prevajalski rešitvi dela tudi Facebook, saj preizkušajo avtomatično prevajanje komentarjev uporabnikov v jezike drugih bralcev.

Storitev je za zdaj v fazi preizkušanja. To pomeni, da imajo zgolj nekateri uporabniki pri prebiranju komentarju na dnu funkcijo Prevedi, ki sporočilo prevede v jezik, v katerem imajo nastavljen uporabniški vmesnik. Izvorni jezik Facebook zazna...

25 komentarjev

Microsoft Evrotermu poklonil svoj korpus prevodov

Portal Evroterm

Microsoft - Microsoft je objavil, da so prejšnji mesec sklenili dogovor o predaji svojega korpusa angleško-slovenskih prevodov projektu Evroterm in ga tudi že izpolnili. Bazo podatkov so obogatili s 7500 prevodi s področja informacijske tehnologije, ki so večidel nastali v okviru prevajanja in lokaliziranja operacijskega sistema Windows in pisarniškega paketa Office. Poleg tega so dodali še dobrih 10 tisoč angleških terminov, ki slovenskih ustreznic nimajo, imajo pa prevode v drugih jezikih, ki jih Evroterm tudi zbira. Na ta način želijo pomagati skupnosti prevajalcev, lokalizatorjev, študentov in delavcev v IT.

Projekt Evroterm je zelo uporaben, a malo poznan in skorajda po krivem zapostavljen. Gre za terminološko zbirko izrazov, ki se ureja od leta...

8 komentarjev

Google razvija ribo babilonko

Riba babilonka

Times Online - Ribo babilonko si je zamislil Douglas Adams v Štoparskem vodniku po galaksiji. V originalu gre za majhno rumeno ribico, podobno pijavki, a v resničnosti se bomo zadovoljili s kakršnokoli formo, ki bo opravljala isto poslanstvo. Poizkusov ne manjka. Avtomatsko prevajanje zapisanega teksta deluje presenetljivo solidno, rezultate pa so dali že tudi prvi poizkusi programov, ki bo tolmačili govorjeni tekst. Omenimo program za iPhone profesorja s Carnegie Mellon University in Toshibino rešitev.

Reševanja tega problema se je lotil tudi velikan Google. Pri razvoju se bodo oprli na že obstoječe algoritme strojnega prevajanja teksta - lasten Googlov podpira že 52 jezikov - in tehnologijo za...

26 komentarjev

Aplikacija za tolmačenje na iPhonu

Slo-Tech - Eden izmed svetih gralov računalništva ostaja strojno prevajanje, ki navkljub eksponentni rasti surove računske moči, velikih sistemov pravil in ogromnih korpusov, še ni doseglo ravni človeških prevajalcev. Širšim množicam najbolj znan poliglot je Google, ki na svojih straneh nudi prevajanje med več kot 40 jeziki. V nekatere prevaja bolj, v druge manj uspešno.

Novoustanovljeno podjetje Jibbigo LLC, ki ga vodi Alex Waibel, profesor na znani Carnegie Mellon University, je izdalo aplikacijo za iPhone, ki tolmači govorjeno besedilo iz angleščine v španščino in obratno. Kot je videti na reklamnem posnetku, zadeva funkcionira zadovoljivo dobro za preprosto in lepo izgovorjene stavke. Avtorji pravijo, da za zdaj aplikacija podpira 40.000...

17 komentarjev

Google se je naučil novih jezikov

Prevod v jidiš

CNet - Googlova storitev za prevajanje med različnimi jeziki, ki se že zavidljivo dolgo in nekoliko manj zavidljivo dobro spopada tudi s slovenščino, je dobila podporo za devet novih jezikov. Pisani družinici jezikov našega babilonskega stolpa se pridružujejo afrikanščina (nizozemščini soroden jezik, ki ga govorijo v Južni Afriki), beloruščina, islandščina, irščina, makedonščina, malajščina, svahili, valižanščina in jidiš (germanski jezik judovske populacije, ki se zapisuje v hebrejski abecedi). Skupno tako Google obvlada 52 jezikov, saj je pred iranskimi predsedniškimi volitvami po hitrem postopku izdal še alfa verzijo prevajalnika v perzijščino. Tako se nevarno približuje Guinnessovemu rekorderju Haroldu Williamsu, ki naj bi bil govoril 58 jezikov.

15 komentarjev

Google dodal prevajanje v Gmail

Rezultat

TechCrunch - Google sicer že dlje časa ponuja prevode med 41 jeziki, med njimi tudi iz slovenščine in v njo, na svojih straneh, sedaj pa so funkcijo integrirali še v svoj klient za elektronsko pošto. V razdelku Google Labs, kjer najdemo kopico novih zmožnosti, ki so še v eksperimentalnem stadiju, tako da vsake toliko časa kakšna izgine ali se pojavi, si lahko vklopite možnost Message translation. Ko jo odkljukate, se vam ob prebiranju vsakega sporočila prikaže možnost prevoda. To je bilo sicer že prej dosegljivo z ročnim odpiranjem Googlove strani Translate in kopiranjem sporočila nanjo, sedaj pa je postopek poenostavljen. Prevodi so sicer daleč od popolnosti, a boljši od ničesar.

Sedaj se lahko nadejamo...

9 komentarjev

Google ustanovil sklad tveganega kapitala

Google - Google se očitno dobro spomni težkih začetkov in prosjačenja investitorjev za sredstva, ko beseda google še ni bila glagol. Zato (in za profit seveda) so ustanovili nov sklad tveganega kapitala, ki so ga neizvirno poimenovali Google Ventures. Ta venture fund bo pomagal podjetjem v povojih, da zberejo dovolj sredstev za zagon delovanja. Kot pišejo v svojem blogu, je logika povsem podobna ostalim tovrstnim skladom. Poiskali bodo najperspektivnejša podjetja, katerih izbor želijo opraviti bolje od konkurence, na področju interneta, programske opreme, clean-techa, bio-techa, zdravstva in podobnih, vanje vložili zadostno količino dolarjev in upali na preboj podjetja, ki bi jim investicijo obilno poplačal. Prijavite se.

10 komentarjev

Google Voice za cenejše klice

TG Daily - Google je pripravil novo storitev, ki bo omogočala telefoniranje z uporabo njihovih rešitev. Lani so prevzeli podjetje Grand Central, ki je tržilo spletno telefonijo (VoIP) in je uporabnikom omogočalo dosegljivost na eni sami številki kljub več telefonskim aparatom, ne glede na to ali so bili doma, v službi, v avtomobilu ali kje drugje. Sedaj je Google ta izdelek izpopolnil in predelal v Google Voice.

Nova storitev bo uporabnikom, sprva seveda v ZDA, omogočala brezplačne lokalne klice in poceni mednarodne, uporabo glasovnih sporočil, glasovne pošte in še nekaj drugih možnosti. Google se s tem dejanjem še bolj odmika od stereotipa, da je njihov edini produkt iskanje po spletu in oglaševanje, hkrati pa hodi v zelje Skypu in drugim ponudnikom sorodnih storitev.

Google je implementiral nekaj zelo zanimivih funkcionalnosti, kot je denimo samodejno prepoznavanje govora v glasovnih sporočilih in avtomatska izdelava transkripcije, ki jo lahko uporabniki dobijo po elektronski pošti ali...

6 komentarjev

Bo WolframAlpha spremenil način iskanja informacij po svetovnem spletu?

Slashdot - Stephen Wolfram je na svojem blogu napovedal, da bodo maja v njegovem podjetju Wolfram Research zagnali spletni iskalnik v naravnem jeziku WolframAlpha, ki bo uporabniku na vprašanja v naravnem jeziku vračal konkretne odgovore in ne le povezave na spletne strani, kot je to v navadi pri klasičnih iskalnikih tipa Google,Yahoo...
Sicer je iskalnikov tega tipa že nekaj, ki pa jim to stvar uspeva uresničevati le delno(prepričajte se na Powerset ali Lexxe).

Glede na to, da človek, ki ima za sabo tako kompleksen produkt kot je Mathematica pravi, da bolj zapletene stvari še ni delal ter da mu je vzela zadnjih nekaj let, lahko z upravičenostjo pričakujemo produkt, ki bo spremenil način iskanja informacij po spletu.

Wolfram pravi, da se bomo s tem "produktom" zelo približali idealu o računalniku iz 50. let prejšnega stoletja, ki zna izračunati odgovor na vsako zastavljeno vprašanje.

52 komentarjev

Google govori 41 jezikov

Slo-Tech - Google postaja iz dneva v dan boljši poliglot, saj mu inženirji in lingvisti pridno dodajajo nove jezike, ki jih razume. Z zadnjim dodatkom turščine, tajščine, madžarščine, estonščine, albanščine in galicijščine podpira prevajanje med 41 jeziki v poljubni kombinaciji (torej 1640 dvojic). Google trdi, da s tem dosega materne jezike 98 odstotkov vseh uporabnikov, kar je impresivna številka. Odveč je poudariti, da Google že od lani prevaja tudi v slovenščino in iz nje, kar so podjetni nigerijski lopovi že začeli izkoriščati.

Google ni prvi niti edini ponudnik strojnih prevodov na spletu, je pa zagotovo največji, najobširnejši in najbolj znani. Že dolgo časa je naokrog Babelfish oz. riba babilonka, ki jo je prvi odkril Arthur Dent, Slovenci pa se lahko za angleško-slovenske in obratne prevode zatečemo tudi k Amebisovi rešitvi. Prevajanje med jeziki je zahteven problem, ker jeziki uporabljajo različne načine opisa sveta, tako da ni moč postaviti bijektivne preslikave ali pa prevajati...

30 komentarjev

Google bo ukinil šest storitev

Slashdot - Poleg krčenja števila zaposlenih kadrovikov v Googlu, o čemer smo že poročali, in zaprtja nekaterih lokalnih pisarn v raznih ameriških mestih, bo Google ukinil šest storitev, za katere so presodili, da niso več ekonomsko upravičene. Prizadete storitve so Dodgeball, Catalog Search, Mashup Editor, Notebook in Jaiku. Poleg tega bodo umaknili možnost pošiljanja novih video posnetkov na Google Video, saj po Googlovem nakupu YouTuba to res ni več smiselno, medtem ko bo razvoj Jaikuja zaupan odprti skupnosti.

To seveda ne pomeni, da so od danes naprej omenjene storitve povsem nedostopne, saj se je Google odločil za mehak prehod. Nekatere bodo ukinili šele čez čas (Dodgeball se bo tako poslovil šele čez nekaj mesecev), druge bodo ostale, a ne bodo več vzdrževane (npr. Notebook), spet tretje pa bodo okrnjene (npr. Google Video). Pri teh rezih ne gre za kakšne življenjsko pomembne storitve, a vsekakor kažejo na nevarno odvisnost od samo dobre volje podjetja, če bi uporabljali kakšno...

53 komentarjev

Ethnocon

Slo-Tech - V torek, 17. maja je na regionalnem tekmovanju Imagine Cup v Grčiji zmagala mariborska ekipa z zanimivo rešitvijo EthnoCon.

Gre za integriran komunikacijski sistem, ki naj bi lajšal premoščanje kulturnih, jezikovnih in drugih komunikacijskih barier. Sistem obvlada takšne cvetke kot je skeniranje jedilnega lista z dlančnikom, prepoznavanje OCR, prevod v drug jezik, vpeljavo prevoda neposredno v originalno sliko in prikaz le te nazaj na dlančniku. Na podoben način zna sestaviti tudi razpoznavo govora, strojni prevod v drug jezik in vnovično sintezo govora v drugem jeziku.

Gre večinoma za gradnike Microsoftovih mobilnih in multimedijskih platform povezane na celovit in predvsem delujoč način. Zdaj fantje odhajajo na...

20 komentarjev