Povezane novice

Izpis novic (11 zadetkov)

Microsoft Evrotermu poklonil svoj korpus prevodov

Microsoft - Microsoft je objavil, da so prejšnji mesec sklenili dogovor o predaji svojega korpusa angleško-slovenskih prevodov projektu Evroterm in ga tudi že izpolnili. Bazo podatkov so obogatili s 7500 prevodi s področja informacijske tehnologije, ki so večidel nastali v okviru prevajanja in lokaliziranja operacijskega sistema Windows in pisarniškega paketa Office. Poleg tega so dodali še dobrih 10 tisoč angleških terminov, ki slovenskih ustreznic nimajo, imajo pa prevode v drugih jezikih, ki jih Evroterm tudi zbira. Na ta način želijo pomagati skupnosti prevajalcev, lokalizatorjev, študentov in delavcev v IT.

Projekt Evroterm je zelo uporaben, a malo poznan in skorajda po krivem zapostavljen. Gre za terminološko zbirko izrazov, ki se ureja od leta 2000, ko se je začel proces prevajanja zakonodaje Evropske unije v okviru Sektorja za prevajanje, redakcijo in terminologijo Službe Vlade RS za evropske zadeve (SVEZ). Spletni portal je pripravil nekdanji Center Vlade RS za informatiko, od leta 2005 pa zanj skrbi Sektor za prevajanje pri Generalnem sekretariatu Vlade RS. Zbirka, ki vsebuje 120 tisoč izrazov, je bila sprva namenjena zgolj pravni terminologiji, a so jo sčasoma razširili s prevodi slovenskih predpisov, mednarodnih pogodb, državne korespondence, programov, poročil itn. V njej najdemo termine predvsem v angleščini in slovenščini, manjši del pa tudi v češčini, danščini, finščini, francoščini, hrvaščini, italijanščini, latinščini, nemščini, nizozemščini, poljščini, portugalščini, slovaščini, španščini in švedščini.

Portal Evroterm

Portal Evroterm

5 komentarjev | povej naprej: Facebook Twitter


Google razvija ribo babilonko

Times Online - Ribo babilonko si je zamislil Douglas Adams v Štoparskem vodniku po galaksiji. V originalu gre za majhno rumeno ribico, podobno pijavki, a v resničnosti se bomo zadovoljili s kakršnokoli formo, ki bo opravljala isto poslanstvo. Poizkusov ne manjka. Avtomatsko prevajanje zapisanega teksta deluje presenetljivo solidno, rezultate pa so dali že tudi prvi poizkusi programov, ki bo tolmačili govorjeni tekst. Omenimo program za iPhone profesorja s Carnegie Mellon University in Toshibino rešitev.

Reševanja tega problema se je lotil tudi velikan Google. Pri razvoju se bodo oprli na že obstoječe algoritme strojnega prevajanja teksta - lasten Googlov podpira že 52 jezikov - in tehnologijo za prepoznavanje govora. Ideja je izvesti prevajanje v paketih, kot to počno človeški tolmači. Franz Och, vodja Googlove prevajalske skupine, pravi, da lahko že v naslednjih nekaj letih pričakujemo dobro strojno prevajanje govorjene besede. Problem prepoznavanja govora, kjer sistema ne smejo zmesti unikatne karakteristike posameznika, kot so intonacija, naglas in barva glasu, naj bi bil na prenosnih telefonov lažje rešljiv. Ker telefon uporablja večinoma ena oseba, se bo programska oprema njenega glasu navadila, dodaja Och. Tako bi, vsaj v teoriji, telefon z daljšanjem uporabe prevajal vedno bolje.

Akademiki so bolj zadržani. Profesor jezikoslovja David Crystal z Bangor University meni, da problema prepoznavanja različnih naglasov v prihodnjih letih še ne bomo zadovoljivo rešili. Morda bo Googlu to uspelo prej kot ostalim, a gotovo ne v tako kratkem času, dodaja.
Riba babilonka

Riba babilonka

26 komentarjev | povej naprej: Facebook Twitter


Aplikacija za tolmačenje na iPhonu

Slo-Tech - Eden izmed svetih gralov računalništva ostaja strojno prevajanje, ki navkljub eksponentni rasti surove računske moči, velikih sistemov pravil in ogromnih korpusov, še ni doseglo ravni človeških prevajalcev. Širšim množicam najbolj znan poliglot je Google, ki na svojih straneh nudi prevajanje med več kot 40 jeziki. V nekatere prevaja bolj, v druge manj uspešno.

Novoustanovljeno podjetje Jibbigo LLC, ki ga vodi Alex Waibel, profesor na znani Carnegie Mellon University, je izdalo aplikacijo za iPhone, ki tolmači govorjeno besedilo iz angleščine v španščino in obratno. Kot je videti na reklamnem posnetku, zadeva funkcionira zadovoljivo dobro za preprosto in lepo izgovorjene stavke. Avtorji pravijo, da za zdaj aplikacija podpira 40.000 besed (nekatere ocene pravijo, da ima angleščina tudi pol milijona besed), zato je omejitev na preprost jezik razumljiva. Za uporabo ni potrebna povezava z internetom, saj ima aplikacija vse potrebno že naloženo lokalno.

17 komentarjev | povej naprej: Facebook Twitter


Google se je naučil novih jezikov

CNet - Googlova storitev za prevajanje med različnimi jeziki, ki se že zavidljivo dolgo in nekoliko manj zavidljivo dobro spopada tudi s slovenščino, je dobila podporo za devet novih jezikov. Pisani družinici jezikov našega babilonskega stolpa se pridružujejo afrikanščina (nizozemščini soroden jezik, ki ga govorijo v Južni Afriki), beloruščina, islandščina, irščina, makedonščina, malajščina, svahili, valižanščina in jidiš (germanski jezik judovske populacije, ki se zapisuje v hebrejski abecedi). Skupno tako Google obvlada 52 jezikov, saj je pred iranskimi predsedniškimi volitvami po hitrem postopku izdal še alfa verzijo prevajalnika v perzijščino. Tako se nevarno približuje Guinnessovemu rekorderju Haroldu Williamsu, ki naj bi bil govoril 58 jezikov.
Prevod v jidiš

Prevod v jidiš

15 komentarjev | povej naprej: Facebook Twitter


Google dodal prevajanje v Gmail

TechCrunch - Google sicer že dlje časa ponuja prevode med 41 jeziki, med njimi tudi iz slovenščine in v njo, na svojih straneh, sedaj pa so funkcijo integrirali še v svoj klient za elektronsko pošto. V razdelku Google Labs, kjer najdemo kopico novih zmožnosti, ki so še v eksperimentalnem stadiju, tako da vsake toliko časa kakšna izgine ali se pojavi, si lahko vklopite možnost Message translation. Ko jo odkljukate, se vam ob prebiranju vsakega sporočila prikaže možnost prevoda. To je bilo sicer že prej dosegljivo z ročnim odpiranjem Googlove strani Translate in kopiranjem sporočila nanjo, sedaj pa je postopek poenostavljen. Prevodi so sicer daleč od popolnosti, a boljši od ničesar.

Sedaj se lahko nadejamo spama tudi v slovenščini!
Rezultat

Rezultat

9 komentarjev | povej naprej: Facebook Twitter


Google ustanovil sklad tveganega kapitala

Google - Google se očitno dobro spomni težkih začetkov in prosjačenja investitorjev za sredstva, ko beseda google še ni bila glagol. Zato (in za profit seveda) so ustanovili nov sklad tveganega kapitala, ki so ga neizvirno poimenovali Google Ventures. Ta venture fund bo pomagal podjetjem v povojih, da zberejo dovolj sredstev za zagon delovanja. Kot pišejo v svojem blogu, je logika povsem podobna ostalim tovrstnim skladom. Poiskali bodo najperspektivnejša podjetja, katerih izbor želijo opraviti bolje od konkurence, na področju interneta, programske opreme, clean-techa, bio-techa, zdravstva in podobnih, vanje vložili zadostno količino dolarjev in upali na preboj podjetja, ki bi jim investicijo obilno poplačal. Prijavite se.

10 komentarjev | povej naprej: Facebook Twitter


Google Voice za cenejše klice

TG Daily - Google je pripravil novo storitev, ki bo omogočala telefoniranje z uporabo njihovih rešitev. Lani so prevzeli podjetje Grand Central, ki je tržilo spletno telefonijo (VoIP) in je uporabnikom omogočalo dosegljivost na eni sami številki kljub več telefonskim aparatom, ne glede na to ali so bili doma, v službi, v avtomobilu ali kje drugje. Sedaj je Google ta izdelek izpopolnil in predelal v Google Voice.

Nova storitev bo uporabnikom, sprva seveda v ZDA, omogočala brezplačne lokalne klice in poceni mednarodne, uporabo glasovnih sporočil, glasovne pošte in še nekaj drugih možnosti. Google se s tem dejanjem še bolj odmika od stereotipa, da je njihov edini produkt iskanje po spletu in oglaševanje, hkrati pa hodi v zelje Skypu in drugim ponudnikom sorodnih storitev.

Google je implementiral nekaj zelo zanimivih funkcionalnosti, kot je denimo samodejno prepoznavanje govora v glasovnih sporočilih in avtomatska izdelava transkripcije, ki jo lahko uporabniki dobijo po elektronski pošti ali prek tekstovnih sporočil. Prepoznavanje ni stoodstotno, a tehnologija se bo sproti nadgrajevala.

Trenutno je uporaba Google Voicea omejena na obstoječe uporabnike Grand Centrala, kasneje pa sledi široka dostopnost. Načina klicanja bosta dva - uporabnik bo bodisi poklical svojo številko na Google Voice, pritisnil 2 in vtipkal želeno številko bodisi na spletni nadzorni plošči kliknil na želeno številko, nakar ga bo Google poklical in prevezal. Plačevanje mednarodnih klicev bo potekalo prek Google Checkouta.

6 komentarjev | povej naprej: Facebook Twitter


Bo WolframAlpha spremenil način iskanja informacij po svetovnem spletu?

Slashdot - Stephen Wolfram je na svojem blogu napovedal, da bodo maja v njegovem podjetju Wolfram Research zagnali spletni iskalnik v naravnem jeziku WolframAlpha, ki bo uporabniku na vprašanja v naravnem jeziku vračal konkretne odgovore in ne le povezave na spletne strani, kot je to v navadi pri klasičnih iskalnikih tipa Google,Yahoo...
Sicer je iskalnikov tega tipa že nekaj, ki pa jim to stvar uspeva uresničevati le delno(prepričajte se na Powerset ali Lexxe).

Glede na to, da človek, ki ima za sabo tako kompleksen produkt kot je Mathematica pravi, da bolj zapletene stvari še ni delal ter da mu je vzela zadnjih nekaj let, lahko z upravičenostjo pričakujemo produkt, ki bo spremenil način iskanja informacij po spletu.

Wolfram pravi, da se bomo s tem "produktom" zelo približali idealu o računalniku iz 50. let prejšnega stoletja, ki zna izračunati odgovor na vsako zastavljeno vprašanje.

52 komentarjev | povej naprej: Facebook Twitter


Google govori 41 jezikov

Slo-Tech - Google postaja iz dneva v dan boljši poliglot, saj mu inženirji in lingvisti pridno dodajajo nove jezike, ki jih razume. Z zadnjim dodatkom turščine, tajščine, madžarščine, estonščine, albanščine in galicijščine podpira prevajanje med 41 jeziki v poljubni kombinaciji (torej 1640 dvojic). Google trdi, da s tem dosega materne jezike 98 odstotkov vseh uporabnikov, kar je impresivna številka. Odveč je poudariti, da Google že od lani prevaja tudi v slovenščino in iz nje, kar so podjetni nigerijski lopovi že začeli izkoriščati.

Google ni prvi niti edini ponudnik strojnih prevodov na spletu, je pa zagotovo največji, najobširnejši in najbolj znani. Že dolgo časa je naokrog Babelfish oz. riba babilonka, ki jo je prvi odkril Arthur Dent, Slovenci pa se lahko za angleško-slovenske in obratne prevode zatečemo tudi k Amebisovi rešitvi. Prevajanje med jeziki je zahteven problem, ker jeziki uporabljajo različne načine opisa sveta, tako da ni moč postaviti bijektivne preslikave ali pa prevajati besedo po besedo. Zvedavejši bralci si lahko preberajo tudi kaj o Sapir-Whorfovi hipotezi, ki sta jo postavila ameriška antropologa in predpostavlja, da jezik determinira naše dojemanje sveta in razmišljanje, in več o strojnem prevajanju.

Osnovne informacije o delovanju Google Translate v seznamu pogosto postavljenih vprašanj ponuja že sam. Ideja, ki so jo razvili, se razlikuje od načina učenja tujih jezikov ljudi in tudi prvih strojnih prevajalnikov. Namesto pomnjenja pravil, izjem in besedišča dajo Googlu prežvečiti goro besedil v tarčnem jeziku skupaj s človeškim prevodom v drug jezik. S pomočjo statističnih prijemov potem Google poskuša sestaviti čim boljši korpus s kolokacijami za prevajanje. Ideja niti ni tako nenavadna, saj se ljudje na podoben način, seveda brez prevodov, učijo maternega jezika. To je tudi razlog, da branje izboljšuje rabo jezika.

Prevodi seveda niso niti približno popolni ali primerljivi z izdelki človeških strokovnjakov, a so še vedno zelo uporabni za prvo idejo, o čem govori nek tekst v nam nerazumljivem jeziku. Tega se zaveda tudi Google, zato je ob vsakem prevodu tudi možnost Predlagajte boljši prevod. Očitno je sicer, da Googlu nekateri jeziki ležijo bolje od drugih, saj angleški I don't have any plans povsem pravilno posloveni v Nimam načrtov, medtem ko nemški Ich habe nichts vor napak prevede v Nimam nič proti. Take napake so posebej zoprne, saj je stavek semantično zgrešen, slovnično pa pravilen, tako da zlahka zavede. S kakšnimi zahtevnejšimi strukturami, denimo vrivanjem zaimkov med glagolsko osnovo in obrazilo v portugalščini Eu abraçar-te-ei (Objel te bom), pa se popolnoma zadavi in odgovori z I objemu si, hej.

30 komentarjev | povej naprej: Facebook Twitter


Google bo ukinil šest storitev

Slashdot - Poleg krčenja števila zaposlenih kadrovikov v Googlu, o čemer smo že poročali, in zaprtja nekaterih lokalnih pisarn v raznih ameriških mestih, bo Google ukinil šest storitev, za katere so presodili, da niso več ekonomsko upravičene. Prizadete storitve so Dodgeball, Catalog Search, Mashup Editor, Notebook in Jaiku. Poleg tega bodo umaknili možnost pošiljanja novih video posnetkov na Google Video, saj po Googlovem nakupu YouTuba to res ni več smiselno, medtem ko bo razvoj Jaikuja zaupan odprti skupnosti.

To seveda ne pomeni, da so od danes naprej omenjene storitve povsem nedostopne, saj se je Google odločil za mehak prehod. Nekatere bodo ukinili šele čez čas (Dodgeball se bo tako poslovil šele čez nekaj mesecev), druge bodo ostale, a ne bodo več vzdrževane (npr. Notebook), spet tretje pa bodo okrnjene (npr. Google Video). Pri teh rezih ne gre za kakšne življenjsko pomembne storitve, a vsekakor kažejo na nevarno odvisnost od samo dobre volje podjetja, če bi uporabljali kakšno pomembnejšo funkcionalnost - npr. Gmail ali Google Docs - v službene namene. Klik!

53 komentarjev | povej naprej: Facebook Twitter


Ethnocon

Slo-Tech - V torek, 17. maja je na regionalnem tekmovanju Imagine Cup v Grčiji zmagala mariborska ekipa z zanimivo rešitvijo EthnoCon.

Gre za integriran komunikacijski sistem, ki naj bi lajšal premoščanje kulturnih, jezikovnih in drugih komunikacijskih barier. Sistem obvlada takšne cvetke kot je skeniranje jedilnega lista z dlančnikom, prepoznavanje OCR, prevod v drug jezik, vpeljavo prevoda neposredno v originalno sliko in prikaz le te nazaj na dlančniku. Na podoben način zna sestaviti tudi razpoznavo govora, strojni prevod v drug jezik in vnovično sintezo govora v drugem jeziku.

Gre večinoma za gradnike Microsoftovih mobilnih in multimedijskih platform povezane na celovit in predvsem delujoč način. Zdaj fantje odhajajo na svetovni finale Imagine cup 2005 v Japonsko Yokohamo. Kaj se bo zgodilo tam bomo izvedeli konec avgusta. Nekaj več informacij se dobi v sporočilu za javnost. Edina zamera fantom gre, da še nimajo predstavitvene spletne strani.

Na prvi sliki od leve proti desni: Simon, Tadej, Miha, Boris.

20 komentarjev | povej naprej: Facebook Twitter

Izpis novic (11 zadetkov)
Filtriranje po mesecih
Napredno filtriranje