»

Povprečni rezultati Facebookovega deep fake tekmovanja

Slo-Tech - Facebook je objavil rezultate tekmovanja, na katerem je 2114 udeležencev sodelovalo s več kot 35.000 algoritmi za prepoznavanje t. i. deep fake posnetkov. Pomerili so se v prepoznavanju več kot 100.000 kratkih videov, za katere so pri Faceboooku najeli okoli 3500 igralcev, nekatere od teh posnetkov pa so s pomočjo umetne inteligence in tehnologije deep fakes na različne načine spremenili.

Pa rezultati? Tekmovalci so del videov prejeli vnaprej, da bi lahko svoje algoritme preizkusili, v tem primeru je bila natančnost najboljšega modela 82,56 odstotna. Ko pa so se pomerili zares, torej pri prepoznavanju popolnoma neznanih posnetkov, pa je uspešnost zmagovalnega algoritma, prispeval ga je Selim Seferbekov, znašala precej povprečnih 65,18 odstotka. Kar pomeni, da je samodejno prepoznavanje tovrstnih ponaredkov v veliki meri še nerešen problem.

Zmagovalni algoritem bo Facebook javno objavil kot odprto kodo, v pomoč preostalim razvijalcem, ob tem pa v podjetju razvijajo tudi svoj...

18 komentarjev

Google Translate omogoča tolmačenje in prepis predavanj

Slo-Tech - Googlova orodja za prevajanje in prepoznavanje govorjene besede so skupaj s sintetizatorjem govora že zelo dobra, sedaj pa na androidnih telefonih dobivajo še eno manjkajočo funkcijo. Aplikacija Translate je dobila možnost sprotnega tolmačenja.

V naslednjih dneh bodo uporabniki androidnih telefonov, v prihodnjih tednih pa po obljubah še Applovih, v posodobljeni aplikaciji Translate našli gumb Transcribe. Ob kliku na ta gumb bo telefon poslušal govorjeno besedilo v okolici in sproti izpisoval prevedeno besedilo. To seveda najbolje deluje, če v prostoru ni šumov in motenj, a naj bi delovalo tudi v večjih dvoranah pri predavanjih ipd. Funkcija deluje za jezike angleščina, francoščina, hindujščina, nemščina, portugalščina, ruščina, španščina in tajščina v poljubni kombinaciji. Izpisovati bo možno prevedeni tekst ali izvirnik.

Google že sedaj poleg osnovnega prevajanja vpisanega besedila omogoča še sintezo prevedenih besed in prepoznavanje govora. Vse potrebne elemente je torej Google...

9 komentarjev

Googlov Translatotron korak bliže ribi babilonki

Slo-Tech - Googlov spletni prevajalnik postaja iz meseca v mesec boljši, prav tako so Googlovi algoritmi za prepoznavanje in sintezo govora že na zavidljivi ravni. Fuzijo teh tehnologij predstavljajo orodja za simultano prevajanje, kar je na primer Translatotron. Novi model za simultano strojno prevajanje govora se temu cilju že zelo približa, uporablja pa drugačno logiko od dosedanjih poizkusov.

Večina dosedanjih sistemov za tolmačenje je uporabljala prepoznavanje govora (prepis zvočnega posnetka v besedilo), strojno prevajanje besedila in sintezo govora. Kaskadno opravljanje teh funkcij deluje dobro in je tudi sestavni del Google Translate. Novi Translatotron pa deluje drugače.

Kot opisujejo v znanstvenem članku, gre za sistem direktnega prevajanja zvočnega zapisa v zvočni zapis brez...

21 komentarjev

Skype posluša in govori že šest jezikov

Microsoft - Microsoftov Skype postaja pravi poliglot, saj se je naučil tekoče poslušati še dva jezika, so sporočili iz Microsofta. Sedaj razume tudi nemško in francosko, že na začetku je znal angleško in špansko, vmes pa so ga naučili tudi italijansko in kitajsko (mandarinščino). To pomeni, da lahko Skype Translator sedaj razume govorjeno besedo približno 30 odstotkov vseh ljudi, kar je osupljiva številka.

Poleg šestih jezikov, ki jih razume v govorjeni obliki, Skype razume 50 jezikov v pisani obliki, med njimi tudi slovensko. Prepoznavanje govora in prevajanje potekata v Microsoftovih strežnikih, zato morajo uporabniki soglašati s snemanjem pogovora in pošiljanjem v Microsoft. Tam se posnetki tudi shranijo, a zgolj z namenom izboljšanja...

8 komentarjev

Skype prevaja med štirimi jeziki, dostopen je vsem

Microsoft - Microsoft je lani decembra pokazal, kako zna Skype simultano prevajati govorjeno besedilo med angleščino in španščino. Tedaj na člane preizkusnega programa omejena beta verzija je sedaj odprta vsem, Skype pa se je naučil tudi nove jezike.

Simultano prevajanje lahko preizkusi in uporablja vsakdo, ki ima nameščen Skype na Windows 8.1 ali beta Windows 10. Novi Skype zna govor prevajati iz angleščine v španščino, italijanščino in kitajščino ter nazaj. Natipkan tekst pa zna prevajati v kar 50 jezikih, med drugim zna tudi slovensko in klingonsko. Microsoftov dolgoročni cilj je vse te jezike vključiti tudi v del za prevajanje govora, a pot do tja bo še dolga. Prva naj bi bila na vrsti nemščina in francoščina. Glavna ovira je...

25 komentarjev

Skype simultano prevaja!

Slo-Tech - Microsoft je izdal prvo verzijo Skypa, ki podpira simultano prevajanje govorjenega besedila. Medtem ko so junija kazali prototip, ki je prevajal iz angleščine v nemščino ter nazaj, ima nova verzija izključno podporo za angleščino in španščino. Drugi jeziki bodo še sledili.

Nova verzija je dostopna le tistim, ki so se prijavili v preizkusni program. Za uporabo potrebujemo operacijski sistem Windows 8, 8.1 ter v prihodnosti Windows 10 in aktiviran Microsoft oziroma Skype ID. Če te pogoje izpolnjujemo, lahko preizkusimo Skype Translation Preview. Microsoft je v promocijske namene posnel videoposnetek, kjer se pogovarjata učenki iz ZDA in Mehike, vsaka v svojem jeziku, resno pa so si novost ogledali ter jo preizkusili na Mashable.

Sistem...

63 komentarjev

Aplikacija za tolmačenje na telefonih iz Toshibe

ComputerWorld - Poročali smo že o aplikaciji za iPhone, ki jo je razvil profesor s Carnegie Mellon University in je namenjena simultanemu prevajanju iz angleščine v španščino in nazaj. Podobno reč razvijajo tudi Azijci, le da so se omejili na svoje jezike. Toshiba je namreč razvila nov sistem, ki se bo namestil na prenosne telefone in bo omogočal prepoznavanje glasov in prevajanje med angleščino, kitajščino in japonščino. Gre za okleščeno verzijo aplikacije, ki jo Toshiba že prodaja za PC-je na Japonskem in obvlada te iste jezike.

V teoriji je delovanje preprosto. Najprej telefon prepozna izgovorjene besede, jih razkosa na posamezne pomene, nato jih prevede bodisi s statistično bodisi z metodo na osnovi pravil in naposled sintetizira zvok prevedenega besedila. Statistična metoda deluje na osnovi verjetnosti in besednega reda, ki ju uporabi za konstrukcijo prevoda. Tak način aplikacija ubere za prevode angleško-kitajsko, kitajsko-angleško in kitajsko-japonske, medtem ko se ostale smeri in...

0 komentarjev

Predstavitev sistema za sintezo slovenskega govora

Lugos - Kiberpipa, četrtek 30.5 ob 19:00 Jure Leskovec bo predstavil sistem za sintezo slovenskega govora Govorec. Govorec je računalniški program, ki na vhodu sprejme besedilo v slovenskem jeziku in ga preko zvočnikov naglas prebere. Sistem je bil razvit na Inštitutu Jožef Stefan. Najprej si bomo ogledali osnovne probleme in postopke, ki jih je potrebno rešiti pri sintezi govora. Vsakega od štirih korakov, ki nastopijo pri sintezi govora, si bomo posebej ogledali: razčlemba besedila, pretvorba črk v glasove (foneme), nastavljanje govornih parametrov in naglaševanje ter združevanje osnovnih govornih enot. Na koncu bo sledilo še nekaj besed o Microsoftovem Speech APIju, s katerim je združljiv Govorec, ter obvezno poslušanje govora Govorca ter nekaterih tujih sintetizatorjev govora. Prosojnice za predavanje lahko najdete na http://ai.ijs.si/jure/mat/govorec-cyber...

13 komentarjev