»

Povprečni rezultati Facebookovega deep fake tekmovanja

Slo-Tech - Facebook je objavil rezultate tekmovanja, na katerem je 2114 udeležencev sodelovalo s več kot 35.000 algoritmi za prepoznavanje t. i. deep fake posnetkov. Pomerili so se v prepoznavanju več kot 100.000 kratkih videov, za katere so pri Faceboooku najeli okoli 3500 igralcev, nekatere od teh posnetkov pa so s pomočjo umetne inteligence in tehnologije deep fakes na različne načine spremenili.

Pa rezultati? Tekmovalci so del videov prejeli vnaprej, da bi lahko svoje algoritme preizkusili, v tem primeru je bila natančnost najboljšega modela 82,56 odstotna. Ko pa so se pomerili zares, torej pri prepoznavanju popolnoma neznanih posnetkov, pa je uspešnost zmagovalnega algoritma, prispeval ga je Selim Seferbekov, znašala precej povprečnih 65,18 odstotka. Kar pomeni, da je samodejno prepoznavanje tovrstnih ponaredkov v veliki meri še nerešen problem.

Zmagovalni algoritem bo Facebook javno objavil kot odprto kodo, v pomoč preostalim razvijalcem, ob tem pa v podjetju razvijajo tudi svoj...

18 komentarjev

Amazon, Microsoft in IBM ustavljajo sodelovanje s policijo pri prepoznavanju obrazov

Slo-Tech - Microsoft se je odločil, da policiji in ostalim represivnim organom ne bo prodajal lastne tehnologije za prepoznavanje obrazov. Microsoftov predsednik in glavni pravnik Brad Smith je povedal, da so tako odločitev sprejeli, ker področje na zvezni ravni v ZDA ni urejeno. Zavzemajo se za ureditev tega področja, zato so na primer podprli zakonodajo v Kaliforniji, ki bo z omejitvami to tehnologijo dovolila. A dokler ne bo zakonskih omejitev, ki bodo spoštovale človekove pravice, tehnologije ne bodo prodajali.

Pri tem Microsoft ni osamljen, saj sta podobne poteze napovedala tudi IBM in Amazon. IBM je dejal, da trenutno sploh ne bo razvijal in prodajal tehnologije za prepoznavanje obrazov, ker je lahko zlorabljena za množični nadzor in rasno profiliranje. V ZDA trenutno divjajo protesti zaradi smrti Georga Floyda, ki jo je med aretacijo s klečanjem na uklenjenem Floydu povzročil policist. Na protestih se uporablja tudi tehnologija za prepoznavanje obrazov. IBM je bil še nedavno eno...

3 komentarji

Računalniško prepoznavanje govora ni naučeno angleščine temnopoltih

Delež napačnih prepoznav besed (word error rate)

Slo-Tech - Sistemi za prepoznavanje govora so v zadnjih letih postali že zelo zmogljivi, tako da jih je možno uporabljati tudi v vsakdanjem življenju. K temu sta pripomogla povečanje korpusa za trening in razvoj metod za strojno učenje. Pet največjih razvijalcev teh sistemov je Amazon, Apple, Google, IBM in Microsoft. Raziskovalci s Stanforda so preverili, kako dobro ti sistemi razpoznavajo govorjeno besedo, in ugotovili, da obstajajo pomembne razlike med rasami (članek v PNAS).

Vseh pet sistemov je dobilo 19,8 ur posnetega materiala, ki je vključeval 42 belih govorcev in 73 temnopoltih. Govorili so z lokalnimi mestnimi govoricami petih mest v ZDA: Princeville (ruralno, večinoma temnopolto prebivalstvo), Rochester (srednje veliko mesto v državi New York), Washington DC, Sacramento (kalifornijska prestolnica) in Humboldt County (ruralno, večinoma belo prebivalstvo). Na koncu so uporabili 2141 izrezkov, ki so v povprečju trajali 17 sekund. Od teh je bilo 44 odstotkov moških, povprečna starost...

37 komentarjev

Umetna inteligenca, ki slači

Slo-Tech - Sredi tedna se je na internetu znašla aplikacija DeepNude, ki je obljubljala točno to, na kar namiguje njeno ime. Aplikacija je iz čim več fotografij oblečene osebe ženskega spola z algoritmi izdelala posnetek, kako je verjetno videti ta oseba brez oblek. Pričakovano je aplikacija dvignila precej prahu in polemik, ali je takšna uporaba sploh zakonita. Odgovor na tako vprašanje ni tako premočrten, kot bi na prvi pogled sklepali. Ni namreč vedno res, da so dovoljene vse vsebine, ki ne posegajo v zasebnost drugih in ne vplivajo nanje. Ekstremen primer je na primer otroška pornografija, kjer so prepovedane tudi realistične podobe, četudi bi šlo v celoti za izmišljene, izrisane like. A vrnimo se k aplikaciji DeepNude (ki sedaj ni več dostopna).

Ta deluje le na...

421 komentarjev

Googlov Translatotron korak bliže ribi babilonki

Slo-Tech - Googlov spletni prevajalnik postaja iz meseca v mesec boljši, prav tako so Googlovi algoritmi za prepoznavanje in sintezo govora že na zavidljivi ravni. Fuzijo teh tehnologij predstavljajo orodja za simultano prevajanje, kar je na primer Translatotron. Novi model za simultano strojno prevajanje govora se temu cilju že zelo približa, uporablja pa drugačno logiko od dosedanjih poizkusov.

Večina dosedanjih sistemov za tolmačenje je uporabljala prepoznavanje govora (prepis zvočnega posnetka v besedilo), strojno prevajanje besedila in sintezo govora. Kaskadno opravljanje teh funkcij deluje dobro in je tudi sestavni del Google Translate. Novi Translatotron pa deluje drugače.

Kot opisujejo v znanstvenem članku, gre za sistem direktnega prevajanja zvočnega zapisa v zvočni zapis brez...

21 komentarjev

Deepfakes grožnja nacionalni varnosti?

Washington Post - Trojica ameriških kongresnikov, demokrata Adam Schiff in Stephanie Murphy ter republikanec Carlos, so na direktorja vladnega urada za obveščevalne dejavnosti naslovili pismo, v katerem ga pozivajo, naj oceni, v kolikšni meri nacionalno varnost ogrožajo novodobni vizualni ponaredki oziroma t. i. deepfakes. Poslanci namreč menijo, da lahko prepričljive podobe znanih posameznikov, ki počno ali govorijo stvari, s katerimi v resnici nimajo nobene zveze, lahko pomenijo grožnjo družbi, obenem pa lahko imajo resne notranje ali celo zunanjepolitične posledice. Predstavniki ljudstva sicer od obveščevalcev pričakujejo, da bodo izdelali poročilo o tem novodobnem pojavu, zlasti o primerih, ko gre za tovrstne izdelke tujih državljanov. Česar, resnici na ljubo, ni veliko.

Deepfakes so...

33 komentarjev