OpenAI je ustvaril algoritem, ki si ga ne upa spustiti v divjino

Jurij Kristan

16. feb 2019 ob 10:10:16

V laboratoriju za strojno inteligenco OpenAI so napravili algoritem za generiranje besedil, ki je po njihovem mnenju prenevaren, da bi ga v celoti dali v javnost.

Strojni algoritmi danes ne znajo zgolj prepoznavati vzorcev, temveč tudi ustvarjati nove vsebine, na primer slike in obraze. Seveda so še na stopnji, ko pozornega človeka zelo težko pretentajo, saj je večina njihovih stvaritev nepopolna, dostikrat pa naravnost groteskna. Toda očitno prihajamo v čas, ko bo strojna pamet postala tako sposobna, da bodo njene stvaritve težko razločljive od človeških. V družbi OpenAI, za katero stoji Elon Musk, so namreč ustvarili generator tekstovnih besedil, ki ga ne želijo spustiti iz laboratorija. Menijo, da je tako učinkovit, da bi pomenil nevarnost za prehitro širjenje dezinformacij, če bi ga v rabo dobili oddelki za propagando in spletni troli.

Algoritem GPT2 je nastal iz raziskovanja strojnega prevajanja in botov za spletne pogovore, toda iz tega se je izcimil sistem, ki je sposoben iz krajšega teksta ustvariti smiseln daljši sestavek - vsaj za silo. Kot enega poglavitnih dejavnikov uspeha avtorji navajajo velikost: GPT2 je dvanajstkrat večji od prejšnjih AI modelov in se je učil na petnajstkrat večji bazi podatkov; konkretno, na desetih milijonih besedil. To mu daje sposobnost, da pri pisanju uporablja množico poznanih fraz in oseb. Učinkovitost algoritma je njegove stvaritelje tako presunila, da njegove kode nočejo dati ven, prav tako ne bodo objavili celotne baze podatkov, na kateri se je stroj učil. To je sicer zadnje v vse večji množici opozoril tehnoloških podjetij, da je potrebno strojno inteligenco bolje regulirati.

Če smo precizni, so besedila, ki jih je OpenAI pokazal (kakršno je tisto na sliki), še vedno prislovično računalniška. Marsikdo bo porekel, da je to vik in krik za prazen nič ali celo poskus poceni reklame za OpenAI. Toda nevarnost, ki je prestrašila programerje GPT2, ni toliko v tem, da bi stroj ustvarjal popolnoma brezhibne tekste, temveč v tem, da bo znal napraviti gromozansko množico ravno za silo dobrih, da zberejo nekaj klikov. Problem dezinformacij na spletu ni samo v prepričljivosti lažnih novic, temveč še bolj v njihovi množičnosti, s katero preplavijo kredibilnejše. In tu bo avtomatizacija velik problem, ki napoveduje vojno med deepfake algoritmi in tistimi za njihovo zaznavanje.