Google Brain omogoča povečanje ločljivosti fotografij

Matej Huš

8. feb 2017 ob 18:24:33

V filmih iz točkastega posnetka nizke ločljivosti vedno uspejo izostriti sliko in na njej prepoznati odsev, ki omogoča identifikacijo storilca. Toda v resnici iz posnetka ne moremo izluščiti več podatkov, kot jih je na njem. Vseeno pa to ne pomeni, da slike ne moremo izboljšati. Google je pokazal, kako lahko s svojimi nevronskimi mrežami in strojnim učenjem poveča ločljivost zelo grobo točkastim slikam.

Na sliki so skrajno desno prvotne fotografije, ki so bile zreducirane v ločljivost 8x8 (skrajno levo). Googlov algoritem Brain je iz levih fotografij uspel obnoviti srednje, kar je osupljiva izboljšava. Kaj se dogaja? Informacijo, ki je na levih fotografijah ni, si je algoritem izmislil (temu v žargonu pravijo halucinacije). Gre za pametno ugibanje (educated guess), ki ga je Brain sposoben, ker se je učil. Prvi del nevronske mreže se imenuje conditioning. Ta primerja zamazano sliko 8x8 s fotografijami visoke ločljivosti, ki jih ima v bazi; seveda so slednje zreducirane na 8x8. Drugi del nevronske mreže (prior) uporablja kodo PixelCNN in 8x8 sliki doda informacijo, ki je realistična.

Tako moramo razumeti, da gledamo na pol domišljijske fotografije. Primerjava srednjega in desnega stolpca fotografij pokaže, da so obnovljene slike kvalitativno drugačne od originalov. Vsebujejo isto vrsto informacije (podobne obraze), a detajli so drugačni. Google je preveril, kako realistični so ti posnetki. Ko so morali ljudje ugotoviti, katera fotografija je original, so se zmotili v 10 odstotkih primerov. Če bi ugibali naključno, bi se v 50 odstotkih, torej čisto na cilju še niso. A še vedno je rezultat boljši od naivnih metod za izboljšavo resolucije (npr. interpolacija), kjer je vsem ljudem že od daleč jasno, da ne gre za original.