Google in Stanford z velikim napredkom pri prepoznavi slik

Matej Huš

21. nov 2014 ob 10:27:14

Google je občutno izboljšal algoritem za prepoznavanje predmetov na slikah in ugotavljanje relacij med njimi, so sporočili. Problem prepoznavanja predmetov so že septembra imeli precej dobro rešen, večji zalog pa je predstavljalo ugotavljanje, v kakšnem razmerju so predmeti na sliki.

Rezultati zadnjih preizkusov kažejo, da jim je tudi to dobro uspelo. Novi algoritem prepozna predmete na sliki, potem pa ugotovi, kako so razporejeni in kaj se dogaja; te ugotovitve nato izpiše v človeku razumljivi angleščini (glej sliko). To niso le preproste relacije, kot na primer Pica je na štedilniku, temveč tudi kompleksnejši opisi, na primer Ljudje nakupujejo na tržnici, kjer je na stojnici veliko zelenjave.

Google pravi, da so nadgradili sistem, ki se uporablja za prevajanje med jeziki. Tam
rekurentna nevronska mreža (RNN) stavek v izvornem jeziku pretvori v vektorsko predstavitev, potem pa druga RNN stavek prevede v ciljni jezek. Google je prvo RNN v postopku zamenjal s konvolucijsko nevronsko mrežo, ki zmore prepoznavati slike. Drugi del ostane enak, torej RNN, in rezultat je prepoznavanje slike in prevod v besedilni jezik.

Google je algoritem preizkusil na zbirkah odprtih slik Pascal, Flickr8r, Flickr30k in SBU. Rezultati so bili navdušujoči. Podobno je uspelo tudi raziskovalni skupini na Stanfordu, ki se je lotila in razrešila isti problem. Tudi ti so uporabljali nevronske mreže, ki so osnova za strojno učenje, zgrajene pa so po zgledu nevronskih povezav v živih organizmih. Tako stanfordska kot Googlova ekipa sta prepričani, da je to šele začetek in da bo njuna programska oprema sčasoma še boljša.

Vodja laboratorija za umetno inteligenco na Stanfordu Andrej Karpathy je dejal, da si lahko informacije v fotografijah in videoposnetkih na internetu predstavljamo kot temno snov (analogija astrofizikalni terminologiji). Vsebuje velike količine informacij, a je sistematično iskanje po njih praktično nemogoče. Napredek na področju prepoznave slik bo odklenil tudi te.