Umetna inteligenca proti umetni inteligenci: sodelovati ali tekmovati

Matej Huš

11. feb 2017 ob 12:08:55

V življenju je mnogo situacij, ki morajo udeleženci izbrati med dvema različnima strategijama - sodelovati ali tekmovati. Optimalne taktike ni vedno enostavno izračunati in se pogosto niti ne realizira, ker je Nashevo ravnotežje drugačno. Znamenit primer je zapornikova dilema, ko policija ločena pridrži kriminalca, ki imata na izbiro svojega partnerja izdati ali ne. Kdor izda drugega, je svoboden, drugi pa gre za tri leta v zapor. Če se izdata oba, gresta oba v zapor za dve leti, če pa ne spregovori nihče, gresta oba v zapor za eno leto. Kaj pa bi v takem primeru naredila umetna inteligenca?

To so se vprašali pri Googlovem DeepMindu (znanstveni članek) in umetni inteligenci naščuvali v igranje preprostih iger, ki ugotavljajo točno to . Umetni inteligenci sta odigrali na tisoče partij in se sproti učili (deep multi-agent reinforcement learning). V prvi igri (Gathering) sta morala igralca nabirati sadeže (jabolka), za katere sta bila nagrajena. Prav tako sta imela možnost drug drugega z laserjem začasno odstraniti iz igre. Po pričakovanjih sta v razmerah obilja nabirala jabolka, ko pa jih je začelo zmanjkovati, sta postajala čedalje agresivnejša in drug drugega čedalje pogosteje ovirala. Zanimivo je bilo, da je inteligentnejši igralec, torej tak z večjo računsko močjo, igral agresivneje. DeepMind pojasnjuje, da to ne pomeni nujno, da je agresija boljša taktika, temveč da preprosto zahteva več računske moči kakor nabiranje jabolk, zato je manj zmogljiva umetna inteligenca ni pogosto uporabljala.

V drugi igri (Wolfpack) pa sta morala igralca sodelovati. Lovila sta plen, točke od ujetega plena pa je dobil lovec in tudi tisti, ki je bil v trenutku ujetja dovolj blizu. Umetna inteligenca je hitro ugotovila, da je smiselno sodelovati. In res, pametnejša umetna inteligenca je sodelovala v večji meri, torej ravno obratno kot v zgornjem primeru. V tem primeru je namreč sodelovanje terjalo večjo računsko moč, zato si ga je v večjem obsegu privoščila boljša umetna inteligenca.

Morda se zdijo rezultati trivialni in pričakovani, a ni čisto tako. DeepMind je pokazal, da je mogoče z moderno umetno inteligenco raziskovati stara vprašanja družbenega sodelovanja in skrivnost njegovega nastanka v zgodovini. Takšni modeli so uporabni tudi za testiranje različnih ukrepov in subvencij, ki imajo v moderni, kompleksni in prepleteni družbi težko napovedljive učinke.