vir: openai.com
Pretekli konec tedna je ob robu megaturnirja v Doti 2 - The International 2018 - potekal tudi spopad med strojno inteligenco firme OpenAI in ljudmi, kjer sta zmagali človeški ekipi.
Stroji se družijo
Računalniške igre so za raziskovalce strojnega učenja nadvse hvaležno okolje za eksperimentiranje, saj predstavljajo digitalne kompleksne sisteme s striktno določenimi zakonitostmi, v katerih se strojna pamet lahko pomeri tudi s človekom in se tako od njega uči. Pretepanja vsakovrstnih botov v Quakih in drugih naslovih smo vajeni že dolgo. Zadnji krik mode v umetni inteligenci so ekipe botov, ki znajo med seboj dobro sodelovati. Alphabetov laboratorij DeepMind je tako na primer julija pokazal gručo AI agentov, ki je v Quake III Areni premagovala ljudi v načinu Capture the Flag - četudi v popreproščeni obliki.
Najbolj odmeven napredek pa se odvija v podjetju OpenAI, kjer so za poligon izbrali Doto 2. Ta je z moštveno igro petih proti petim in skrajno komplicirano igralno mehaniko kot nalašč za to, da vanjo zapremo nič hudega sluteče strojne entitete, da se mučijo v milijonih virtualno odigranih spopadov. Razvijalci so svojo robotsko ekipo poimenovali OpenAI Five, uči pa se s klasičnim okrepitvenim učenjem skozi tisoče odigranih bojev same s seboj. Njen razvoj je že kar strašljivo hiter, saj je zgolj od letošnjega maja pa do začetka avgusta prešla od premagovanja človeških igralcev znotraj laboratorija do mlatenja nekdanjih profesionalnih ešportnikov, ko je na dogodku Benchmark slavila nad človeško peterico iz vrhnje polovice promila najboljših v Doti 2.
Toda situacija za organizme iz mesa in krvi še ni tako kritična, saj OpenAI Five igra z nekaterimi umetnimi olajševalnimi okoliščinami. Na igralno polje ne gleda kot človek, temveč uporablja Valvov vmesnik Bot API. Predvsem pa so močno poenostavili nekatere ključne igralne elemente. Izbor herojev je močno omejen in botom še ni potrebno skozi fazo njihove izbire pred posamezno tekmo. Skrčen je tudi spisek opreme, ki jo junaki dobijo med igro, predvsem pa so imeli boti doslej na razpolago neumrljive kurirje, ki so jim prinašali opremo na njihovo pozicijo na karti, kar jim je omogočalo zelo napadalne pristope.
Uri resnice
Na turnirju The International 2018 v kanadskem Vancouvru, ki predstavlja vrhunec letošnje sezone Dote 2, sta se ekshibicijski bitki med računalnikom in človekom odvili 22. in 23. avgusta. Pozornost sta vzbudili predvsem zaradi dvojega: prvega merjenja OpenAI Five z najboljšimi človeškimi igralci in pa dejstva, da so razvijalci z liste olajšav odstranili omenjene neuničljive kurirje.
V obeh tekmah sta človeški moštvi slavili, toda promet po kartah je bil daleč od enosmernega. Prvi match z brazilsko ekipo PaiN Gaming, ki je tudi sicer tekmovala na turnirju, je trajal 51 minut, kar je več od povprečja. V drugi se je stroj zoperstavil gruči legendarnih kitajskih veteranov, ki so se zbrali pod imenom Big God, in klonil po 45 minutah. V obeh primerih je OpenAI Five pokazal veliko spretnosti v neposrednih obračunih herojev s heroji, zaradi česar je imel praviloma več ubitih nasprotnikov. A v zaključkih je klonil zaradi superiorne strateške igre ljudi, ki so bolje nadzorovali ključne točke na karti in s tem pridobili prednost, s katero so v končni fazi uničili sovražno postojanko in zmagali.
Do naslednjič
Če povzamemo: strojna pamet ima prednost v elementih, kjer pride do izraza hitrejše odzivanje računalnika: pri metanju specialk, reagiranju na nenadne napade in mikrogibanju. Intuitivno razumevanje poteka igre na strateški ravni pa še vedno bolje obvlada človek.
Pri OpenAI (na sliki pozirajo občinstvu na TI2018) menijo, da porazoma ni botrovala sama odstranitev neranljivih kurirjev, temveč golo dejstvo, da so svojo AI pričeli v tem režimu trenirati borih šest dni pred turnirjem. Predvsem so nadvse veseli, da je Five končno spoznal najboljše ljudi na planetu in so že identificirali spisek slabosti, ki jih morajo odstraniti. Za naslednje leto napovedujejo mnogo močnejšo verzijo. Za katero upajmo, da se ne bo priučila tudi maščevalnosti.