DeepMindovi boti v Starcraftu 2 premagujejo profesionalce

Jurij Kristan

26. jan 2019 ob 10:45:28

Algoritem AlphaStar, ki so ga napravili v Alphabetovem laboratoriju DeepMind, je v igri Starcraft 2 z desetimi zmagami v enajstih dvobojih odpravil profesionalna igralca MaNo in TLOja, kar je prvi takšen dosežek za strojno inteligenco.

Po tem, ko se je strojna pamet lani začela bosti z najboljšimi ljudmi v Doti 2, smo vse bolj nemirno čakali na to, kaj bo laboratorij DeepMind sčaral v Starcraftu 2. In ni razočaral - v brezhibno predstavljenem dogodku je z novim algoritmom AlphaStar povozil poklicna igralca ekipe Team Liquid, Daria "TLO" Wünscha in Grzegorza "MaNa" Komincza.

AlphaStar je plod množice novih pristopov v strojnem učenju, o katerih so se podrobno razpisali. Nevronsko mrežo so začeli učiti z nadzorovanim učenjem na posnetkih iger ljudi. Nato so na osnovi dobljenega algoritma sestavili skupino agentov, ki se je pomerila v simulirani turnirski ligi. Vsak od agentov je imel za odtenek drugačen cilj od soigralcev, da so poskrbeli za raznolikost in odkrivanje samosvojih pristopov. V režimu okrepitvenega učenja so se agenti v tej ligi kalili dva tedna, v tem času pa je vsak od njih izkusil za dvesto let realnega igranja.

Prvi se je z njimi pomeril TLO in klonil z 0:5 v zmagah. Važno je omeniti, da je moral igrati z zanj neznačilno raso Protossov, ker je AlphaStar ta hip še omejen nanjo, obenem pa je stroj lahko opazoval vso njemu vidno karto naenkrat. Po drugi plati je imel umetno omejeno sposobnost odzivanja in količino možnih ukazov na minuto, da bi ga čim bolj približali človeškim zmogljivostim. Po boju s TLOjem so AI trenirali še en teden, nakar je prišel konkretnejši izziv: dvoboj z MaNo, enim najboljših Protossovskih igralcev na svetu ta hip ... ki je prav tako klonil z 0:5.

Oba človeška igralca sta bila seveda precej presenečena nad spretnostjo botov, a to je šele začetek in še ne pomeni, da AI že nadvlada ljudi. V obrobnem dvoboju so za pokušino pokazali še enega novega bota, ki je moral sam "premikati zaslon" in ga je MaNa uspel premagati, a za siceršnjim AlphaStarom ne zaostaja bistveno. V prihodnosti lahko torej najprej pričakujemo razširitev igranja na vse tri rase in vdelavo pogleda skozi omejen zorni kot za bote. Nakar vsi čakamo na bržkone neobhoden dvoboj s Serralom.