» »

AI AlphaStar dosegel stopnjo velemojstra

AI AlphaStar dosegel stopnjo velemojstra

Slo-Tech - DeepMindova strojna inteligenca AlphaStar, za igranje Starcrafta 2, je "v divjini" dosegla najvišji rang - velemojster (grandmaster), in sicer z vsemi tremi rasami ter brez prirejenih igralnih razmer.

Raziskovanje strojnega učenja za svoje poligone uporablja vse zahtevnejše igre. Šahu, kjer je bila dovolj surova moč, je sledil Go, kjer je moral računalnik že razviti neko mero intuicije in strategije. Naslednja stopnja so igre z nepopolnimi informacijami in kompleksnejšimi razmerji med igralnimi enotami - kot je na primer Starcraft 2, ki so ga za izziv vzeli v Googlovem laboratoriju DeepMind. Januarja smo poročali o verziji agentov, ki so premagali profesionalna igralca TLOja in MaNo; toda dogodek je nosil važne opombe. AI je znala gledati po vsem ozemlju naenkrat, obenem pa je obvladala le Protosse in nekaj kart. Manj kot leto dni je trajalo, da je z opisane stopnje prešla na polnopravno sodelovanje na online strežnikih in se prebila v zgornji poldrugi promil (človeških) igralcev.

Pot do tja razkriva zanimive podrobnosti o napredku trenutno najbolj razširjenih načinov strojnega učenja. DeepMind, podobno kot OpenAI, krčevito prisega na globoke konvolucijske nevronske mreže v kombinaciji s posnemanjem in nadzorovanim ter utrjevanim učenjem. Pristop ima v najosnovnejši obliki velike hibe, ko naleti na kompleksne sisteme z neenakimi objekti, kot je na primer igra kamen-škarje-papir. Ko strojni agenti igrajo sami s seboj v takšnem režimu, so namreč nagnjeni k preveliki specializaciji in pozabljanju preteklih strategij, zaradi česar jih je zelo enostavno nadigrati s spremembo pristopa. V DeepMindu so se temu zoperstavili s treningom v virtualnih ligah, kjer so bili strojni agenti nenehno soočeni z množico rahlo različnih si nasprotnikov - od katerih so bili nekateri (tako imenovani exploiters) načrtno oblikovani za izkoriščanje njihovih lukenj v igranju. Tako so bile strojne pameti prisiljene ohraniti širok izbor sposobnosti.

Preden so takšne sorte AlphaStarja spustili na internet, so ga tudi dodobra omejili, da je bil po surovih zmogljivostih čim bližje človeku. Zgornja meja je bila 22 ukazov v intervalu petih sekund, računalnik pa je moral obenem tudi sam premikati zaslon, česar januarja še ni počel. Julija so tako igralci na evropskih strežnikih ugledali opcijo za igranje z umetno inteligenco. Ta je igrala anonimno, a so jo med eksperimentom nekajkrat vseeno zasačili, zato so morali v laboratoriju večkrat menjati uporabniška imena. Zadnja inačica se je nato na evropskem strežniku vendarle z vsemi tremi rasami prebila na najvišjo stopnjo - velemojstra (grandmaster), v zgornjega 0,15 procenta. Človeški igralci pravijo, da jo je bilo zgolj skozi igro zelo težko identificirati.

Raziskovalci so podrobne rezultate in delovanje agentov objavili v reviji Nature. (V uvodnem članku na DeepMindovem blogu stoji povezava na odprto verzijo ter posnetke.) Pravijo, da je s tem izziv zanje končan, kar pa je že sprožilo več pomislekov. Kot prvo, najboljšega človeškega igralca - Serrala - AlphaStar ob srečanjih še vedno ni uspel premagati. In kot drugo je pomenljivo, da so v laboratoriju največ truda usmerili v prilagajanje načinov učenja, medtem ko same arhitekture nevronskih mrež niso bistveno spreminjali, čeprav kitajske raziskave vse bolj kažejo, da se v kombiniranju konvolucijskih z drugimi oblikami skriva še ogromno rezerve. Tako smo v glavnem dobili novo poglobljeno študijo interkacije med podobnimi agenti, ki kažejo, kako okolica z izzivi nenehno izboljšuje naše sposobnosti.

6 komentarjev

kuglvinkl ::

E bravo: kako okolica z izzivi nenehno izboljšuje naše sposobnosti

... je 21st century ugotovitev za, kar te ne ubije, te naredi mocnejsega.
Your focus determines your reallity

bajsibajsi ::

AlphaStar vs Serral je eden izmed slabsih prikazov kaj AlphaScam zmore. Ne zato, ker je Serral top igralec, ampak ker je igrala neka cudna verzija AlphaStar. AI je za brezveze izgubil vec medivacov, kot bi jih izgubil plat/dia igralec.

kow ::

Kaj je naslednja rec...

Zgodovina sprememb…

  • spremenil: kow ()

Netrunner ::

Še par let do skyneta
Doing nothing is very hard to do... you never know when you're finished.

osternik324 ::

Definitivno je fajn, da urijo svoje znanje v razvoju umetne inteligence, a bolje ni bilo, če bi razvoj namenili nekim bolj praktičnim stvarem in aplikacijam, kot pa igranju iger...

TheBlueOne ::

Kaj ti mislis, da za tem Googlovim projektom stoji par mulcev, ki trmasto hocejo zmagati samo v igrah? Ne bodite tako naivni...

bajsibajsi je izjavil:

AlphaStar vs Serral je eden izmed slabsih prikazov kaj AlphaScam zmore. Ne zato, ker je Serral top igralec, ampak ker je igrala neka cudna verzija AlphaStar. AI je za brezveze izgubil vec medivacov, kot bi jih izgubil plat/dia igralec.


Ne vem, ce jih je izgubil brezveze. Serral zelo hitro dominira v map control in tudi zelo hitro prestreza groznje, hitro reagira itn. Ce se prav spomnem mu je ze na zacetku pocistil enega reaperja, ko ga je pricakal na klifu.

Tile medivaci bi v vecini primerov verjetno lepo preziveli v tej igri pa so bili prakticno takoj pod njimi zerglingi, tako da niso nikakor prisli na svoje.

Zgodovina sprememb…



Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Googlov DeepMind napoveduje odpoved ledvic

Oddelek: Novice / Znanost in tehnologija
55426 (4240) Markoff
»

DeepMindovi boti v Starcraftu 2 premagujejo profesionalce (strani: 1 2 3 4 5 )

Oddelek: Novice / Znanost in tehnologija
20642221 (37693) TheBlueOne
»

WaveNet: strojno učenje za sintezo govora

Oddelek: Novice / Znanost in tehnologija
225850 (3750) Jst

Več podobnih tem