» »

Kako smo letos izgubili še v pokru

Kako smo letos izgubili še v pokru

Science Magazine - V začetku leta je umetna inteligenca z imenom Libratus na turnirju v pokru pometla s človeško konkurenco in prepričljivo ugnala štiri velemojstre. Za razliko od goja, šaha in podobnih iger je poker igra z nepopolnimi informacijami, kjer je pomemben sestavni del tudi blefiranje, kar je za računalnike velik problem. Libratus, ki je tekel na 15 milijonih jeder, se je problema lotil tako, da je sam poizkušal igrati čim popolneje, ni pa se osredotočal na poteze nasprotnikov. Minuli teden so raziskovalci, ki so Libratus razvili, objavili tudi znanstveni članek v Science, v katerem so opisali podrobnosti, kako je Libratus deloval.

Profesor na Carneige Mellon University Tuomas Sandholm in njegov doktorski študent Noam Brown pojasnjujeta, kako je Libratus v 20-dnevnem turnirju v 120.000 partijah ugnal štiri vrhunske človeške igralce, ko so mu nasproti stali Jason Les, Dong Kim, Daniel McCauley in Jimmy Chou. Libratus je bil ves čas v vodstvu, torej že od samega začetka, in ni vmes niti za trenutek popustil. Še najbližje je bilo 6. dan tekmovanju, ko se je Libratusu malo zalomilo, a je takoj za tem zelo povečal naskok in prepričljivo obdržal vodstvo do konca.

Poker ima okrog 10161 možnih kombinacij, kar je bistveno več kot je vseh atomov v vidnem vesolju (1080). Ker je to preveč, da bi bilo obvladljivo s surovo silo, je Libratus podobne igre obravnaval skupaj, ter tako število zmanjšal na znosnih 1013. Potem je oblikoval natančne strategije, kako bi odigral začetne poteze pri posameznih igrah, in približne strategije za končne korake. Ko se je igra bližala koncu, je izbrusil še končne korake za relevantne igre. Tretja strategija, ki jo je Libratus uporabljal, je bila izdelava modela, kako je njegova igra delovala proti človeškim soigralcem (doslej smo namreč govorili le o idealnih potezah). Če so ljudje storili nekaj nepredvidljivega, morebiti tudi slabega, je Libratus to vključil v svoje modele.

Strnemo torej lahko, da je imel Libratus tri algoritme: enega za splošno strategijo celotne igre, enega za strategijo konkretne situacije in korekcijskega, ki je upošteval odziv igralcev in je odpravljal šibkosti, ki bi jih ljudje videli v njegovi igri, ter izkoriščal njihove šibkosti. Libratus je uporabljal 1,35 petaflops in tekom turnirja porabil 19 milijonov ur-jeder računske moči.

Avtorja poudarjata, da gre za splošno umetno inteligenco, ki ni omejena le na igranje pokra (kot je bil AlphaGo omejen le na go). Ker je tudi v resničnem svetu cel kup informacij ne znan, podobno kot pri pokru, je to logično in pričakovano.

30 komentarjev

vostok_1 ::

Ožajo se stene počasi.
There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21

mgermo ::

But can he do this

StarMafijec ::

Spomnim se, kako so mi profesionalni pokeraši še pred leti zagotavljali, da računalnik nikdar ne bo premagal človeka v pokru in da bodo tako lahko vedno nalinijsko služili denar.

SimplyMiha ::

Človek lahko premaga stroj samo pri eni stvari...

Pri delanju napak.

kow ::

Drzi. Tezko je razumeti kako je povprecen clovek naiven. Tisocletja indoktrinacije o posebnem statusu cloveka (nad zivaljo) nam je popolnoma zameglilo razum.

mihec87 ::

Zanima me kako bi zgledala igra če bi jo igrala dva(ali še bolje več njih) libratus-a med sabo

tikitoki ::

Hmm, igra pri kateri je preracunavanje moznosti je bolj primerna za super racunalnik. Le kdo bi si mislil.

tikitoki je izjavil:

Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.

Zgodovina sprememb…

  • spremenilo: tikitoki ()

Markoff ::

SimplyMiha je izjavil:

Človek lahko premaga stroj samo pri eni stvari...

Pri delanju napak.

Pa še to ne za dolgo.
Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021

nevone ::

SimplyMiha je izjavil:

Človek lahko premaga stroj samo pri eni stvari...

Pri delanju napak.


In vendarle so vsi ti breznapačni stroji delo človeka.

Saj ni treba iz ene skrajnosti v drugo padat.

o+ nevone
Either we will eat the Space or Space will eat us.

Markoff ::

kow je izjavil:

Drzi. Tezko je razumeti kako je povprecen clovek naiven. Tisocletja indoktrinacije o posebnem statusu cloveka (nad zivaljo) nam je popolnoma zameglilo razum.

No, saj S-T forum lepo dokazuje, da religija ni primarni vir homocentričnosti. Večina visoko izobraženih naravoslovcev ni ravno verskih fanatikov, pa od njih redno dobivamo izjave, kot so: "Gre samo za brute force izračunavanja, to že ni prava inteligenca." Ali pa: "Ampak v tempatem pa računalnik zagotovo ne bo nikoli premagal računalnika." Homocentričnost je kar lepo vgrajena v nas, nekatere institucije le lepo zlorabljajo te lastnosti v svojo korist.
Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021

bMozart ::

I NEED The Point of View Gun effectible on girls too! And then...

Jst ::

Ko je izšla izvirna novica, da je padel tudi poker, smo debatirali, na kakšen način pristopiš k problemu. [bragging] Nismo se veliko zmotili...

Nekako smo se strinjali, da morajo biti osnovne komponente nekako tako:
-Ker je tako veliko kombinacij, so spisali Deep Learning algoritem, kako vse to skrčiti v obvladljivo obliko;
-Sistem ima več podsistemov;
-Pregled nad mizo (žetoni);
-Pregled nad posamezno situacijo (hand in kar je na mizi);
-Največja neznanka pa, kako "bere" nasprotnike in s tem prilagaja igro. (In tu se, poleg prve točke, skriva njihov uspeh. Očitno iz te novice.)

(To ni nič novega, by the way, problem je spisati za poker dober self-learning sistem in kako oceniti naučeno (back-propagation).)
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

BigWhale ::

tikitoki je izjavil:

Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.


Ampak igralci pokra pravijo, da je poker vec kot samo preracunavanje moznosti.

Bizkit45 ::

BigWhale je izjavil:

tikitoki je izjavil:

Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.


Ampak igralci pokra pravijo, da je poker vec kot samo preracunavanje moznosti.


to pravijo takšni, ki ne znajo računati ;)

Smurf ::

Bizkit45 je izjavil:

BigWhale je izjavil:

tikitoki je izjavil:

Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.


Ampak igralci pokra pravijo, da je poker vec kot samo preracunavanje moznosti.


to pravijo takšni, ki ne znajo računati ;)

Trik v pokru je ravno v tem, da ob istih kartah (verjetnosti), vcasih oddigras na razlicen nacin.

BigWhale ::

Smurf je izjavil:

Trik v pokru je ravno v tem, da ob istih kartah (verjetnosti), vcasih oddigras na razlicen nacin.


Seveda, ampak to ni noben AI bavbav. Profil igralca lahko nardis kr hitro in ga potem upostevas pri svoji igri.

Cervantes ::

120.000 / 20 = 6000 partij na dan.
6000 / 24 = 250/uro=6.666.. partij na minuto.
Brzopotezni poker?

Smurf ::

@BigWhale of course, samo povdaril sem, da je potrebno malce vec, kot zgolj racunanje verjetnosti v dani situaciji.

@Cervantes verjetno so igrali na vecih mizah vzporedno (ta dobrim igralcem ni problema igrati na 10-20 mizah hkrati).

Zgodovina sprememb…

  • spremenil: Smurf ()

wechta ::

Super. Čez 5 let boš lahko na laptopu pognal bota, ki bo takole odšpilal na online poker placih.

mgermo ::

Ne boš, ker na takih poker placih človek ne bo igral.

wechta ::

Sej ne boš vedel..

shotalick ::

wechta je izjavil:

Super. Čez 5 let boš lahko na laptopu pognal bota, ki bo takole odšpilal na online poker placih.


Boti so že sedaj problem na online "poker placih".

jype ::

vostok_1 je izjavil:

Ožajo se stene počasi.
Ne, se ne. Širijo se, le da nekateri tega ne vidite. AI ni tekmec, proteza je.

Jst ::

V bistvu je "tool".
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

jype ::

Ja, seveda. Orodje, s katerim dosežeš višjo polico.

Phantomeye ::

Jst je izjavil:

V bistvu je "tool".


Kaj pa je proteza, če ne drugega kot namenski 'tool'?

Mavrik ::

Smurf je izjavil:

@BigWhale of course, samo povdaril sem, da je potrebno malce vec, kot zgolj racunanje verjetnosti v dani situaciji. .


Kaj pa je AI drugega kot računanje verjetnosti? In kaj pa je predvidevanje obnašanja in kart drugih igralcev drugega kot računanje verjetnosti?
The truth is rarely pure and never simple.

BigWhale ::

Mavrik je izjavil:

Kaj pa je AI drugega kot računanje verjetnosti? In kaj pa je predvidevanje obnašanja in kart drugih igralcev drugega kot računanje verjetnosti?


Ni ni! To je blefiranje! ;> Pejt prasat katergakoli poker igralca.

Funny pa je, da je un bluff k ga je zgori nekdo postal, k je sel tip all-in na crap karte. Neki kar bi proti racunalniku naredil enkrat, mogoce clo dvakrat. Na dolgi rok bi ga pa racunalnik obral. :)

mgermo ::

Ja, kot da Ivey 5 beta 52off za 200k kar rutinsko. Zelo exploitable, lol.

c3p0 ::

V pokru je blefiranje manjši del igre, kot si povprečen TV poker ekspert/gledalec misli. Tam namreč pokažejo samo najbolj zanimive hande, sploh na turnirjih, ko so blindi že ogromni.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Strojna pamet si je podredila še poker

Oddelek: Novice / Znanost in tehnologija
165182 (3299) jype
»

Človek 1, IBM Debater 1

Oddelek: Novice / Znanost in tehnologija
175590 (3978) DOOM_er
»

Kako smo letos izgubili še v pokru

Oddelek: Novice / Znanost in tehnologija
3010500 (2237) c3p0
»

Izgubili smo še v pokru (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
5616756 (13126) leiito

Več podobnih tem