Science Magazine - V začetku leta je umetna inteligenca z imenom Libratus na turnirju v pokru pometla s človeško konkurenco in prepričljivo ugnala štiri velemojstre. Za razliko od goja, šaha in podobnih iger je poker igra z nepopolnimi informacijami, kjer je pomemben sestavni del tudi blefiranje, kar je za računalnike velik problem. Libratus, ki je tekel na 15 milijonih jeder, se je problema lotil tako, da je sam poizkušal igrati čim popolneje, ni pa se osredotočal na poteze nasprotnikov. Minuli teden so raziskovalci, ki so Libratus razvili, objavili tudi znanstveni članek v Science, v katerem so opisali podrobnosti, kako je Libratus deloval.
Profesor na Carneige Mellon University Tuomas Sandholm in njegov doktorski študent Noam Brown pojasnjujeta, kako je Libratus v 20-dnevnem turnirju v 120.000 partijah ugnal štiri vrhunske človeške igralce, ko so mu nasproti stali Jason Les, Dong Kim, Daniel McCauley in Jimmy Chou. Libratus je bil ves čas v vodstvu, torej že od samega začetka, in ni vmes niti za trenutek popustil. Še najbližje je bilo 6. dan tekmovanju, ko se je Libratusu malo zalomilo, a je takoj za tem zelo povečal naskok in prepričljivo obdržal vodstvo do konca.
Poker ima okrog 10161 možnih kombinacij, kar je bistveno več kot je vseh atomov v vidnem vesolju (1080). Ker je to preveč, da bi bilo obvladljivo s surovo silo, je Libratus podobne igre obravnaval skupaj, ter tako število zmanjšal na znosnih 1013. Potem je oblikoval natančne strategije, kako bi odigral začetne poteze pri posameznih igrah, in približne strategije za končne korake. Ko se je igra bližala koncu, je izbrusil še končne korake za relevantne igre. Tretja strategija, ki jo je Libratus uporabljal, je bila izdelava modela, kako je njegova igra delovala proti človeškim soigralcem (doslej smo namreč govorili le o idealnih potezah). Če so ljudje storili nekaj nepredvidljivega, morebiti tudi slabega, je Libratus to vključil v svoje modele.
Strnemo torej lahko, da je imel Libratus tri algoritme: enega za splošno strategijo celotne igre, enega za strategijo konkretne situacije in korekcijskega, ki je upošteval odziv igralcev in je odpravljal šibkosti, ki bi jih ljudje videli v njegovi igri, ter izkoriščal njihove šibkosti. Libratus je uporabljal 1,35 petaflops in tekom turnirja porabil 19 milijonov ur-jeder računske moči.
Avtorja poudarjata, da gre za splošno umetno inteligenco, ki ni omejena le na igranje pokra (kot je bil AlphaGo omejen le na go). Ker je tudi v resničnem svetu cel kup informacij ne znan, podobno kot pri pokru, je to logično in pričakovano.
Novice » Znanost in tehnologija » Kako smo letos izgubili še v pokru
vostok_1 ::
Ožajo se stene počasi.
There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21
StarMafijec ::
Spomnim se, kako so mi profesionalni pokeraši še pred leti zagotavljali, da računalnik nikdar ne bo premagal človeka v pokru in da bodo tako lahko vedno nalinijsko služili denar.
kow ::
Drzi. Tezko je razumeti kako je povprecen clovek naiven. Tisocletja indoktrinacije o posebnem statusu cloveka (nad zivaljo) nam je popolnoma zameglilo razum.
mihec87 ::
Zanima me kako bi zgledala igra če bi jo igrala dva(ali še bolje več njih) libratus-a med sabo
tikitoki ::
Hmm, igra pri kateri je preracunavanje moznosti je bolj primerna za super racunalnik. Le kdo bi si mislil.
Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.
Zgodovina sprememb…
- spremenilo: tikitoki ()
Markoff ::
SimplyMiha je izjavil:
Človek lahko premaga stroj samo pri eni stvari...
Pri delanju napak.
Pa še to ne za dolgo.
Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021
nevone ::
SimplyMiha je izjavil:
Človek lahko premaga stroj samo pri eni stvari...
Pri delanju napak.
In vendarle so vsi ti breznapačni stroji delo človeka.
Saj ni treba iz ene skrajnosti v drugo padat.
o+ nevone
Either we will eat the Space or Space will eat us.
Markoff ::
Drzi. Tezko je razumeti kako je povprecen clovek naiven. Tisocletja indoktrinacije o posebnem statusu cloveka (nad zivaljo) nam je popolnoma zameglilo razum.
No, saj S-T forum lepo dokazuje, da religija ni primarni vir homocentričnosti. Večina visoko izobraženih naravoslovcev ni ravno verskih fanatikov, pa od njih redno dobivamo izjave, kot so: "Gre samo za brute force izračunavanja, to že ni prava inteligenca." Ali pa: "Ampak v tempatem pa računalnik zagotovo ne bo nikoli premagal računalnika." Homocentričnost je kar lepo vgrajena v nas, nekatere institucije le lepo zlorabljajo te lastnosti v svojo korist.
Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021
Jst ::
Ko je izšla izvirna novica, da je padel tudi poker, smo debatirali, na kakšen način pristopiš k problemu. [bragging] Nismo se veliko zmotili...
Nekako smo se strinjali, da morajo biti osnovne komponente nekako tako:
-Ker je tako veliko kombinacij, so spisali Deep Learning algoritem, kako vse to skrčiti v obvladljivo obliko;
-Sistem ima več podsistemov;
-Pregled nad mizo (žetoni);
-Pregled nad posamezno situacijo (hand in kar je na mizi);
-Največja neznanka pa, kako "bere" nasprotnike in s tem prilagaja igro. (In tu se, poleg prve točke, skriva njihov uspeh. Očitno iz te novice.)
(To ni nič novega, by the way, problem je spisati za poker dober self-learning sistem in kako oceniti naučeno (back-propagation).)
Nekako smo se strinjali, da morajo biti osnovne komponente nekako tako:
-Ker je tako veliko kombinacij, so spisali Deep Learning algoritem, kako vse to skrčiti v obvladljivo obliko;
-Sistem ima več podsistemov;
-Pregled nad mizo (žetoni);
-Pregled nad posamezno situacijo (hand in kar je na mizi);
-Največja neznanka pa, kako "bere" nasprotnike in s tem prilagaja igro. (In tu se, poleg prve točke, skriva njihov uspeh. Očitno iz te novice.)
(To ni nič novega, by the way, problem je spisati za poker dober self-learning sistem in kako oceniti naučeno (back-propagation).)
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
BigWhale ::
Bizkit45 ::
Smurf ::
Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.
Ampak igralci pokra pravijo, da je poker vec kot samo preracunavanje moznosti.
to pravijo takšni, ki ne znajo računati ;)
Trik v pokru je ravno v tem, da ob istih kartah (verjetnosti), vcasih oddigras na razlicen nacin.
BigWhale ::
Cervantes ::
120.000 / 20 = 6000 partij na dan.
6000 / 24 = 250/uro=6.666.. partij na minuto.
Brzopotezni poker?
6000 / 24 = 250/uro=6.666.. partij na minuto.
Brzopotezni poker?
Smurf ::
@BigWhale of course, samo povdaril sem, da je potrebno malce vec, kot zgolj racunanje verjetnosti v dani situaciji.
@Cervantes verjetno so igrali na vecih mizah vzporedno (ta dobrim igralcem ni problema igrati na 10-20 mizah hkrati).
@Cervantes verjetno so igrali na vecih mizah vzporedno (ta dobrim igralcem ni problema igrati na 10-20 mizah hkrati).
Zgodovina sprememb…
- spremenil: Smurf ()
wechta ::
Super. Čez 5 let boš lahko na laptopu pognal bota, ki bo takole odšpilal na online poker placih.
shotalick ::
jype ::
Jst ::
V bistvu je "tool".
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
Phantomeye ::
Mavrik ::
@BigWhale of course, samo povdaril sem, da je potrebno malce vec, kot zgolj racunanje verjetnosti v dani situaciji. .
Kaj pa je AI drugega kot računanje verjetnosti? In kaj pa je predvidevanje obnašanja in kart drugih igralcev drugega kot računanje verjetnosti?
The truth is rarely pure and never simple.
BigWhale ::
Kaj pa je AI drugega kot računanje verjetnosti? In kaj pa je predvidevanje obnašanja in kart drugih igralcev drugega kot računanje verjetnosti?
Ni ni! To je blefiranje! ;> Pejt prasat katergakoli poker igralca.
Funny pa je, da je un bluff k ga je zgori nekdo postal, k je sel tip all-in na crap karte. Neki kar bi proti racunalniku naredil enkrat, mogoce clo dvakrat. Na dolgi rok bi ga pa racunalnik obral. :)
c3p0 ::
V pokru je blefiranje manjši del igre, kot si povprečen TV poker ekspert/gledalec misli. Tam namreč pokažejo samo najbolj zanimive hande, sploh na turnirjih, ko so blindi že ogromni.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Strojna pamet si je podredila še pokerOddelek: Novice / Znanost in tehnologija | 5516 (3633) | jype |
» | Človek 1, IBM Debater 1Oddelek: Novice / Znanost in tehnologija | 5945 (4333) | DOOM_er |
» | Kako smo letos izgubili še v pokruOddelek: Novice / Znanost in tehnologija | 11298 (3035) | c3p0 |
» | Izgubili smo še v pokru (strani: 1 2 )Oddelek: Novice / Znanost in tehnologija | 18145 (14515) | leiito |