Kako smo letos izgubili še v pokru @ Slo-Tech

Novice » Znanost in tehnologija »
Kako smo letos izgubili še v pokru

Kako smo letos izgubili še v pokru

Matej Huš :: 26. dec 2017 ob 20:01
Znanost in tehnologija

Science Magazine - V začetku leta je umetna inteligenca z imenom Libratus na turnirju v pokru pometla s človeško konkurenco in prepričljivo ugnala štiri velemojstre. Za razliko od goja, šaha in podobnih iger je poker igra z nepopolnimi informacijami, kjer je pomemben sestavni del tudi blefiranje, kar je za računalnike velik problem. Libratus, ki je tekel na 15 milijonih jeder, se je problema lotil tako, da je sam poizkušal igrati čim popolneje, ni pa se osredotočal na poteze nasprotnikov. Minuli teden so raziskovalci, ki so Libratus razvili, objavili tudi znanstveni članek v Science, v katerem so opisali podrobnosti, kako je Libratus deloval.

Profesor na Carneige Mellon University Tuomas Sandholm in njegov doktorski študent Noam Brown pojasnjujeta, kako je Libratus v 20-dnevnem turnirju v 120.000 partijah ugnal štiri vrhunske človeške igralce, ko so mu nasproti stali Jason Les, Dong Kim, Daniel McCauley in Jimmy Chou. Libratus je bil ves čas v vodstvu, torej že od samega začetka, in ni vmes niti za trenutek popustil. Še najbližje je bilo 6. dan tekmovanju, ko se je Libratusu malo zalomilo, a je takoj za tem zelo povečal naskok in prepričljivo obdržal vodstvo do konca.

Poker ima okrog 10¹⁶¹ možnih kombinacij, kar je bistveno več kot je vseh atomov v vidnem vesolju (10⁸⁰). Ker je to preveč, da bi bilo obvladljivo s surovo silo, je Libratus podobne igre obravnaval skupaj, ter tako število zmanjšal na znosnih 10¹³. Potem je oblikoval natančne strategije, kako bi odigral začetne poteze pri posameznih igrah, in približne strategije za končne korake. Ko se je igra bližala koncu, je izbrusil še končne korake za relevantne igre. Tretja strategija, ki jo je Libratus uporabljal, je bila izdelava modela, kako je njegova igra delovala proti človeškim soigralcem (doslej smo namreč govorili le o idealnih potezah). Če so ljudje storili nekaj nepredvidljivega, morebiti tudi slabega, je Libratus to vključil v svoje modele.

Strnemo torej lahko, da je imel Libratus tri algoritme: enega za splošno strategijo celotne igre, enega za strategijo konkretne situacije in korekcijskega, ki je upošteval odziv igralcev in je odpravljal šibkosti, ki bi jih ljudje videli v njegovi igri, ter izkoriščal njihove šibkosti. Libratus je uporabljal 1,35 petaflops in tekom turnirja porabil 19 milijonov ur-jeder računske moči.

Avtorja poudarjata, da gre za splošno umetno inteligenco, ki ni omejena le na igranje pokra (kot je bil AlphaGo omejen le na go). Ker je tudi v resničnem svetu cel kup informacij ne znan, podobno kot pri pokru, je to logično in pričakovano.

30 komentarjev

vostok_1 :: 26. dec 2017, 20:11

Ožajo se stene počasi.

There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21

mgermo :: 26. dec 2017, 20:33

But can he do this

StarMafijec :: 26. dec 2017, 21:02

Spomnim se, kako so mi profesionalni pokeraši še pred leti zagotavljali, da računalnik nikdar ne bo premagal človeka v pokru in da bodo tako lahko vedno nalinijsko služili denar.

SimplyMiha :: 26. dec 2017, 21:05

Človek lahko premaga stroj samo pri eni stvari...

Pri delanju napak.

kow :: 26. dec 2017, 21:06

Drzi. Tezko je razumeti kako je povprecen clovek naiven. Tisocletja indoktrinacije o posebnem statusu cloveka (nad zivaljo) nam je popolnoma zameglilo razum.

mihec87 :: 26. dec 2017, 21:06

Zanima me kako bi zgledala igra če bi jo igrala dva(ali še bolje več njih) libratus-a med sabo

tikitoki :: 26. dec 2017, 21:10

Hmm, igra pri kateri je preracunavanje moznosti je bolj primerna za super racunalnik. Le kdo bi si mislil.

tikitoki je 26. dec 2017 ob 21:10 izjavil:

Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.

Zgodovina sprememb…

spremenilo: tikitoki (26. dec 2017 ob 21:11)

Markoff :: 26. dec 2017, 23:56

SimplyMiha je 26. dec 2017 ob 21:05 izjavil:

Človek lahko premaga stroj samo pri eni stvari...

Pri delanju napak.

Pa še to ne za dolgo.

Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021

nevone :: 27. dec 2017, 00:02

SimplyMiha je 26. dec 2017 ob 21:05 izjavil:

Človek lahko premaga stroj samo pri eni stvari...

Pri delanju napak.

In vendarle so vsi ti breznapačni stroji delo človeka.

Saj ni treba iz ene skrajnosti v drugo padat.

o+ nevone

Either we will eat the Space or Space will eat us.

Markoff :: 27. dec 2017, 00:03

kow je 26. dec 2017 ob 21:06 izjavil:

Drzi. Tezko je razumeti kako je povprecen clovek naiven. Tisocletja indoktrinacije o posebnem statusu cloveka (nad zivaljo) nam je popolnoma zameglilo razum.

No, saj S-T forum lepo dokazuje, da religija ni primarni vir homocentričnosti. Večina visoko izobraženih naravoslovcev ni ravno verskih fanatikov, pa od njih redno dobivamo izjave, kot so: "Gre samo za brute force izračunavanja, to že ni prava inteligenca." Ali pa: "Ampak v tempatem pa računalnik zagotovo ne bo nikoli premagal računalnika." Homocentričnost je kar lepo vgrajena v nas, nekatere institucije le lepo zlorabljajo te lastnosti v svojo korist.

bMozart :: 27. dec 2017, 05:34

Ray Kurzweil - Human-Level AI is Just 12 Years Away (2017)

En boljših intervjuev z njemu.

I NEED The Point of View Gun effectible on girls too! And then...

Jst :: 27. dec 2017, 10:14

Ko je izšla izvirna novica, da je padel tudi poker, smo debatirali, na kakšen način pristopiš k problemu. [bragging] Nismo se veliko zmotili...

Nekako smo se strinjali, da morajo biti osnovne komponente nekako tako:
-Ker je tako veliko kombinacij, so spisali Deep Learning algoritem, kako vse to skrčiti v obvladljivo obliko;
-Sistem ima več podsistemov;
-Pregled nad mizo (žetoni);
-Pregled nad posamezno situacijo (hand in kar je na mizi);
-Največja neznanka pa, kako "bere" nasprotnike in s tem prilagaja igro. (In tu se, poleg prve točke, skriva njihov uspeh. Očitno iz te novice.)

(To ni nič novega, by the way, problem je spisati za poker dober self-learning sistem in kako oceniti naučeno (back-propagation).)

Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

BigWhale :: 27. dec 2017, 10:25

tikitoki je 26. dec 2017 ob 21:10 izjavil:

Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.

Ampak igralci pokra pravijo, da je poker vec kot samo preracunavanje moznosti.

Bizkit45 :: 27. dec 2017, 10:35

BigWhale je 27. dec 2017 ob 10:25 izjavil:

tikitoki je 26. dec 2017 ob 21:10 izjavil:
Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.

Ampak igralci pokra pravijo, da je poker vec kot samo preracunavanje moznosti.

to pravijo takšni, ki ne znajo računati ;)

Smurf :: 27. dec 2017, 11:05

Bizkit45 je 27. dec 2017 ob 10:35 izjavil:

BigWhale je 27. dec 2017 ob 10:25 izjavil:
tikitoki je 26. dec 2017 ob 21:10 izjavil:
Hmm, igra pri kateri je preracunavanje moznosti pomembno je bolj primerna za super racunalnik. Le kdo bi si mislil.

Ampak igralci pokra pravijo, da je poker vec kot samo preracunavanje moznosti.

to pravijo takšni, ki ne znajo računati ;)

Trik v pokru je ravno v tem, da ob istih kartah (verjetnosti), vcasih oddigras na razlicen nacin.

BigWhale :: 27. dec 2017, 20:50

Smurf je 27. dec 2017 ob 11:05 izjavil:

Trik v pokru je ravno v tem, da ob istih kartah (verjetnosti), vcasih oddigras na razlicen nacin.

Seveda, ampak to ni noben AI bavbav. Profil igralca lahko nardis kr hitro in ga potem upostevas pri svoji igri.

Cervantes :: 27. dec 2017, 22:25

120.000 / 20 = 6000 partij na dan.
6000 / 24 = 250/uro=6.666.. partij na minuto.
Brzopotezni poker?

Smurf :: 28. dec 2017, 08:38

@BigWhale of course, samo povdaril sem, da je potrebno malce vec, kot zgolj racunanje verjetnosti v dani situaciji.

@Cervantes verjetno so igrali na vecih mizah vzporedno (ta dobrim igralcem ni problema igrati na 10-20 mizah hkrati).

Zgodovina sprememb…

spremenil: Smurf (28. dec 2017 ob 08:39)

wechta :: 28. dec 2017, 09:00

Super. Čez 5 let boš lahko na laptopu pognal bota, ki bo takole odšpilal na online poker placih.

mgermo :: 28. dec 2017, 09:06

Ne boš, ker na takih poker placih človek ne bo igral.

wechta :: 28. dec 2017, 10:45

Sej ne boš vedel..

shotalick :: 28. dec 2017, 12:56

wechta je 28. dec 2017 ob 09:00 izjavil:

Super. Čez 5 let boš lahko na laptopu pognal bota, ki bo takole odšpilal na online poker placih.

Boti so že sedaj problem na online "poker placih".

jype :: 28. dec 2017, 12:58

vostok_1 je 26. dec 2017 ob 20:11 izjavil:

Ožajo se stene počasi.

Ne, se ne. Širijo se, le da nekateri tega ne vidite. AI ni tekmec, proteza je.

Jst :: 28. dec 2017, 19:00

V bistvu je "tool".

Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

jype :: 28. dec 2017, 19:01

Ja, seveda. Orodje, s katerim dosežeš višjo polico.

Phantomeye :: 31. dec 2017, 15:01

Jst je 28. dec 2017 ob 19:00 izjavil:

V bistvu je "tool".

Kaj pa je proteza, če ne drugega kot namenski 'tool'?

Mavrik :: 31. dec 2017, 15:45

Smurf je 28. dec 2017 ob 08:38 izjavil:

@BigWhale of course, samo povdaril sem, da je potrebno malce vec, kot zgolj racunanje verjetnosti v dani situaciji. .

Kaj pa je AI drugega kot računanje verjetnosti? In kaj pa je predvidevanje obnašanja in kart drugih igralcev drugega kot računanje verjetnosti?

The truth is rarely pure and never simple.

BigWhale :: 31. dec 2017, 19:55

Mavrik je 31. dec 2017 ob 15:45 izjavil:

Kaj pa je AI drugega kot računanje verjetnosti? In kaj pa je predvidevanje obnašanja in kart drugih igralcev drugega kot računanje verjetnosti?

Ni ni! To je blefiranje! ;> Pejt prasat katergakoli poker igralca.

Funny pa je, da je un bluff k ga je zgori nekdo postal, k je sel tip all-in na crap karte. Neki kar bi proti racunalniku naredil enkrat, mogoce clo dvakrat. Na dolgi rok bi ga pa racunalnik obral. :)

mgermo :: 31. dec 2017, 21:41

Ja, kot da Ivey 5 beta 52off za 200k kar rutinsko. Zelo exploitable, lol.

c3p0 :: 1. jan 2018, 10:55

V pokru je blefiranje manjši del igre, kot si povprečen TV poker ekspert/gledalec misli. Tam namreč pokažejo samo najbolj zanimive hande, sploh na turnirjih, ko so blindi že ogromni.

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Strojna pamet si je podredila še poker Aggressor Oddelek: Novice / Znanost in tehnologija	16	6186 (4303)	jype 15. jul 2019 08:00:06
»	Človek 1, IBM Debater 1 McHusch Oddelek: Novice / Znanost in tehnologija	17	6599 (4987)	DOOM_er 21. jun 2018 09:21:30
»	Kako smo letos izgubili še v pokru McHusch Oddelek: Novice / Znanost in tehnologija	30	12629 (4366)	c3p0 1. jan 2018 10:55:13
»	Izgubili smo še v pokru (strani: 1 2 ) McHusch Oddelek: Novice / Znanost in tehnologija	56	20662 (17032)	leiito 10. mar 2017 14:12:49

Več podobnih tem

Novice » Znanost in tehnologija » Kako smo letos izgubili še v pokru

Kako smo letos izgubili še v pokru

vostok_1 :: 26. dec 2017, 20:11

mgermo :: 26. dec 2017, 20:33

StarMafijec :: 26. dec 2017, 21:02

SimplyMiha :: 26. dec 2017, 21:05

kow :: 26. dec 2017, 21:06

mihec87 :: 26. dec 2017, 21:06

tikitoki :: 26. dec 2017, 21:10

Markoff :: 26. dec 2017, 23:56

nevone :: 27. dec 2017, 00:02

Markoff :: 27. dec 2017, 00:03

bMozart :: 27. dec 2017, 05:34

Jst :: 27. dec 2017, 10:14

BigWhale :: 27. dec 2017, 10:25

Bizkit45 :: 27. dec 2017, 10:35

Smurf :: 27. dec 2017, 11:05

BigWhale :: 27. dec 2017, 20:50

Cervantes :: 27. dec 2017, 22:25

Smurf :: 28. dec 2017, 08:38

wechta :: 28. dec 2017, 09:00

mgermo :: 28. dec 2017, 09:06

wechta :: 28. dec 2017, 10:45

shotalick :: 28. dec 2017, 12:56

jype :: 28. dec 2017, 12:58

Jst :: 28. dec 2017, 19:00

jype :: 28. dec 2017, 19:01

Phantomeye :: 31. dec 2017, 15:01

Mavrik :: 31. dec 2017, 15:45

BigWhale :: 31. dec 2017, 19:55

mgermo :: 31. dec 2017, 21:41

c3p0 :: 1. jan 2018, 10:55

Vredno ogleda ...

Izgubili smo še v pokru (strani: 1 2 )

Novice » Znanost in tehnologija »
Kako smo letos izgubili še v pokru