» »

Računalnik in človek v pokru statistično izenačena

Računalnik in človek v pokru statistično izenačena

Tuomas Sandholm s CMU

Slo-Tech - V Pittsburghu se je v Rivers Casino končalo dvotedensko tekmovanje v pokru, kjer je Claudico, najzmogljivejši računalniški program za igranje pokra, igral poker (Heads-Up No-limit Texas Hold'em) proti štirim izmed deseterice najboljših svetovnih igralcev. Na koncu je po so skoraj 80.000 partijah Claudico (z vsakim igralcem 20.000) zaostajal tako malo, da razlika ni statistično pomembna. Čeprav je človek torej zmagal, lahko zaključimo, da so računalniki po šahu človeške sposobnosti dohiteli še v pokru.

Claudico je dopolnjena verzija Tartaniana 7, ki je lanskega julija pometel z računalniško konkurenco. Razvijalci s Carneige Mellon University so program še dodelali in konec aprila se je pričelo dvotedensko tekmovanje, ki je trajalo do minulega petka. Vsak dan so odigrali 1500 partij (pol dopoldne, pol popoldne), vmes pa je bil en dan prost, da so si igralci malo odpočili. Skupaj torej 13 tekmovalnih dnih. Igrali so najboljši igralci sveta, vsak pa je prejel 100.000 dolarjev, tako da bi težko rekli, da je človeštvo zastopala drugorazredna ekipa ali da ji je manjkalo motivacije.

Tuomas Sandholm s CMU, ki je vodil razvoj Claudica, pojasnjuje, da je v Hold’em brez omejitev stave z dvema igralcema 10161 možnih situacij, kar je več, kot je atomov v vesolju! Enostavnejša je verzija z vnaprej omejenim naborom stav, kjer je možnosti le 1013 in je že skoraj optimalno rešena. Težja verzija pa je tako obsežna, da je Claudico uporabljal CMU-jev superračunalnik Blacklight, v katerega so vprogramirali pravila za poker, strategije pa si je moral izračunati sam.

Skupno so si štirje igralci priigrali
732.713 dolarjev več od računalnika, kar je zanemarljivo v primerjavi s 170 milijoni dolarjev, ki so bili na voljo (imaginarnega denarja, se razume!). Tako majhna razlika pomeni, da je statistično gledano računalnik enako dober kot ljudje. Igralci so povedali, da je Claudico dober, a ne najbolj vrhunski igralec (recimo stava 19.000 dolarjev, ko je na mizi 700 dolarjev, ni bila najbolj razumljiva poteza). Njegova strategija je nekoliko drugačna od človeške, poleg tega pa se seveda manj zanaša na psihološke igra in "branje" nasprotnika, temveč bolj na matematiko. Igralci priznavajo, da so zato morali igrati malce drugače, bolj "čisto" verzijo pokra.

49 komentarjev

billy ::

Kje je seznam teh poker igralcev, imam namreč občutek, da niso igrali najboljši na svetu ala Phil Ivey?

oemdzi ::

Toma Dwana težko posnema kakšen izmed računalnikov.
*Črna grafična kartica z rumeno lučko in varčnim hladilnikom*
Neslišen intel procesor iz lepe modre škatle* 2 enakomerno ploščata rama*
*overclockan napajalnik in varno ohišje z modro lučko* Hofer gamer copate*

Ales ::

billy je izjavil:

Kje je seznam teh poker igralcev, imam namreč občutek, da niso igrali najboljši na svetu ala Phil Ivey?
Na prvem linku v članku, a veš, tisto ko lahko klikneš in kaj prebereš..? >:D

Naj bi bili vsi štirje med prvih deset na svetu, Bjorn Li, Doug Polk, Dong Kim, Jason Les.

mgermo ::

Lol, kje so te našli...

billy ::

Torej nihče pretirano pameten, tako kot da bi naredili dirkalnik, oz AI, ki vozi hitreje kot dirkači F1, kot voznike pa bi dali Pereza, Hulkenberga, ipd.

gnilojabolko ::

Brezvezno. Matematicno razmisljanje je itak neka stvar v kateri je racunalnik superioren. Ce bi ta program zaznaval mimiko obraza, kretnje itn potem bi ta stvar imela nek visji pomen kot pa banalen test. Tudi z vidika da so igralci igrali "cisto" verzijo pokra pove da to je nerealno, saj je v igri pokra pomembno "branje" igralca - tako kot pise zgoraj v clanku.
To je isto kot da bi rekel naj bi zracuna pi na 2 decimalne vejice natancno in itak vsak ze v soli uci koliko je to... Test pa tak.

Master_X ::

Lol. Med prvih deset po čem? Po tem, da se jim da iz postle vstat za 100k$? Ker omenjeni Phil Ivey si še budilke ne nastavi za 100k$ :) Po global poker indexu so tile eni polamaterji, najvišje rangiran je Doug Polk na 168. mestu, ostali so 2500+ rang.

Ko bodo namesto njih tam sedeli Scott Seiver, Jason Mercier, Eric Seidel, Daniel Negreanu ipd. pol se pa lahko pogovarjajo o top poker igralcih ja.

Saj mi je zanimiva zadeva, samo naj pol nekoga top zrihtajo, Deep Blue tud ni igral proti nekemu tretjerazrednemu "nikolinihčeslišalzanjega".

StandAgainst ::

Global poker inedx jemlje v zakup vse turnirske dosežke, tukaj pa se je šlo izključno za heads up, in tile 4 so vrjetno vsi top 10 oz vsaj top 20 NLHE HU igralcev na svetu.

billy ::

Vseeno to pomeni, da so daleč od najboljšega. In če je razlika med temi in AI bila zanemarljiva, bi pravi poker pro skoraj sigurno konkretno napokal AI, ker dvomim da tile ki so igrali, imajo kaj šans proti pravim projem, pa čeprav so top20.

StandAgainst ::

Vbistvu to ne pomeni da so daleč od najboljšega, ker je lahko eden izmed njih najboljši. Je pa zelo težko reči kdo je top1,2 oz. 3. ker nemoremo (lahko le predpostavimo) vzet v zakup vsega in jih ovrednotit na eni lestvici.

Zgodovina sprememb…

Master_X ::

Em ok saj nvm, mogoče je to res taka specifika in ne rečem nič za Polka, ampak npr. Ivey pa Viktor Blom ipd. so verjetno obrnili malo več keša na (online) HU v življenju kot pa preostali trije. Ampak dobro no ok, pa hecno mi je še to, da je statistično zanemarljiva njihova zmaga. Katerikoli pro, ki mora igrati proti proju bo povedal, da je poker igra kjer proti educated playerju (pa še izjemno racionalnemu po vrhu) maš ponavadi zelo majhen edge, če ga sploh imaš. Saj menda niso ciljali, da bodo naredili "fish" bota.

Zgodovina sprememb…

  • spremenil: Master_X ()

StandAgainst ::

Statistično zanemarljiva je samo za znanstvenike, pokeraško gledano so v teh skupnih 80khandih naredili 5bb/100handov, kar iz pokeraškega vidika sploh ni mala razlika.

Glede igralcov pa ja obrnili več denarja že mogoče, samo ti ni poanta kdo ga je več obrnil ampak kdo je matematično gledano boljši. Glede edga pa imaš povsem prav.

Zgodovina sprememb…

vitac1 ::

Če bi zraven namontirali še kamero in bi Claudico spremljal še vizualne informacije, bi bila to zelo velika prednost zanj. Verjamem, da je spremljanje pulza itd. nasprotnega igralca, veliko lažje za "računalnik" kot pa za človeka. To mora biti v današnjih časih nekaj preprostega.

Žal že kar nekaj časa nisem v pokru in res ne vem kako dobri so ti igralci v HU online (se mi ne da googlat). Definitivno pa Negreana ni dober igralec v online pokru, še posebej HU (kljub temu, da je on meni ena izmed top poker osebnosti).

Kolikor vidim v članku, je dejstvo, da niti en igralec ni uspel najti leak-a v igri Claudica kar je impresivno. Tega rezultata se ne da kar tako zavreči...... .

StandAgainst ::

"Leak" je bil najden saj, so igralci AI premagali z skoraj 5% edga, kar je v pokru veliko. Kamere so bile vedno vklopljene, vsak odigran hand je bil live streaman na twichu (poker program + kamera v obraz)

Zgodovina sprememb…

metalc ::

Kolikšen je pri pokru sploh faktor sreče, se pravi, kakšne karte dobiš?

PS o pokru nimam pojma...

StandAgainst ::

Na kratek rok zna zelo varirat in ga nemoremo določiti natančno(v pokru se mu reče varijanca), če pa čas limitiramo v neskončnost pa je faktor sreče 0, in je vse odvisno znanja koliko ti use potegniti iz vsakega handa.

vitac1 ::

Nisi razumel. Cloudico ni bil sprogramiran, da "opazuje" mimiko obraza, pulz,... in obenem, da igra karte . Lahko obrneš par kamer direktno v osebo pa brez SWja v ozadju ne boš nič dosegel. Tukaj je šlo zgolj za matematiko. Omenjam iz razloga, ker je bilo rečeno višje, da dokler ni tega ni nič..... .

Kakšne leake so našli, je kje navedeno? Ja 5bb/100h je veliko ali pa tudi ne, če je igral proti TOP HU igralcih (zame ne). -5bb/100 je zame solidno za NL HU. So kje navedeni komplet rezultati? Braz BR ni ostal in to v 80 tisoč handih in to NL igre.

To igro bi bilo potrebno bolj detaljno pregledati. Na dolgi rok ima sreča minimalen vpliv na rezultat. Vprašanje pa je, kaj je dolgi rok. Bolj izenačena kot sta igralca... daljši je lahko downsvwng.

49106 ::

Na dolgi rok se poker tako spremeni, da najbolši niso več najboljši

Zgodovina sprememb…

  • spremenilo: 49106 ()

Roadkill ::

Manj kot folk ve v pokru, več ti bodo o njem razložili. Sploh taki, ki so že celo za Phila Iveya slišali. :D

Bo zanimivo videt, kako se bodo poker hiše borile proti botom.

---

Avtor je zamudil izredno priložnost, da bi omenil The Ljubljana Conspiracy, ki za vedno ostaja skrivnost v online poker svetu. :)

Izmet Fekali ftw! Pa še šumnike nam je zrihtal :)
Ü

Zgodovina sprememb…

  • spremenil: Roadkill ()

oemdzi ::

Ipoker je itak v simbiozi z boti, se ne bi čudil, če imajo še oni kakšnega svojega vmes :P Sicer pa je bot (potencialno) lahko le toliko dober kot je njegov programer, razen če je programer poker genij in gubi denar zaradi norega tilta ali nezmožnosti realnočasovnega odločanja kako odigrati hand.
*Črna grafična kartica z rumeno lučko in varčnim hladilnikom*
Neslišen intel procesor iz lepe modre škatle* 2 enakomerno ploščata rama*
*overclockan napajalnik in varno ohišje z modro lučko* Hofer gamer copate*

Relanium ::

billy je izjavil:

Torej nihče pretirano pameten, tako kot da bi naredili dirkalnik, oz AI, ki vozi hitreje kot dirkači F1, kot voznike pa bi dali Pereza, Hulkenberga, ipd.

V bistvu je čisto mogoče. Najmanjši problem je naredit avto hitrejši od F1, le da pozabiš na F1 pravilnik.
Pa tud v življenju/pokru ni treba bit preveč pameten, če le znaš blefirat :)

hamez66 ::

Če so igrali za playmoney, je čisto brezveze. Pa tudi 80k handov ni ravno veliko. 5bb/100 nikakor ni zanemarljiva vrednost.

Bolj zanimivo bi bilo, če bi se šlo za pravi denar in z več igralci za mizo.

kow ::

Hecne so te teme. Zelo hecne. Vecina vas se vedno ne steka. Masine nas bodo pojedle za zajtrk, sprijaznite se.
Pogresam Thomasa. On (nam) je ze zdavnaj razlozil.

BigWhale ::

StandAgainst je izjavil:

Na kratek rok zna zelo varirat in ga nemoremo določiti natančno(v pokru se mu reče varijanca), če pa čas limitiramo v neskončnost pa je faktor sreče 0, in je vse odvisno znanja koliko ti use potegniti iz vsakega handa.


Ampak, ali ni to znanje potem spet odvisno od srece?

Najprej moras dobiti dovolj dobre karte, to je nek pseudo random. Ce nimas boljsih kart od nasprotnika (katerega karte so odvisne od istega randoma) se moras pa dovolj dobro pretvarjat, da imas boljse karte. In potem je spet odvisno od srece, a ti bo nasprotnik verjel ali ne.

c3p0 ::

Ali pa foldat, a spet ne prepogosto, da nasprotnik ne dobi "reada".

Sicer pa 5bb/100 je veliko. Vsi, ki smo kdaj igrali poker pa vemo, da igra za playmoney ni niti približno podobna real money igri, kar je spet prednost za nekoga brez čustev. Bot je vsekakor dovolj dober, da nekomu lahko služi lepe denarce.

Po Thomasu smo zdaj že itak uploadani.

leiito ::

Če vprašaš Dnevnik, je Janko Medja, ker igra poker, degenerate gambler. Ker valjda, vse je sreča, sploh na dolgi rok.

Zgodovina sprememb…

  • predlagalo izbris: zee ()

WamPIRe- ::

StandAgainst je izjavil:

Na kratek rok zna zelo varirat in ga nemoremo določiti natančno(v pokru se mu reče varijanca), če pa čas limitiramo v neskončnost pa je faktor sreče 0, in je vse odvisno znanja koliko ti use potegniti iz vsakega handa.


Prav tako, kot pri čisto vsaki multiplayer igri z naključnimi igralci. Če odigraš, recimo, 20k iger si edina konstanta v vseh igrah ti. Če si dober, je statistika dobra, če nisi pač ne.
Msi Z77 | Intel i7-3770K | Kingston HyperX DDR3 16GB
CM Silent Pro Gold 700W | Asus RTX 2080 | Samsung 850 EVO 250GB
Samsung 850 EVO 500GB | 2x Asus ROG PG279Q

Smurf ::

BigWhale je izjavil:

StandAgainst je izjavil:

Na kratek rok zna zelo varirat in ga nemoremo določiti natančno(v pokru se mu reče varijanca), če pa čas limitiramo v neskončnost pa je faktor sreče 0, in je vse odvisno znanja koliko ti use potegniti iz vsakega handa.


Ampak, ali ni to znanje potem spet odvisno od srece?

Najprej moras dobiti dovolj dobre karte, to je nek pseudo random. Ce nimas boljsih kart od nasprotnika (katerega karte so odvisne od istega randoma) se moras pa dovolj dobro pretvarjat, da imas boljse karte. In potem je spet odvisno od srece, a ti bo nasprotnik verjel ali ne.

Znanje je o tem, da predvidis kaksne karte ima nasprotnik in znas oceniti pozicijo bolje od nasprotnika. Ce ima nekdo dobre karte ti pa slabe, se ti itak ne splaca blefirati.

Sem pa v studentskih casih za foro napisal poker bot, ki je zgolj uposteval matematicna/statisticna pravila. In je pri igrah z nizkimi vlozki (kjer so praviloma neizkuseni igralci) delal plus, ravno zaradi raznih ljudi, ki so zeleli "blefirati" :).

Zgodovina sprememb…

  • spremenil: Smurf ()

oemdzi ::

Kar se sreče oz. variance tiče je tako, da se prvi kolikor toliko zanesljive informacije ven vlečejo šele po 100.000 odigranih handov in na kratki rok zna sreča biti še preveč izrazita in odžene marsikaterega talenta iz pokra in obratno, obdrži slabe igralce v igri, ki jim je uspelo 2 tedna služiti velike denarce izključno po sreči, ampak se tega ne zavedajo in tudi ko vse zagonijo še nakazujejo denar in si mislijo, da bo ta "smola" minila, saj so vseeno naredili neko raziskavo na spletu in prišli do izraza "long term winner", kjer lepo piše, da se jih lahko smola v rednih primerih drži tudi po par mesecev :)).
*Črna grafična kartica z rumeno lučko in varčnim hladilnikom*
Neslišen intel procesor iz lepe modre škatle* 2 enakomerno ploščata rama*
*overclockan napajalnik in varno ohišje z modro lučko* Hofer gamer copate*

hdsdwn ::

723.713$ v 80.000 handih pomeni 9.05 bb/100. Možnost, da bi igralec, ki je soočen z enakovrednim nasprotnikom zmagal z 9.05bb/100 na takšnem samplu je zelo majhna - manj kot 5% glede na kalkulator variance. Vir

Se pa strinjam, da Doug Polk in ekipa niso blizu top 20 na svetu. Mislim, da bo glavni problem pri optimiziranju igranja AI blefiranje :D

Zgodovina sprememb…

  • spremenilo: hdsdwn ()

BigWhale ::

Smurf je izjavil:

Znanje je o tem, da predvidis kaksne karte ima nasprotnik in znas oceniti pozicijo bolje od nasprotnika. Ce ima nekdo dobre karte ti pa slabe, se ti itak ne splaca blefirati.


Ce so karte posteno zmesane, potem nikakor ne mores predvideti kaksne karte ima nasprotnik. Ampak samo ugibas med posameznimi moznostmi, ki se jih lahko zreducira na verjetno manj kot deset. Potem je pa samo odvisno a si uganil prav. Pri igranju z zivim nasprotnikom je skill lahko samo to, da prepoznas mimiko igralca, ki ti potem pove kaksne karte ima. Pri online igranju pa tega skilla ni vec. Lahko zacnes statisticno razvrscati nasprotnike in se uciti kako igrajo in probas iz tega prepoznati kak vzorec. Ampak za kaj taksnega moras z nasprotnikom odigrati kar nekaj iger.

Roadkill ::

BW: Odnehaj. Ne razumeš pokra. Nima smisla razlagat, če nočeš slišat razlage. Poker igra ni odvisna od sreče in pika.
Ü

dela ::

BigWhale je izjavil:

Smurf je izjavil:

Znanje je o tem, da predvidis kaksne karte ima nasprotnik in znas oceniti pozicijo bolje od nasprotnika. Ce ima nekdo dobre karte ti pa slabe, se ti itak ne splaca blefirati.


Ce so karte posteno zmesane, potem nikakor ne mores predvideti kaksne karte ima nasprotnik. Ampak samo ugibas med posameznimi moznostmi, ki se jih lahko zreducira na verjetno manj kot deset. Potem je pa samo odvisno a si uganil prav. Pri igranju z zivim nasprotnikom je skill lahko samo to, da prepoznas mimiko igralca, ki ti potem pove kaksne karte ima. Pri online igranju pa tega skilla ni vec. Lahko zacnes statisticno razvrscati nasprotnike in se uciti kako igrajo in probas iz tega prepoznati kak vzorec. Ampak za kaj taksnega moras z nasprotnikom odigrati kar nekaj iger.


Kako je lahko skill "samo to", če še potem v naslednjih dveh stavkih omeniš enega možnega? In ja, točno to zadnje se dogaja, večina igralcev (vsaj online) vodi statistiko o nasprotnikih. Tisti, ki jo znajo najbolje interpretirat s pomočjo kombinatorike in verjetnosti ter aplicirat spoznanja, so najboljši igralci.

lonewolf_ ::

kar je več, kot je atomov v vesolju!


Se ne strinjam >:D
R7 5700G + NH-U12P SE2 | Ballistix 2x8Gb 3000MHz
Mortar Titanium | P1 500GB | Exos 3TB | SSD MX500 1TB
beQuiet 700W Gold | Fractal Design Define S

BigWhale ::

Roadkill je izjavil:

BW: Odnehaj. Ne razumeš pokra. Nima smisla razlagat, če nočeš slišat razlage. Poker igra ni odvisna od sreče in pika.


Zakaj potem premesajo karte? :)

dela je izjavil:

In ja, točno to zadnje se dogaja, večina igralcev (vsaj online) vodi statistiko o nasprotnikih. Tisti, ki jo znajo najbolje interpretirat s pomočjo kombinatorike in verjetnosti ter aplicirat spoznanja, so najboljši igralci.


To pomeni, da je igralcev tako malo, da se vsi med seboj poznajo? Al kako? Ker, kolk imas moznosti, da X-krat igras proti istemu igralcu in iz tega dobis neko pametno statistiko, ki je lahko v resnici tudi uporabna.

Zgodovina sprememb…

  • spremenil: BigWhale ()

hamez66 ::

kow je izjavil:

Hecne so te teme. Zelo hecne. Vecina vas se vedno ne steka. Masine nas bodo pojedle za zajtrk, sprijaznite se.
Pogresam Thomasa. On (nam) je ze zdavnaj razlozil.


Thomas je bil smešen glede pokra. Ne spomnim se točno, kaj je trdil, ampak nekaj v stilu, da se ne morejo zgoditi razni bad beati ali da je nemogoče dobiti royal flush ali nekaj podobnega.

Pa če bi nas mašine teple, kako to, da boti ne rasturajo online scene in so na vrhu še vedno človeški igralci? V bistvu si ti smešen.

WamPIRe- je izjavil:

StandAgainst je izjavil:

Na kratek rok zna zelo varirat in ga nemoremo določiti natančno(v pokru se mu reče varijanca), če pa čas limitiramo v neskončnost pa je faktor sreče 0, in je vse odvisno znanja koliko ti use potegniti iz vsakega handa.


Prav tako, kot pri čisto vsaki multiplayer igri z naključnimi igralci. Če odigraš, recimo, 20k iger si edina konstanta v vseh igrah ti. Če si dober, je statistika dobra, če nisi pač ne.


20k handov "ni nič". Miljon handov pa že pokaže bolj realno sliko.

Zgodovina sprememb…

  • spremenilo: hamez66 ()

hamez66 ::

BigWhale je izjavil:


Ce so karte posteno zmesane, potem nikakor ne mores predvideti kaksne karte ima nasprotnik. Ampak samo ugibas med posameznimi moznostmi, ki se jih lahko zreducira na verjetno manj kot deset. Potem je pa samo odvisno a si uganil prav. Pri igranju z zivim nasprotnikom je skill lahko samo to, da prepoznas mimiko igralca, ki ti potem pove kaksne karte ima. Pri online igranju pa tega skilla ni vec. Lahko zacnes statisticno razvrscati nasprotnike in se uciti kako igrajo in probas iz tega prepoznati kak vzorec. Ampak za kaj taksnega moras z nasprotnikom odigrati kar nekaj iger.



Verjetno manj kot 10? Obstaja 169 različnih startnih handov, če ne upoštevamo različne barve. Torej AsKd = AcKh (spade diamon club heart). Na 6max dobri igralci igrajo povprečno okoli 20% handov. Torej 32 oz. 33 startnih handov.


Na hand pa lahko postaviš igralca na podlagi statistike, ki jo imaš o njem, na podlagi dogajanja v prejšnih igrah, na podlagi časa, ki ga igralec porabi med posameznimi akcijami in tako naprej. Komot lahko online opaziš, če nekdo tilta, in ga potem temu primerno olupiš. Tisti, ki niste igrali pokra vsaj nekaj časa, tega očitno ne razumete. Tudi Thomas nikoli ni razumel pokra in so se mu dobri igralci samo smejali.

Igralca lahko postaviš na hand tudi glede na dogajanje na posameznih stopnjah. Če preflop nekdo zelo raisa in je v grobem zelo tight player, ima skoraj zagotovo premium hand. Na flopu se začne nova zgodba in na podlagi vedenja o igralcu in na podlagi, kako izgleda flop in kaj se dogaja, lahko reduciraš število možnih handov.

Zgodovina sprememb…

  • spremenilo: hamez66 ()

dela ::

BigWhale je izjavil:

Roadkill je izjavil:

BW: Odnehaj. Ne razumeš pokra. Nima smisla razlagat, če nočeš slišat razlage. Poker igra ni odvisna od sreče in pika.


Zakaj potem premesajo karte? :)

dela je izjavil:

In ja, točno to zadnje se dogaja, večina igralcev (vsaj online) vodi statistiko o nasprotnikih. Tisti, ki jo znajo najbolje interpretirat s pomočjo kombinatorike in verjetnosti ter aplicirat spoznanja, so najboljši igralci.


To pomeni, da je igralcev tako malo, da se vsi med seboj poznajo? Al kako? Ker, kolk imas moznosti, da X-krat igras proti istemu igralcu in iz tega dobis neko pametno statistiko, ki je lahko v resnici tudi uporabna.


Nezanemarljivo veliko. Če sediš z nekom za isto mizo, boš v roku 100 iger izvedel o njegovi igri (in hkrati o igri ostalih 4/8 igralcev) nekaj osnovnih stvari, ki bodo verjetno uporabne, mogoče pa tudi napačne (skill, ki ga že ne obvlada vsak, je precenit, katere bodo verjetno te stvari). To je nekje za uro ali dve igre. Če ga ni za tvojo mizo, te itak ne zanima zaenkrat. Ko ga naslednjič srečaš, pa nadgrajuješ vzorec in lahko izveš še kaj več (če veš, na kaj pazit).

Višje ko greš z vložki, bolj se med sabo poznajo, ker je manj igralcev, to je pa čist res. Ampak eni druge še vedno bolj poznajo kot obratno.

Zgodovina sprememb…

  • spremenil: dela ()

garamond ::

hdsdwn je izjavil:

723.713$ v 80.000 handih pomeni 9.05 bb/100. Možnost, da bi igralec, ki je soočen z enakovrednim nasprotnikom zmagal z 9.05bb/100 na takšnem samplu je zelo majhna - manj kot 5% glede na kalkulator variance. Vir

Se pa strinjam, da Doug Polk in ekipa niso blizu top 20 na svetu. Mislim, da bo glavni problem pri optimiziranju igranja AI blefiranje :D
Hvala za tole. Ko sem šel pogledat original novico, ni bil nikjer omenjen interval zaupanja, kaj šele točna metodologija. Nekdo je očitno delil 732.713 s 170 milijoni, opazil da je to bistveno manj kot 5% (ali 3% ipd.) in vehementno razglasil statistično izenačenost. Eh.

Torej je potem cela novica pretiravanje? In je realnost taka, da bo računalnik boljši čez mogoče par let?
A parody of extremism is impossible to differentiate from sincere extremism.

oemdzi ::

Fixed limit bi ga bilo po mojem precej lazje sestaviti, kot pa za NL cash game.
*Črna grafična kartica z rumeno lučko in varčnim hladilnikom*
Neslišen intel procesor iz lepe modre škatle* 2 enakomerno ploščata rama*
*overclockan napajalnik in varno ohišje z modro lučko* Hofer gamer copate*

hamez66 ::

V bistvu ni pretiravanje. 4je proji so igrali proti botu. 3je so ga premagali, eden je pa izgubil. Za boljšo statistično gotovost bi bilo super, če bi odigrali več handov. Pri ljudeh vlogo igra tudi psihologija, zato bi znala biti zgodba malček drugačna, če bi se igralo za pravi denar, vendar sploh ne nujno da v škodo bota. Vendar, če je botu uspelo igrati izenačeno oz. skoraj izenačeno s poker proji, ki so zaslužili po več miljonov s pokrom, potem bi tak bot verjetno pometel z večino ostalih heads up igralcev.

Original novica pravi takole:

Three of the four poker pros playing Heads-up No-limit Texas Hold'em against CMU's Claudico ended the 80,000-hand tournament with more chips than the computer.

But statistically, says Tuomas Sandholm, the CMU professor of computer science who led Claudico's development, it was a tie, and the results of the experiment would seem to be inconclusive.

mgermo ::

Če bi bot premagal 3 proje in izgubil proti enemu, ziher to ne bi razglašal kot tie.

Smurf ::

BigWhale je izjavil:


Ce so karte posteno zmesane, potem nikakor ne mores predvideti kaksne karte ima nasprotnik. Ampak samo ugibas med posameznimi moznostmi, ki se jih lahko zreducira na verjetno manj kot deset. Potem je pa samo odvisno a si uganil prav. Pri igranju z zivim nasprotnikom je skill lahko samo to, da prepoznas mimiko igralca, ki ti potem pove kaksne karte ima. Pri online igranju pa tega skilla ni vec. Lahko zacnes statisticno razvrscati nasprotnike in se uciti kako igrajo in probas iz tega prepoznati kak vzorec. Ampak za kaj taksnega moras z nasprotnikom odigrati kar nekaj iger.

Seveda nikoli ne ves zagotovo kaj ima igralec, skill je kako blizu uganes njegov hand.

To, da beres igralca v zivo je itak bolj filmska zadeva kot resnicna. Informacij pa dobis kar nekaj, pri texas hold-emu imas 4 kroge stav, informacijo ti da tudi nacin visanja. Pa treba je vedeti, da bo vecina igralcev igralo vecina iger racionalno (samo malce bodo premikali mejo, za tveganje gor in dol, da se jih ne bo dalo popolnoma prebrati).

Vecinoma je poker statisticna/matematicna igra, kjer rabis disciplino. Ko se gres pa branje in psihologijo, pa hitro izgubis :>.

Roadkill ::

oemdzi je izjavil:

Fixed limit bi ga bilo po mojem precej lazje sestaviti, kot pa za NL cash game.


Na fixed limitu je PC nepremagljiv. Cepheus %28poker bot%29 @ Wikipedia

Zdaj so začeli napredovat na NLHE, ki je seveda neprimerno večji problem.

Kdor ni malo bolj zares igral online pokra verjetno ne razume najbolje telih številk:
https://www.pokertracker.com/sites/file...

Ko imaš enkrat zadost podatkov o nasprotniku heads up igra postane precej robotska.
Ko pa ugotoviš, da se da par 10 mio handov statistike kupit za par dolarjev, in da imaš tako veliko statistike o igralcih katerih še nikoli prej nisi srečal, se pa vprašaš, če morda ti ne igraš proti botu.
Ü

Smurf ::

Roadkill je izjavil:

oemdzi je izjavil:

Fixed limit bi ga bilo po mojem precej lazje sestaviti, kot pa za NL cash game.


Na fixed limitu je PC nepremagljiv. Cepheus %28poker bot%29 @ Wikipedia

Zdaj so začeli napredovat na NLHE, ki je seveda neprimerno večji problem.

Kdor ni malo bolj zares igral online pokra verjetno ne razume najbolje telih številk:
https://www.pokertracker.com/sites/file...

Ko imaš enkrat zadost podatkov o nasprotniku heads up igra postane precej robotska.
Ko pa ugotoviš, da se da par 10 mio handov statistike kupit za par dolarjev, in da imaš tako veliko statistike o igralcih katerih še nikoli prej nisi srečal, se pa vprašaš, če morda ti ne igraš proti botu.

Se vec igra je precej robotska tudi z nepoznavanjem prejsnih handov.

Roadkill ::

No itak... zato se pa lahko multitabla, ker je samo vsake toliko kakšna situacija, katera rabi razmislek.
Imaš folk, ki multitabla vse do 100+ miz, čeprav za normalne smrtnike je tam do 20 malo bolj realno. Za heads-up pa še manj.

Bolj kot to, da je po določenemm številu pozananih situacij igra proti nasprotniku robotska bi moral rečt, da je matematika precej enostavnejša in bolj eksaktna.
Ü

Zgodovina sprememb…

  • spremenil: Roadkill ()

c3p0 ::

Večina nepokerašev hold'em pozna po ogledu kakega turnirja na TV, kjer pokažejo ali samo zanimive hande, ali pa short stack igro, kjer se čipi rinejo noter za skoraj vsak hand (kar je v takih situacijah večinoma pravilno). Zato potem smešne izjave o sreči.

Sam sem multitablal večinoma SnG-je, mislim da do 40 hkrati + SW, ki je mize pravilno stackal. Zaganjaš jih z nekaj minutnimi zamiki, tako da nimaš bubble situacij ravno na 10 mizah hkrati. Cash pa mogoče do 10 miz SH profitabilno :)

leiito ::

Te ideje o branju mimike, vratnih žil ipd. je overrated. Enako velja za blefiranje, ki ga je bistveno manj, kot si neigralci predstavljajo, zvečine gre za semi-blef.

Data mining / player profiling prek 3rd party programov je itak že dolgo prepovedan, vsaj v večjih sobah, lahko si sicer delaš zapiske, ampak igralec se lahko skrije, spremeni handle itd. Operaterji jasno želijo, da bi slabi igralci čim počasneje izgubljali denar.

Super hobi, poker, btw, grinding kot način preživljanja pa emocionalno rollercoaster, kjer varianca, bad beati ipd. vzamejo več, kot dajo uspešne igre.

oemdzi ::

leiito je izjavil:


Data mining / player profiling prek 3rd party programov je itak že dolgo prepovedan, vsaj v večjih sobah, lahko si sicer delaš zapiske, ampak igralec se lahko skrije, spremeni handle itd.


Zelo malo sob ima prepovedano/onemogočeno uporabo holdem managerja ali PT3, datamining je pa itak bistvo današnjega pokra, pa čeprav je izrecno prepovedan. Daš 10 - 20 eur mesečno za naročnino in te vsako jutro na mailu čaka download link za novih 300 - 500k naminiranih handov.

Malo bolj ontopic: Itak je vse kar ni highstakes skorajda avtomatika in posnemanje tega boota, ki bi lowstakes in morda midstakes celo crushal. Ipoker jih je bil itak poln, ko so si rihtali rakeback čez 80%, niso niti plusa potrebovali iz igre, jim je že goli rakeback navrgel nekaj tisoč mesečno.
*Črna grafična kartica z rumeno lučko in varčnim hladilnikom*
Neslišen intel procesor iz lepe modre škatle* 2 enakomerno ploščata rama*
*overclockan napajalnik in varno ohišje z modro lučko* Hofer gamer copate*

Zgodovina sprememb…

  • spremenil: oemdzi ()


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Poker (strani: 1 2 3 4 5 )

Oddelek: Loža
24227467 (4800) CoreySteel
»

Strojna pamet si je podredila še poker

Oddelek: Novice / Znanost in tehnologija
165182 (3299) jype
»

Izgubili smo še v pokru (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
5616758 (13128) leiito
»

Računalnik in človek v pokru statistično izenačena

Oddelek: Novice / Znanost in tehnologija
4921063 (14451) oemdzi
»

Verjetnosti pri kartah (strani: 1 2 3 410 11 12 13 )

Oddelek: Znanost in tehnologija
60442031 (23238) itak37

Več podobnih tem