Računalnik in človek v pokru statistično izenačena
Matej Huš
11. maj 2015 ob 16:36:28
V Pittsburghu se je v Rivers Casino končalo dvotedensko tekmovanje v pokru, kjer je Claudico, najzmogljivejši računalniški program za igranje pokra, igral poker (Heads-Up No-limit Texas Hold'em) proti štirim izmed deseterice najboljših svetovnih igralcev. Na koncu je po so skoraj 80.000 partijah Claudico (z vsakim igralcem 20.000) zaostajal tako malo, da razlika ni statistično pomembna. Čeprav je človek torej zmagal, lahko zaključimo, da so računalniki po šahu človeške sposobnosti dohiteli še v pokru.
Claudico je dopolnjena verzija Tartaniana 7, ki je lanskega julija pometel z računalniško konkurenco. Razvijalci s Carneige Mellon University so program še dodelali in konec aprila se je pričelo dvotedensko tekmovanje, ki je trajalo do minulega petka. Vsak dan so odigrali 1500 partij (pol dopoldne, pol popoldne), vmes pa je bil en dan prost, da so si igralci malo odpočili. Skupaj torej 13 tekmovalnih dnih. Igrali so najboljši igralci sveta, vsak pa je prejel 100.000 dolarjev, tako da bi težko rekli, da je človeštvo zastopala drugorazredna ekipa ali da ji je manjkalo motivacije.
Tuomas Sandholm s CMU, ki je vodil razvoj Claudica, pojasnjuje, da je v Hold’em brez omejitev stave z dvema igralcema 10161 možnih situacij, kar je več, kot je atomov v vesolju! Enostavnejša je verzija z vnaprej omejenim naborom stav, kjer je možnosti le 1013 in je že skoraj optimalno rešena. Težja verzija pa je tako obsežna, da je Claudico uporabljal CMU-jev superračunalnik Blacklight, v katerega so vprogramirali pravila za poker, strategije pa si je moral izračunati sam.
Skupno so si štirje igralci priigrali 732.713 dolarjev več od računalnika, kar je zanemarljivo v primerjavi s 170 milijoni dolarjev, ki so bili na voljo (imaginarnega denarja, se razume!). Tako majhna razlika pomeni, da je statistično gledano računalnik enako dober kot ljudje. Igralci so povedali, da je Claudico dober, a ne najbolj vrhunski igralec (recimo stava 19.000 dolarjev, ko je na mizi 700 dolarjev, ni bila najbolj razumljiva poteza). Njegova strategija je nekoliko drugačna od človeške, poleg tega pa se seveda manj zanaša na psihološke igra in "branje" nasprotnika, temveč bolj na matematiko. Igralci priznavajo, da so zato morali igrati malce drugače, bolj "čisto" verzijo pokra.