» »

Strojna pamet si je podredila še poker

Strojna pamet si je podredila še poker

Ars Technica - Strojni algoritem Pluribus, ki so ga razvili na Univerzi Carnegie Mellon v sodelovanju s Facebookom, je v verziji pokra Texas hold'em, ki je bila doslej za AI prevelik zalogaj, premagal petnajst profesionalnih igralcev, med njimi nekaj najboljših na svetu. Dogodek predstavlja pomemben mejnik za umetno inteligenco, Pluribus pa je tako učinkovit, da pomeni resno nevarnost za spletno igranje pokra, zaradi česar izvorne kode niso razkrili.

Da računalniški algoritmi premagujejo najboljše ljudi v nekaterih namiznih igrah, ni novost. Toda šah in go sta igri, kjer je celotno igralno polje vidno obema igralcema. V tem oziru je poker za AI veliko večji izziv, saj se kart nasprotnikov ne vidi, za nameček pa soigralci tudi blefirajo in se mora stroj zato soočati ne le s pomanjkljivimi, temveč celo zavajajočimi informacijami. Kljub temu je umetna inteligenca v pokru v zadnjih letih beležila hiter napredek, predvsem po zaslugi laboratorija na Univerzi Carnegie Mellon v Pennsylvaniji. S tamkajšnjim botom Libratus so predlani prvič nadigrali pokeraške profesionalce, toda zgolj v inačici za dva igralca. Realno se turnirski poker igra v šestero, kar za računalnik položaj močno zakomplicira in celo avtorja Libratusa sta menila, da bo trajalo dosti let, preden bodo bote potisnili čez to oviro. V resnici sta potrebovala zgolj dve leti.

Tuomas Sandholm in njegov doktorski študent Noam Brown, ki je medtem odšel v Facebookov AI oddelek, sta Pluribus zasnovala kot neposredno nadgradnjo Libratusa, toda s pomembnimi spremembami. V osnovi bot še vedno temelji na okrepitvenem učenju skozi igre s samim seboj, podobno kot večina ostalih. Novost pa predstavlja serija poenostavitev, s katerimi sta Sandholm in Brown močno pospešila njegovo odločanje. Namesto da bi Pluribus preračunaval vse možne kombinacije in izide iger, kar je v razmerah nepopolnih informacij grozljivo zamudno, si napravi delne modele, s katerimi hitro primerja stanja v igri. Če je Libratus za delovanje potreboval stotnijo štirinajstjedrnih Intelovih strežniških procesorjev, rabi Pluribus samo še dva - in je obenem hitrejši.

Spopad z ljudmi je potekal v najbolj razširjeni verziji pokra - no limit Texas hold'em. V prvem režimu je Pluribus odigral 10.000 iger proti trinajsterici profesionalcev, od katerih je vsak doslej že zaslužil čez milijon ameriških dolarjev. V drugem načinu se je peterica botov v po pet tisoč igrah pomerila s Chrisom Fergusonom, šestkratnim zmagovalcem serije turnirjev World Series of Poker, in Darrenom Eliasom, rekorderjem v številu naslovov serije World Poker Tour. V obeh primerih je algoritem pometel z ljudmi in to na precej zanimive načine. Pluribus se je sicer spontano naučil večino prijemov, ki so že ustaljeni med igralci, hkrati pa presenetil s čisto samosvojimi, kot so povsem pobezljane vrednosti pri stavah, s katerimi je zmedel nasprotnike. Nasploh se je skozi dvanajstdnevni turnir odlikoval predvsem v nepredvidljivosti, kar je lastnost, ki krasi tudi najboljše človeške igralce.

Bot je tako dober, da ga avtorja ne želita spustiti v divjino, saj obstaja resna nevarnost, da bi povsem destabiliziral področje igranja spletnega pokra. S tem je hkrati konec izzivov za AI v okviru te igre s kartami, toda ker je pridobila sposobnosti, ki jih računalnik doslej še ni imel, se zgodba za takšne vrste algoritme šele zares začenja. Strojna inteligenca, ki se zna soočati z nezadostnimi informacijami nasproti množici drugih agentov, ima ogromen potencial za rabo v finančnem sektorju in pri avtomatiziranih dražbah; v vojski za nadzor robotov; v medicini za iskanje pristopa v boju proti odpornim bakterijam in virusom; pa celo v avtomatiziranih diplomatskih pogajanjih.

16 komentarjev

gus5 ::

AI bolje blefira kot ljudje. >:D

c3p0 ::

Brez skrbi, da v divjini takšni boti že dalj časa lepo služijo.

Večina igralcev je po znanju igre daleč od kakega Fergusona, zato boti niti ne rabijo biti takega kalibra.

Senior Dev ::

Boti imajo poker pod nazdorom že 5+ let. Od povprečnega profesionalca je danes boljši že čisto vsak bot.

nekdonekje ::

Ferguson res ni neki igralec. Stari mu je ucil samo teorijo iger on pa je na full tiltu imel itak super account.

Markoff ::

SkyPokerNet.

Kaj je res kdo iskreno verjel, da nas AI ne bo nažgal pri prav vsakemu intelektualnemu opravilu, given enough time and R&D?
Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021

pingo76 ::

Ai ima odličen poker face. :D

link_up ::

Da vidim AI, ki bo zvecer znal otroka dat spat.
In and Out

Machete ::

link_up je izjavil:

Da vidim AI, ki bo zvecer znal otroka dat spat.

izvoli:
LC1000|Asrock-H470PG|i7-10700K|2x16GB|RTX-3080 EAGLE|W10Pro
new Nintendo 2DS & 3DS XL|Galaxy S24+

Ahim ::

Bot je tako dober, da ga avtorja ne želita spustiti v divjino, saj obstaja resna nevarnost, da bi povsem destabiliziral področje igranja spletnega pokra.

Bolj stabilno je podrocje seveda, ce sama pobirata profit - kam pa prideta, ce bi tekmoval njun bot proti petim instancam samega sebe?

poweroff ::

Zadevo je potrebno nemudoma regulirat! :))
sudo poweroff

Superboyy ::

Itak, če gledaš kako profesionalci igrajo na 8ih mizah naenkrat se hitro vidi, da ni nekih zahtevnih možganskih operacij zadaj - par IF stavkov.

Drugo so turnirji, kjer je bolj pomembno prilezti do konca, ne samo zmagovati z 2% maržo pri ogromnem volumnu.

Markoff ::

link_up je izjavil:

Da vidim AI, ki bo zvecer znal otroka dat spat.

given enough time and R&D
Predstavljaj si, koliko ljudi je živelo v zgodovini, ki niso nikoli verjeli, da lahko pošljemo raketo v orbito, kaj šele na Luno, Mars, Alpha Centauri...
Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021

jype ::

poweroff je izjavil:

Zadevo je potrebno nemudoma regulirat! :))
Saj je že.

poweroff ::

No, pol pa prepovedat...
sudo poweroff

c3p0 ::

Superboyy je izjavil:

Itak, če gledaš kako profesionalci igrajo na 8ih mizah naenkrat se hitro vidi, da ni nekih zahtevnih možganskih operacij zadaj - par IF stavkov.


Pa probaj sam, očitno je preprosto.

jype ::

poweroff je izjavil:

No, pol pa prepovedat...
Ko bo regulator ugotovil, da AI sploh ne pokaže svojega pravega obraza med igro, bo tudi to urejeno.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Kako smo letos izgubili še v pokru

Oddelek: Novice / Znanost in tehnologija
3011239 (2976) c3p0
»

Izgubili smo še v pokru (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
5618067 (14437) leiito
»

Računalnik in človek v pokru statistično izenačena

Oddelek: Novice / Znanost in tehnologija
4921866 (15254) oemdzi

Več podobnih tem