Pokkeriprofid võistlevad arvutiga

Maailma parimaks pokkerimängijaks peetav
Phil Laak hakkas eile mängima 200-jaotuselist pokkerimatši uue arvutiprogrammi
vastu.

Siiani on pokkeriprogrammid olnud malekompuutritega võrreldes üsna saamatud – nüüd aga arvatakse, et Laakil võib raskeks minna. Varsti aga on pokkeriarvutid ilmselt võitmatud.

Kanada ülikooli mängude uurimise keskust peetakse maailma parimaks. Laak võitis mõned aastad tagasi nende loodud pokkeriprogrammi, kuid raskustega. Ta usub, et oleks kaotanud, kui talle poleks antud aega programmi ja selle mängustiiliga tutvumiseks. Nüüd on Kanada teadlased valmistanud veel võimsama programmi, vahendas Physorg.

50 000 dollarilise auhinnafondiga matšis üritatakse õnne osakaal võimalikult väikseks teha. Laak mängib programmi vastu koos Ali Eslamiga, kes on samuti üks maailma parimatest pokkerimängijatest. Matši ajal on ühes toas Laak ja pokkeriarvuti, teises aga Eslami arvutiga, aga vahetatud kaartidega – Eslami käes on kaardid, mis teises toas on Laaki vastu mängival arvutil.

Seega kui Laakil on käes arvutiga võrreldes väga viletsad kaardid, on Eslamil teises toas vastavalt hea käsi. Turniiri lõpus pannakse inimeste võidusummad kokku ning võrreldakse tulemust arvuti võitudega.

Kahepäevane turniir ei toimu mitte kasiinos, vaid Vancouveri tehisintellekti arendamiskeskuses. Teadlaste jaoks on pokker viimasel ajal saanud üheks intrigeerivaimaks probleemiks – kuidas tuleb arvuti toime ebakindluse ja pooliku informatsiooniga?

Pokkerit on arvutil palju raskem hästi mängima õppida kui teisi mänge. Males ja kabes on mängu käik siiski mingil määral ette ennustatav, algseis on alati sama ja variantide arv küll tohutult suur, kuid siiski piiratud. Ükski arvuti ei suuda küll arvutada kõiki võimalikke käike males, kuid tänapäeva parimad malekompuutrid näevad ette koguni 18 käiku.

Pokkeris aga ei ole ainult lugematu arv kaardikombinatsioonivariante ühes käes, vaid ka sama vastasel ning lisaks raskesti etteennustatav küsimus – mis vastane sellise kaardikombinatsiooniga peale hakkab.

Igas olukorras ei ole parimat käiku – ei pruugi olla isegi parimat strateegiat. Tippmängijad kohendavad pidevalt oma mängustiili, sõltuvalt vastaste käitumisest. Argade mängijate vastu töötab bluff, ettevaatlikumalt peab mängima vastastega, kes vaid heade lehtedega panust tõstavad. Oma strateegiat muudab tippmängija pidevalt, et vastased sellest järeldusi teha ei saaks.

Sellist mõtlemist on arvutisse programmeerida väga raske. Arvutile ei saa ette anda kindlaid reegleid, kuna iga kogenum mängija näeb need ruttu läbi ja saab aru, kuidas arvuti kindlate kaardikombinatsioonide korral käitub.

Nii võitis Laak kaks aastat tagasi Las Vegases peetud matšis programmi Poker Probot – ta sai aru, et arvuti mängis pidevalt agressiivse strateegiaga ning kohandas vastavalt oma mängustiili.

Selle nõrkuse saavad programmeerijad osaliselt kõrvaldada, võttes arvesse mänguteooriat. 1950. aastal näitas matemaatik John Nash, kelle elu inspireeris filmi "A Beautiful Mind", et kindlates mängudes esineb strateegiate komplekt, mille korral iga mängija kasu on maksimeeritud ning ükski mängija ei saa kasu sellest, kui ta lülitub teistsugusele strateegiale.

Näiteks mängus kivi-käärid-paber on parim strateegia valida juhuslikult iga võimalust võrdsel arvul kordi. Kui mõni mängija sellest strateegiast loobuks ning ühte varianti eelistama hakkaks, näeksid teised selle peagi läbi ning kohandaksid oma mängu sellest kasu lõikama.

Pokkerisüsteem Texas Hold 'em on küll pisut keerulisem kui kivi-käärid-paber, kuid Nashi matemaatika kehtib siingi. Mänguteooria abil oskab arvuti oma mängu varieerida, nii et vastasel on raske aru saada, kas ta parajasti blufib või kasutab mõnd muud strateegiat.

Mänguteoorial on aga piirid – edu ei tähenda siin mitte võitmist, vaid kaotamise vältimist. Siiani on jõudnud tänapäeva parimad pokkeriprogrammid – nad peavad parimate inimmängijatega mängides enam-vähem vastu, kuid ei võida neilt pidevalt suuri summasid.

Selleks oleks lisaks matemaatikale vaja ka oskust oma vastast jälgida ja tema mänguga kohaneda. Paljud legendaarsed pokkerimängijad on suurepärased inimesetundjad. Žestidest, näoilmetest ja muust saavad nad kiiresti aru, mis tüüpi vastasega on tegemist ja kuidas ta vastu mängida tuleb.

Seda arvuti ei oska, kuid ta saab jälgida inimese mängustiili. Ta saab analüüsida, kui tihti vastane nõrga lehega blufib ja kui tihti ta kaardid maha paneb. Seda informatsiooni arvesse võttes saab arvuti oma mängu suunata.

Seda oskust on arvutiteadlased pokkeriprogrammis alles hakanud välja arendama. Programmi autorid hoiatavad, et uus programm on juba küllaltki kohanemisvõimeline. Aga – seda on ka tippmängijad Laak ja Eslami. Nad peaksid arvutiga sammu pidama – vähemalt veel see kord.

Turniiri seisu saate jooksvalt jälgida siit.


Osale arutelus

Toetajad

Jälgi ITuudiseid sotsiaalmeedias

RSS

Toetajad

Valdkonna töökuulutused

ERPLY otsib SÜSTEEMIADMINISTRAATORIT

Majandustarkvara OÜ

01. november 2017

Tallinna Linnakantselei otsib INFOSÜSTEEMIDE ANALÜÜTIKUT

Tallinna Linnakantselei

01. november 2017

Arvamused

Teabevara