24. juuli 2007

Tähelepanu! Artikkel on enam kui 5 aastat vana ning kuulub väljaande digitaalsesse arhiivi. Väljaanne ei uuenda ega kaasajasta arhiveeritud sisu, mistõttu võib olla vajalik kaasaegsete allikatega tutvumine.

Pokkeriprofid võistlevad arvutiga

Maailma parimaks pokkerimängijaks peetav Phil Laak hakkas eile mängima 200-jaotuselist pokkerimatši uue arvutiprogrammi vastu.

Siiani on pokkeriprogrammid olnud malekompuutritega võrreldes üsna saamatud – nüüd aga arvatakse, et Laakil võib raskeks minna. Varsti aga on pokkeriarvutid ilmselt võitmatud.

Kanada ülikooli mängude uurimise keskust peetakse maailma parimaks. Laak võitis mõned aastad tagasi nende loodud pokkeriprogrammi, kuid raskustega. Ta usub, et oleks kaotanud, kui talle poleks antud aega programmi ja selle mängustiiliga tutvumiseks. Nüüd on Kanada teadlased valmistanud veel võimsama programmi, vahendas Physorg.

50 000 dollarilise auhinnafondiga matšis üritatakse õnne osakaal võimalikult väikseks teha. Laak mängib programmi vastu koos Ali Eslamiga, kes on samuti üks maailma parimatest pokkerimängijatest. Matši ajal on ühes toas Laak ja pokkeriarvuti, teises aga Eslami arvutiga, aga vahetatud kaartidega – Eslami käes on kaardid, mis teises toas on Laaki vastu mängival arvutil.

Seega kui Laakil on käes arvutiga võrreldes väga viletsad kaardid, on Eslamil teises toas vastavalt hea käsi. Turniiri lõpus pannakse inimeste võidusummad kokku ning võrreldakse tulemust arvuti võitudega.

Kahepäevane turniir ei toimu mitte kasiinos, vaid Vancouveri tehisintellekti arendamiskeskuses. Teadlaste jaoks on pokker viimasel ajal saanud üheks intrigeerivaimaks probleemiks – kuidas tuleb arvuti toime ebakindluse ja pooliku informatsiooniga?

Pokkerit on arvutil palju raskem hästi mängima õppida kui teisi mänge. Males ja kabes on mängu käik siiski mingil määral ette ennustatav, algseis on alati sama ja variantide arv küll tohutult suur, kuid siiski piiratud. Ükski arvuti ei suuda küll arvutada kõiki võimalikke käike males, kuid tänapäeva parimad malekompuutrid näevad ette koguni 18 käiku.

Pokkeris aga ei ole ainult lugematu arv kaardikombinatsioonivariante ühes käes, vaid ka sama vastasel ning lisaks raskesti etteennustatav küsimus – mis vastane sellise kaardikombinatsiooniga peale hakkab.

Igas olukorras ei ole parimat käiku – ei pruugi olla isegi parimat strateegiat. Tippmängijad kohendavad pidevalt oma mängustiili, sõltuvalt vastaste käitumisest. Argade mängijate vastu töötab bluff, ettevaatlikumalt peab mängima vastastega, kes vaid heade lehtedega panust tõstavad. Oma strateegiat muudab tippmängija pidevalt, et vastased sellest järeldusi teha ei saaks.

Sellist mõtlemist on arvutisse programmeerida väga raske. Arvutile ei saa ette anda kindlaid reegleid, kuna iga kogenum mängija näeb need ruttu läbi ja saab aru, kuidas arvuti kindlate kaardikombinatsioonide korral käitub.

Nii võitis Laak kaks aastat tagasi Las Vegases peetud matšis programmi Poker Probot – ta sai aru, et arvuti mängis pidevalt agressiivse strateegiaga ning kohandas vastavalt oma mängustiili.

Selle nõrkuse saavad programmeerijad osaliselt kõrvaldada, võttes arvesse mänguteooriat. 1950. aastal näitas matemaatik John Nash, kelle elu inspireeris filmi "A Beautiful Mind", et kindlates mängudes esineb strateegiate komplekt, mille korral iga mängija kasu on maksimeeritud ning ükski mängija ei saa kasu sellest, kui ta lülitub teistsugusele strateegiale.

Näiteks mängus kivi-käärid-paber on parim strateegia valida juhuslikult iga võimalust võrdsel arvul kordi. Kui mõni mängija sellest strateegiast loobuks ning ühte varianti eelistama hakkaks, näeksid teised selle peagi läbi ning kohandaksid oma mängu sellest kasu lõikama.

Pokkerisüsteem Texas Hold 'em on küll pisut keerulisem kui kivi-käärid-paber, kuid Nashi matemaatika kehtib siingi. Mänguteooria abil oskab arvuti oma mängu varieerida, nii et vastasel on raske aru saada, kas ta parajasti blufib või kasutab mõnd muud strateegiat.

Mänguteoorial on aga piirid – edu ei tähenda siin mitte võitmist, vaid kaotamise vältimist. Siiani on jõudnud tänapäeva parimad pokkeriprogrammid – nad peavad parimate inimmängijatega mängides enam-vähem vastu, kuid ei võida neilt pidevalt suuri summasid.

Selleks oleks lisaks matemaatikale vaja ka oskust oma vastast jälgida ja tema mänguga kohaneda. Paljud legendaarsed pokkerimängijad on suurepärased inimesetundjad. Žestidest, näoilmetest ja muust saavad nad kiiresti aru, mis tüüpi vastasega on tegemist ja kuidas ta vastu mängida tuleb.

Seda arvuti ei oska, kuid ta saab jälgida inimese mängustiili. Ta saab analüüsida, kui tihti vastane nõrga lehega blufib ja kui tihti ta kaardid maha paneb. Seda informatsiooni arvesse võttes saab arvuti oma mängu suunata.

Seda oskust on arvutiteadlased pokkeriprogrammis alles hakanud välja arendama. Programmi autorid hoiatavad, et uus programm on juba küllaltki kohanemisvõimeline. Aga – seda on ka tippmängijad Laak ja Eslami. Nad peaksid arvutiga sammu pidama – vähemalt veel see kord.

Turniiri seisu saate jooksvalt jälgida siit.

Autor: ituudised.ee - Äripäeva IKT uudiste teemaveeb

Hetkel kuum

Soovid värvata IT-tipu või müügijuhi? Vaata, mis palka neile turul pakutakse

Vaata, mis reeglid kehtivad Telias tehisaru kasutamiseks. “Käime veel kaardistamata rajal”

Eestis IKT-alal töötavail Vene kodanikel võib olla rolle, mille täitmist nõutakse tundide jooksul

Riigi IT-maja juht: nõudmised ja ootused kasvavad, vahendeid ja inimesi on väga palju puudu

IT-FIRMADE KÜSITLUS | Kuidas hindate riigi IT-kulutusi? “Laenurahaga ei tohiks arendada”

Liitu ITuudiste uudiskirjaga!

Enimloetud

15. apr

Soovid värvata IT-tipu või müügijuhi? Vaata, mis palka neile turul pakutakse