Pokerbots, början på slutet? Eh … nej

Phil Laak

De flesta seriösa pokerspelare, speciellt de som spelar online, är medvetna om att det finns "bots". Bot är en förkortning av robot, och här ska vi fokuserade på robotarna som är designade för att spela poker.

En bot är utrustad med artificiell intelligens (AI) - en sofistikerad mjukvara som inte bara är programmerad för att fatta optimala beslut utan också lär sig av erfarenhet.

Det finns mängder av falska bots på marknaden, skräpprogram du kan köpa eller prenumerera på. Ingen av dessa spelar poker bättre än du (jag hoppas det i alla fall).

Det finns däremot en bot som har blivit riktigt känd. Polaris, en bot med genuin AI, utvecklades av medlemmarna i Computer Poker Research Group (CPRG) på University of Alberta.

Polaris har vunnit flera tävlingar mot andra bots och nådde rubrikerna nyligen när den spelade ut ett antal nätpokerproffs.

Besöker du CPRG:s hemsida kan du spela heads-up mot Poki, en "baby bot" vars spel är bra nog för att användas som ett pokerträningsprogram. Där hittar du också tekniska rapporter och vetenskaplig publikationer.

Bill Chen
Bots i allmänhet, och pokerbots i synnerhet, speciellt sådana med riktig AI, är ett ständigt fascinerande ämne. Datanördar älskar en sofistikerad mjukvara och matematiker frossar i allt som den bygger på.

Pokerspelare ser bots från olika synvinklar - från avund till rädsla och avsky blandat med ett rågat mått paranoia.

Framgångarna med Polaris har satt igång fantasin hos media. Vissa kallar det början på slutet för poker. Andra liknar Polaris med Deep Blue, ett schack-AI som lyckades slå Gary Kasparov.

Människor började varna för galna vetenskapsmän med hemliga bots som lurade på Internet - sådana som gillar att sätta paranoida tankar i huvudet på onlinespelare. Detta är ett provocerande ämne och vi måste verkligen försöka förstå vad det egentligen är som pågår på nätet.

Låt oss gå på djupet och undersöka de parametrar som finns då en människa spelar mot Polaris.

Phil Laak

 

 

Spelet är:

Limit hold'em (LH): Polaris kommer inte att sätta sig (metaforiskt talat) i ett stud- eller omaha parti. Den spelar bara ett spel - limit hold'em. Några enstaka gånger har boten programmerats för no-limit hold'em men skickliga pokerspelare vann då allt som oftast.

Limit hold'em är, naturligtvis, mer algoritmiskt än no limit hold'em. Med detta inte sagt att LH inte är ett komplext spel som kräver en hög nivå av skicklighet, det är enbart så att det är enklare att utveckla effektiva strategiska generaliseringar i limit än i no-limit.

Det betyder heller inte att det i framtiden inte kommer en bot som spelar NLH på världsnivå, även om det är ett uppdrag som kräver arbete av en helt annan magnitud. Ingen vet ved den optimala strategin är för NLH, och någon sådan kanske inte ens existerar.

Heads up: Polaris spelar endast mot en emotståndare. Spel heads-up har färre variabler att ta hänsyn till än i spel med flera motståndare.

Bördan av beräkningar på en bot som spelar mot flera motståndare är gigantisk, och än värre, det är inte solklart vilken den mest effektiva strategin är i det spelet. Återigen, detta är inte ett argument för att det skulle vara omöjligt att skapa en sådan bot, bara en fingervisning om svårigheterna att göra det.

Dubblettpoker: Polaris spelade en version av poker som baserades på dubblett-bridge. Samma kort ges till motståndarna vid olika tillfällen och båda måste spela dem från båda sidor.

Till exempel: Du spelar A K och motståndaren har T 9. Senare kommer en omvänd hand där du har T 9 och motståndaren har AsK.

Ali Eslami
Detta spel förminskar turens inverkan, men den är naturligtvis inte eliminerad. Du kan exempelvis (korrekt) lägga en hand som motståndaren synar med och lyckas träffa en magisk river i en hand du inte såg slutet på.

Jämfört med helt slumpmässigt spel brukar man säga att dublettpoker sänker variansen med ungefär två tredjedelar. Detta ökar den statistiska kraften så att bara en niondel av händerna behövs för att nå ett betydande resultat och det är därför CPRG använder sig av tekniken.

Vissa ser dubblettpoker som framtiden. Inte jag. Efter som turfaktorn reduceras kommer svagare spelare ha färre "vinst-sessions" och förlora för regelbundet. Balansen mellan tur och skicklighet i poker som det nu spelas passar mig perfekt.

Motståndarna: Proffsen i "proffsen mot Polaris" var en grupp av unga erfarna onlinespelare. Efter 3 000 händer hade Polaris tjänat 195 små betar vilket är ett signifikant resultat.

I en tidigare tävling spelade Polaris mot två kända pokerproffs, Phil Laak och Ali Eslami. Boten slog Eslami men Laak vann tillräckligt för att ge spelarna en liten vinst totalt. Vår art (förutsatt att Laak är en av oss) tog hem segern.

Insatserna: En viktig men ofta bortglömd detalj är att Polaris endast spelar för cyberpengar och inte riktiga. Samtidigt som det inte råder något tvivel om att pokerproffsen har gigantiska ego (vad skulle de vara utan det?) har det betydelse att deras bankrullar inte kan skadas av spelet.

Onlinespelarna förlorade totalt 195 000 cyberdollar. Skulle de spela annorlunda om de hade konfronterats med risken att förlora riktiga pengar? Högst troligt. Skulle de spela bättre? Kanske. Skulle de spela sämre? Kanske.

Matt Hawrilenko
En mer nykter bedömning: Med dessa faktorer i bakhuvudet är mycket av de bekymmer som Polaris åsamkat obefogat.

 

Ni med en paranoid läggning kan återvända till att grubbla om det finns hackers som ser hålkorten. Däremot har framgången med CPRG betydande effekt för både vetenskapen och pokern.

För det första är det av yttersta betydelse för AI-program att de utvecklas genom komplex feedback. Det är också viktigt att programmet hittar, och lär sig, ett optimalt sätt att spela limit hold'em. Detta är nog för att få en pokerspelare att tänka - mycket.

Det finns mer att diskutera men min redaktör blir orolig när jag bara pratar på. Så jag stannar här.

Senaste blogginlägg »