25 juni 2022 08:00 10 januari 2017 10:10

Artificiële intelligentie gaat strijd aan met pokerkampioenen

De Carnegie Mellon University heeft een nieuwe pokercomputer ontwikkeld die de strijd aangaat met vier pokerkampioenen. Kan een AI zich een weg naar de overwinning bluffen?

Vier van de beste pokerspelers wereldwijd gaan een wedstrijd aan met een artificiële intelligentie van de Carnegie Mellon University. Gedurende twintig dagen zullen de spelers en computer in totaal 120.000 pokerhanden spelen van Heads-Up No-Limit Texas Hold’em. Bij deze vorm van poker spelen twee mensen tegen elkaar en kan je zoveel bieden als je wilt. De universiteit hoopt op deze manier te bewijzen dat zijn computer menselijke spelers kan verslaan zonder dat hierbij geluk komt kijken.

Imperfecte informatie

Er is de laatste tijd veel te doen rond AI’s die mensen verslaan in eeuwenoude spellen. Vorig jaar versloeg Googles AlphaGo immers regerend Go-kampioen Lee Se-Dol in een wedstrijd van vijf spellen. Vier van de vijf rondes werden gewonnen door de computer. De eerste keer dat een computer de wereld verbaasde door het verslaan van een spellenkampioen was echter in 1997. Toen werd schaakgrootmeester Garri Kasparov verslagen door Deep Blue, een AI van IBM.

Tot nu toe lag het verslaan van pokerkampioenen echter niet binnen de mogelijkheden van AI. Dit komt doordat bij poker – in tegenstelling tot bij schaken en Go- niet alle informatie gekend is. Waar je bij Go en schaken alle stukken op het bord ziet staan, weet je bij poker niet welke kaarten in het spel zijn. Je hebt met andere woorden te maken met imperfecte informatie.

Bij poker heb je te maken met imperfecte informatie.

Bluf

De beslissingen die de AI moet maken op basis van de onvolledige informatie die het heeft, is al extreem moeilijk. Pokerspelers maken het elkaar echter nog moeilijker door te bluffen en andere pokertrucs te gebruiken. Dit zorgde ervoor dat in een eerdere wedstrijd vorig jaar de AI van de Carnegie Mellon University zijn menselijke tegenstanders niet kon verslaan. Na het spelen van 80.000 pokerhanden kon niet met statistische zekerheid worden gezegd dat de computer of mensen aan het langste eind trokken.

De universiteit heeft sindsdien de software achter zijn pokercomputer drastisch verbetert. Ook wil het dit jaar dubbel zoveel handen spelen, zodat er wel een statistische significantie kan worden bekomen. Toch kan de wedstrijd alle kanten opgaan. “Aan de menselijke kant is poker de voorbije 20 maanden een stuk moeilijker geworden,” weet topspeler Jason Les. “Professionele spelers hebben immers tools over speltheorie omarmt, waardoor hun spel is verbeterd.”

Supercomputer

Om een AI te ontwikkelen die toppokerspelers kan verslaan, schrijft de universiteit niet zelf een strategie. In plaats daarvan heeft het een nieuw algoritme ontwikkeld dat sterke rekenstrategieën voor imperfecte informatie kan ontwikkelen.

Hiervoor heeft Carnegie Mellon gebruik gemaakt van de Pittsburgh Supercomputing supercomputer. “We gebruikten ongeveer 15 miljoen core-uren voor het maken van Libratus,” vertelt universiteitsprofessor Sandholm over de vorige versie van hun AI. “Voor Claudico hebben we 2 tot 3 miljoen core-uren gebruikt. Dit berekeningsproces blijft bovendien doorgaan tijdens de wedstrijd.”

Toepassingen

Indien Claudico, de vernieuwde AI van de Carnegie Mellon University, erin slaagt de pokerkampioenen te verslaan is dit niet alleen groot nieuws voor de pokerwereld. Het algoritme achter de computer kan in theorie immers ingezet worden voor alle toepassingen met imperfecte informatie. Denk hierbij aan bedrijfs- en militaire toepassingen, cybersecurity en de gezondheidszorg.

Openingsbeeld: Carnegie Mellon University

Vier van de beste pokerspelers wereldwijd gaan een wedstrijd aan met een artificiële intelligentie van de Carnegie Mellon University. Gedurende twintig dagen zullen de spelers en computer in totaal 120.000 pokerhanden spelen van Heads-Up No-Limit Texas Hold’em. Bij deze vorm van poker spelen twee mensen tegen elkaar en kan je zoveel bieden als je wilt. De universiteit hoopt op deze manier te bewijzen dat zijn computer menselijke spelers kan verslaan zonder dat hierbij geluk komt kijken.

Imperfecte informatie

Er is de laatste tijd veel te doen rond AI’s die mensen verslaan in eeuwenoude spellen. Vorig jaar versloeg Googles AlphaGo immers regerend Go-kampioen Lee Se-Dol in een wedstrijd van vijf spellen. Vier van de vijf rondes werden gewonnen door de computer. De eerste keer dat een computer de wereld verbaasde door het verslaan van een spellenkampioen was echter in 1997. Toen werd schaakgrootmeester Garri Kasparov verslagen door Deep Blue, een AI van IBM.

Tot nu toe lag het verslaan van pokerkampioenen echter niet binnen de mogelijkheden van AI. Dit komt doordat bij poker – in tegenstelling tot bij schaken en Go- niet alle informatie gekend is. Waar je bij Go en schaken alle stukken op het bord ziet staan, weet je bij poker niet welke kaarten in het spel zijn. Je hebt met andere woorden te maken met imperfecte informatie.

Bij poker heb je te maken met imperfecte informatie.

Bluf

De beslissingen die de AI moet maken op basis van de onvolledige informatie die het heeft, is al extreem moeilijk. Pokerspelers maken het elkaar echter nog moeilijker door te bluffen en andere pokertrucs te gebruiken. Dit zorgde ervoor dat in een eerdere wedstrijd vorig jaar de AI van de Carnegie Mellon University zijn menselijke tegenstanders niet kon verslaan. Na het spelen van 80.000 pokerhanden kon niet met statistische zekerheid worden gezegd dat de computer of mensen aan het langste eind trokken.

De universiteit heeft sindsdien de software achter zijn pokercomputer drastisch verbetert. Ook wil het dit jaar dubbel zoveel handen spelen, zodat er wel een statistische significantie kan worden bekomen. Toch kan de wedstrijd alle kanten opgaan. “Aan de menselijke kant is poker de voorbije 20 maanden een stuk moeilijker geworden,” weet topspeler Jason Les. “Professionele spelers hebben immers tools over speltheorie omarmt, waardoor hun spel is verbeterd.”

Supercomputer

Om een AI te ontwikkelen die toppokerspelers kan verslaan, schrijft de universiteit niet zelf een strategie. In plaats daarvan heeft het een nieuw algoritme ontwikkeld dat sterke rekenstrategieën voor imperfecte informatie kan ontwikkelen.

Hiervoor heeft Carnegie Mellon gebruik gemaakt van de Pittsburgh Supercomputing supercomputer. “We gebruikten ongeveer 15 miljoen core-uren voor het maken van Libratus,” vertelt universiteitsprofessor Sandholm over de vorige versie van hun AI. “Voor Claudico hebben we 2 tot 3 miljoen core-uren gebruikt. Dit berekeningsproces blijft bovendien doorgaan tijdens de wedstrijd.”

Toepassingen

Indien Claudico, de vernieuwde AI van de Carnegie Mellon University, erin slaagt de pokerkampioenen te verslaan is dit niet alleen groot nieuws voor de pokerwereld. Het algoritme achter de computer kan in theorie immers ingezet worden voor alle toepassingen met imperfecte informatie. Denk hierbij aan bedrijfs- en militaire toepassingen, cybersecurity en de gezondheidszorg.

Openingsbeeld: Carnegie Mellon University

Schrijf je in op onze nieuwsbrief en ontvang elke werkdag het beste uit de techwereld in je mailbox.

ai poker supercomputer Wetenschap

Dorien Vervoort

Dorien heeft een achtergrond als programmeur en is bijzonder geïnteresseerd in robotica en biomedische technologie. Al draait ze haar hand ook niet om voor bredere thema’s als security en internet of things.