Hjem / Kultur & samfund / Fem pokermestre får bank af intelligent algoritme
Pokerspiller
Nu kan kunstig intelligens ikke bare vinde over en modstander i poker men over hele fem på en gang.

Fem pokermestre får bank af intelligent algoritme

En intelligent algoritme har vist sig i stand til at vinde konsekvent over fem professionelle pokerspillere.

Onlinepokerspillet Texas hold’em er den nyeste tilføjelse til listen over spil, som computere er bedre til end mesterspillere. I hvert fald har den kunstige intelligens Pluribus for nylig sejret over fem professionelle pokerspillere.

Pluribus er udviklet i samarbejde mellem forskere fra Carnegie Mellon University og Facebook, og ligesom Googles Go-AI AlphaZero-algoritme og flere lignende spilintelligenser baserer Pluribus sine evner på en såkaldt Monte Carlo-simulation. Det er en metode, hvor en kunstig intelligens trænes i at tænke flere træk frem og prioritere handlinger, der ser lovende ud på baggrund af nogle bestemte regler kendt som ”expert policies”.

Monte Carlo reducerer dermed den såkaldte ”branching faktor” – dvs. antal mulige træk i hvert led – og gør derfor den enorme mængde udregninger, som skal foretages, markant mindre. På den måde slipper den kunstige intelligens for at skulle kigge alle træk igennem og kan blot koncentrere sig om de mest sandsynlige udfald på en måde. Det kan sammenlignes med den måde, hvorpå vi mennesker tænker flere træk frem, hvor man udelukker ikke-brugbare og nyttesløse handlinger undervejs.

Denne hånd eller en anden?

I forskningsartiklen om Pluribus beskriver forskerne også, hvordan de har gjort brug af Monte Carlo counterfactual regret minimization (MCCFR), der får Pluribus til at vurdere en hånd (inklusive den forventede strategi fra modstanderens side) og undersøge og gennemregne, hvor meget bedre den eventuelt ville have kunnet klare sig med en anden strategi.

Derefter undersøges, hvordan det vil gå for den følgende hånd, og så videre. På den måde dygtiggør Pluribus sig ved at spille mod sig selv om og om igen.

Uden pokerfjæs

I en AI-blog noterer Facebook, at Pluribus har formået at vinde over flere topprofessionelle spillere, både over for fem pokermestre på en gang, men også i spil mod fem andre kunstige intelligenser (plus en enkelt menneskelig spiller) på én gang.

Omsat til penge og gevinst ville Pluribus dermed have vundet i gennemsnit 5 US-dollar pr. hånd og ville have tjent omkring 1000 dollar i timen (cirka 6600 kroner) i spil mod de professionelle spillere. Og det uden at kunne præstere et effektivt pokerfjæs.

I forvejen har kunstig intelligens besejret et menneske i poker en mod en, men spil mod flere spillere på samme tid gør udfordringen markant højere. Med de overlegne pokerevner har Pluribus også, ifølge Facebook, vist, at algoritmen kan håndtere komplicerede situationer med adskillige aktører og skjult information.

Tilføj en kommentar

Din e-mail adresse vil ikke blive offentliggjort. Markerede felter skal udfyldes *

*

200-125   300-075   210-260   210-060   300-115   100-105   300-101   400-101   300-320   300-070   300-206   200-310   300-135   300-208   810-403   400-050   640-916   642-997   300-209   400-201   200-355   352-001