A lire

C’est une première, le meilleur joueur de poker est une machine

C’est une compétition de poker historique qui a duré 20 jours. Une bataille de titans qui a vu la machine littéralement plumer quatre joueurs de haut niveau au « Texas Hold’em No-Limit ». Il s’agit là, de la variante la plus populaire dans le monde depuis une bonne quinzaine d’années.
Depuis les années 1990, les machines parviennent à gagner face aux plus grands champions de différents jeux comme, les dames, les échecs ou même au jeu de go. Cependant, le poker, et la variante Texas Hold’em No-Limit en particulier, résistaient encore à l’intelligence artificielle.
Contrairement aux jeux de stratégie combinatoire abstraits, le poker appartient aux jeux à information incomplète et imparfaite. Les motivations des joueurs ne sont jamais clairement déterminées, ils peuvent utiliser le bluff et toutes sortes de ruses et de stratagèmes. Tous ces paramètres psychologiques sont évidemment difficiles à appréhender pour une machine.
En avril 2015, Tuomas Sandholm avait déjà défié quatre joueurs de poker professionnels (dont Jason Les et Dong Kim) avec son logiciel « Claudico ». Au terme de 80 000 mains, la rencontre s’était soldée par une victoire des joueurs.
Tuomas Sandholm, a donc créé un nouveau champion, Libratus. « Nous n’avons pas déterminé de stratégie de jeu à l’avance », avait précisé Tuomas Sandholm. C’est l’algorithme qui l’a lui-même établie, pour cela, un supercalculateur et l’équivalent de 15 millions d’heures de calcul ont été utilisés, six fois plus que pour Claudico.
Le résultat ne fait pas de doute. Libratus est devenue tout simplement le meilleur joueur au Hold’em No-Limit version Heads-Up. A l’occasion, Libratus s’est enrichi de 1,7 million de dollars (en argent fictif), cela la place loin devant les quatre joueurs pros qu’elle a battus. Le programme a gagné 13,48 dollars par main en moyenne, soit 13,8 « grosses blindes » toutes les 100 mains. La probabilité pour que ce résultat puisse être attribué à un coup de chance est de 0,0001 % (dans la limite basse de l’écart type). Libratus a réussi à déterminer une stratégie parfaite et aux résultats optimaux.
Bien sûr, il ne s’agit pas simplement pour Libratus de faire de simples parties de poker sans enjeux réels. L’intéressant pour les chercheurs américains, réside dans les applications des algorithmes développés. Ils peuvent aider dans des domaines où les informations sont parcellaires et trompeuses, comme dans les négociations commerciales, la stratégie militaire ou la cyber-sécurité.

Crédit photo : Luc Deveault

Laisser un commentaire