Un jour, vous serez plumé au poker par un supercalculateur

Casino Royale

Exclusif

Un logiciel se frotte actuellement à des professionnels du poker dans un casino américain. Nous sommes cuits. Pas tout de suite, mais bientôt. À petit feu, disons.

L’été dernier, je vous ai parlé des craintes d’Elon Musk et de Stephen Hawking au sujet de l’intelligence artificielle, qu’ils considèrent comme potentiellement capable de mener l’humanité à sa perte. Un petit pas dans cette direction est en train d’être franchi alors qu’un logiciel développé à l’Université Carnegie Mellon tente actuellement de battre quatre professionnels du poker dans un tournoi commandité par Microsoft et par un casino de Pittsburgh.

Les règles du tournoi

150424_Brains_vs_AI

Baptisé Brains vs. Artificial Intelligence, l’événement d’une durée de deux semaines consiste en un tournoi de Texas Hold ’em sans limite à deux joueurs, au cours duquel l’ordinateur, nommé Claudico, disputera 20 000 mains de poker contre chacun de ses quatre adversaires humains, à raison de deux séances de 750 mains par jour par «ennemi».

Afin de réduire autant que possible le rôle du hasard, les mains seront disputées en duplicata : si Claudico reçoit un certain ensemble de cartes face au Joueur no 1, le Joueur no 2 recevra exactement les mêmes cartes lors de leur propre partie, et vice versa.

L’objectif : mesurer la performance de Claudico face à des joueurs de calibre mondial et faire progresser la science vers Skyn… euh, vers une compréhension plus avancée de l’intelligence artificielle.

Les forces en présence

Team Humanité inclut les champions Doug Polk, Bjorn Li, Dong Kim et Jason Les, tous considérés parmi les 10 meilleurs au monde dans cette sous-spécialité du poker disputée surtout en ligne. Polk, à lui seul, a accumulé des gains en carrière de plus de 3,6 millions de dollars US.

Claudico, lui, est supposément basé sur des algorithmes qui ont développé leur propre stratégie en étudiant les règles du poker plutôt qu’en copiant les trucs des champions du passé. Pour ce faire, il a fallu mettre à profit le supercalculateur Blacklight de l’Université, équipé notamment de 16 téraoctets de mémoire vive.

homer16to_

Le résultat jusqu’ici

Au moment d’écrire ces lignes, Claudico est dans le rouge d’un peu plus de 458 000$ alors que nous sommes à peu près à la mi-chemin du tournoi. Du moins, il le serait si les montants n’étaient pas fictifs; on travaille pour la science, après tout.

On rappelle qu’il s’agit de professionnels qui appartiennent à l’élite : imaginez les dégâts qu’un logiciel comme Claudico pourrait causer aux finances de joueurs amateurs, dans un casino en ligne.

Mais si Polk et Li ne semblent pas avoir beaucoup de mal à déposséder leur adversaire virtuel de toute sa pseudofortune, Kim n’est que 14 000$ au-dessus du niveau de la mer tandis que Jason Les, lui, coule à pic avec des dettes de 228 000$.

On rappelle qu’il s’agit de professionnels qui appartiennent à l’élite de la discipline : imaginez les dégâts qu’un logiciel comme Claudico pourrait causer aux finances de joueurs amateurs, dans un casino en ligne. Du moins jusqu’à ce que le service de sécurité de l’établissement n’arrive à l’identifier et à le bannir pour éviter que toute la clientèle ne se sauve en courant!

Jouer contre une machine, ce n’est pas juste

En matière de jeux de stratégie, l’intelligence artificielle repose sur une combinaison de puissance brute, d’expertise en développement d’algorithmes ultrarapides, et de maîtrise des particularités du jeu lui-même – et la progression des performances est vertigineuse.

Si vous avez assez de puissance et que le jeu est assez simple, vous pouvez calculer toutes les «positions» et combinaisons de coups imaginables, une par une, et ainsi déterminer le coup parfait à jouer en toutes circonstances. On dit alors que le jeu est «résolu». C’est le cas, notamment, du jeu de dames, résolu par l’équipe de Jonathan Schaeffer à l’Université de l’Alberta en 2007, après une vingtaine d’années de calcul et l’évaluation d’un nombre de positions de l’ordre de 10 à la puissance 20.

Si le jeu est plus complexe, il faut se «contenter» de trouver une stratégie imparfaite, mais assez forte pour battre les meilleurs joueurs humains. Le cas le plus célèbre est celui de Deep Blue, le supercalculateur qui a battu Garry Kasparov aux échecs en 1997; le nombre de positions possibles aux échecs est de l’ordre de 10 à la puissance 47, soit un milliard de milliard de milliard de fois plus qu’aux dames, alors le jeu ne sera jamais formellement résolu, mais quand on bat déjà le champion du monde, ce n’est pas bien grave!

Le jeu de go, lui, a longtemps été considéré comme inattaquable à cause de sa complexité astronomique : 10 à la puissance 171 positions pour la version standard jouée sur une grille de 19 × 19, soit environ le carré du nombre d’atomes dans l’Univers. Pourtant, au cours des dernières années, des logiciels ont battu des joueurs professionnels de haut niveau dans des parties où l’on ne leur avait concédé qu’un modeste handicap de 3 ou 4 pierres.

Et maintenant, c’est le poker qui commence à tomber. La version Texas Hold ’em limitée, où les paris sont fixes, a été quasi-résolue en début d’année. La version sans limite, elle, contient quelque 10 à la puissance 161 positions possibles, il faut que l’ordinateur tienne compte de la personnalité de son adversaire en plus, et voilà que des pros du Top 10 mondial en arrachent déjà contre une machine. Imaginez le topo dans cinq ans.

HAL 9000 AI Supercalculateur

Dans bien des domaines, l’intelligence artificielle demeure ridiculement stupide. Mais en matière de jeux de stratégie, c’est autre chose.

Profitez bien de votre sentiment de supériorité, joueurs humains. Il ne durera plus très longtemps.

En attendant, vous pouvez suivre la fin du tournoi sur Twitter avec le mot-clic #BrainsVsAI.

  • Ge Trolli

    Les robots existent dans le poker en ligne depuis plusieurs années.