Aller au contenu Abonnez-vous En direct Le journal Suivre Recherche Figaro Figaro Figaro Figaro PremiumAbonnez-vous Menu En direct Le journal Recherche sorties dans l'espace Actualité Un ordinateur défie l'être humain au poker Un ordinateur défie l'être humain au poker Le joueur de poker professionnel Doug Polk affronte le programme Claudico à la compétition annuelle informatique de poker, au Rivers Casino de Pittsburgh. Doug Oster Une intelligence artificielle développée par une université américaine est opposée depuis treize jours à quatre joueurs professionnels. Après la victoire de Deep Blue aux échecs en 1997, puis de Watson à Jeopardy en 2011, l'intelligence artificielle s'attaque au poker. Depuis le 24 avril, quatre joueurs de poker professionnels affrontent Claudico, le dernier vainqueur de la compétition annuelle informatique de poker. La partie doit prendre fin jeudi après quelque 80 000 manches disputées en treize jours (environ 1 500 par joueur et par jour). Le match se déroule au Rivers Casino de Pittsburgh. Chaque humain affronte en face-à-face le programme mis au point par l'équipe de Tuomas Sandholm, de l'université Carnegie-Mellon, sur un ordinateur portable, en suivant les règles du no-limit Texas Hold'em. Jamais une intelligence artificielle n'a réussi à surpasser l'être humain dans cette variante du jeu, la plus répandue dans le monde. Dans ce format, chaque joueur a deux cartes en main qu'il est le seul à voir, tandis que cinq cartes communes, visibles par tous, sont successivement déposées au centre de la table. Entre chaque nouvelle carte, les joueurs ont la possibilité d'abandonner la manche (se coucher) ou de continuer à miser leurs jetons (sans restrictions dans le «no-limit»). «Il y a un nombre virtuellement infini de mises possibles, ce qui complique grandement la tache des programmeurs pour définir la meilleure stratégie», explique Jérémie Mary, chercheur à l'Inria et maître de conférences à l'université de Lille. «Concrètement, l'algorithme cherche à transformer le jeu en une abstraction simple, pour la résoudre et traduire cette solution dans le jeu original», explique Michael Bowling, de l'université d'Alberta, dont le programme Cepheus est désormais invincible dans une autre version du Texas Hold'em où le joueur ne peut relancer que d'un montant fixé (article paru en janvier dans Science). Le bluff de l'ordinateur Pourquoi un tel intérêt pour le poker? «Parce que c'est un jeu qui, contrairement aux échecs ou à Jeopardy, implique une part de hasard et d'inconnu, rappelle Michael Bowling. On ne sait pas quelles cartes vont être dévoilées, ni celles que possède l'adversaire. » Il faut donc trouver une façon de prendre la meilleure décision possible en dépit du manque d'informations. C'est exactement ce que font les êtres humains en permanence, avec plus ou moins de réussite. Ce type d'algorithme pourrait d'ailleurs avoir des applications très intéressantes en médecine (pour déterminer le meilleur traitement) ou en sécurité (pour établir une stratégie de surveillance). Claudico et Cepheus fonctionnent un peu de la même manière. En fonction des mises de leurs adversaires, des cartes sur le tapis et de celles qu'ils ont en main, ils évaluent leur chance de gagner (ou de minimiser leurs pertes) s'ils se couchent, égalent la mise de leur adversaire ou relancent. S'il y a 3% de chances de minimiser ses pertes en se couchant et 90% de chances de gagner en relançant, les programmes ne vont pas automatiquement choisir de relancer. Ils ne le feront que dans 90% des cas. Dans 3% des cas, ils se coucheront. «L'ordinateur va par exemple bluffer de temps en temps (c'est-à-dire miser beaucoup sur un jeu faible, NDLR), ce qui va surprendre son adversaire», détaille Jérémie Mary. Contrairement à ce que pensent les joueurs humains, l'ordinateur ne cherche pas consciemment à les surprendre et ne s'adapte à leur stratégie que de façon marginale. «En réalité, les joueurs professionnels jouent eux aussi instinctivement en suivant un schéma de jeu très proche, ce qui est surprenant dans la mesure où l'être humain est très peu doué pour les probabilités, continue le chercheur. Si l'ordinateur est plus près du meilleur équilibre statistique, il finira mathématiquement par gagner au bout d'un certain temps. C'est l'objectif. » Mercredi soir, Claudico perdait de près de 700 000 dollars et ne dominait qu'un seul des quatre joueurs dans ses face-à-face. L'homme a donc encore un peu d'avance. Peut-être pas pour longtemps. La rédaction vous conseille Tristan Vey Tristan Vey ] Journaliste - Sa biographie 117 abonnés Ses derniers articles Tabby Tarentule Sur le même sujet précédent pour le géant Intel milliard d'euros en 2018 Aricent Thématique : Informatique Suivre ans de climat archivés dans le cratère de Colonia Tabby nouveau record Le Figaro Premium Abonnez-vous pour 1€ seulement Annulable à tout moment Réagir à cet article 0 commentaire Suivez l'évolution de vos conditions météo En savoir + L'intégrale du Figaro sur tous vos écrans S'abonner Le Figaro dès 22h sur votre ordinateur Lire La boutique en ligne du Figaro Découvrir 10 astuces pour apprendre n'importe quelle langue facilement Découvrir Toutes les applications mobiles du Figaro Télécharger Plus de 15 newsletters thématiques S'inscrire L'actu en temps réel avec Le Figaro Suivre Suivez Le Figaro sur Facebook Découvrir Plus de 500 000 annonces immobilières Rechercher Testez vos connaissances ! Des cadeaux à gagner Jouer Trouvez la meilleure assurance santé en 3 minutes Comparer Jusqu'à 80% de réduction sur les spectacles Réserver Le meilleur de la presse quotidienne et magazine S'inscrire Passez votre annonce dans le Carnet du Figaro Découvrir Plus de 7 000 recettes de cuisine à décrouvrir Rechercher Votre nouveau job parmi 10 000 offres d'emploi Rechercher Le vin du mois en exclusivité - prix direct propriété Découvrir