Jeu de Go, intelligence artificielle et le 19e coup

J’ai pondu une petite vidéo de réaction à chaud sur la victoire du programme informatique AlphaGo sur le champion de jeu de go Lee Sedol. La vidéo est sortie à 2-0 pour AlphaGo. A l’heure où j’écris ces lignes, on en est à 3-1 et il reste une manche à jouer. Mais AlphaGo a donc gagné la confrontation.

(Un petit erratum, en fait j’explique plutôt mal la recherche en arbre, car on ne cherche pas le coup qui conduit à la situation la meilleure dans l’absolu, mais à la meilleure situation en partant du principe que l’adversaire va jouer parfaitement. Une idée qu’on appelle le min-max.)

Un point sur lequelle je voudrai revenir, c’est celui de savoir si on peut considérer que l’algorithme est vraiment intelligent, ou s’il ne fait qu’imiter les maîtres qu’il a étudiés dans sa grosse base de données. Eh bien pour moi l’élément décisif pour répondre vient d’UN coup joué par AlphaGo au cours de la deuxième manche : son 19e coup (le 37e de la partie).

Regardez la vidéo officielle au moment où AlphaGo joue ce coup. Je vous la mets ci-dessous à ce moment exact, observez bien la tête du commentateur de droite (Redmond, un des meilleurs joueurs du monde) quand il découvre le coup et essaye de le placer sur le plateau :

Apparemment — et n’étant pas joueur de go, je me fie aux spécialistes — il s’agit d’un coup sorti de nulle-part. D’abord les commentateurs ont cru à une erreur, un bug. Puis ils ont dit que c’était un « strange move » … et finalement ils ont fini par qualifier ça de « creative move » puis « unique ».

Quelques instants après que le coup ait été joué, Lee Sedol a quitté la table pour faire un break (son horloge continuant à tourner.)

“He’s having trouble dealing with a move he has never seen before”

“It’s something new and unique he has to think about”

Je vous l’ai dit, je n’ai jamais joué au go (et a priori je déteste ce genre de jeu abstrait, comme les échecs, d’ailleurs). Et pourtant je brûle d’envie d’apprendre le go rien que pour comprendre ce 19e coup. Car il semblerait que ce coup soit la preuve d’une véritable intelligence créative de la machine, qui dépasse la somme de tout ce qu’il a pu ingurgiter en parcourant des bases de données de parties existantes.

S’il y a des joueurs de Go dans la salle, je vous en prie, n’hésitez pas à me donner votre opinion sur ce mouvement dans les commentaires. J’aimerai tant comprendre !!

Dans le même genre, on peut citer le mouvement 102 du 1er match. Observez la paralysie de Lee Sedol, puis sa réaction :

Pour ma part, je trouve ça beau…

23 réflexions sur “Jeu de Go, intelligence artificielle et le 19e coup

  1. Alors je ne prétends pas du tout avoir le niveau pour commenter un coup comme celui là mais c’est sûr que localement, il est très contre-intuitif et « dérangeant ». Quand on regarde le goban dans sa totalité, on peut se dire (je crois, corrigez-moi si ce n’est pas le cas) que ce coup est protégé par la pierre en I3 qui agit comme un briseur de shicho (un shicho est une séquence forcée qui projette un combat d’un bout à l’autre du goban) et que ce coup entre dans une dynamique de création de moyo avec G16 et J16. C’est très difficile au go même pour un joueur humain de penser de manière « globale » plutôt que « locale », d’autant plus qu’une approche en diagonale comme ça ouvre énormément de possibilités… Mais là il me semble que noir impose à blanc sa direction de jeu :/
    En tous cas je déconseille fortement à des nouveaux joueurs de s’essayer aux approches sur la 5ème ligne comme ça, en général c’est catastrophique ^_^

    Si tu souhaites découvrir le jeu de go, hésite pas à passer dans un club ou à demander une initation sur KGS 🙂 C’est un site internet pour jouer avec des gens du monde entier, online : )

  2. Tout à fait d’accord avec Castanietzsche. J’ajouterais que ce coup est le genre de coup tentant quand on débute et que l’on se focalise beaucoup sur « je veux enfermer l’adversaire ». Mais l’adversaire est en général très content qu’on le laisse se renforcer sur la 4ème ligne. Assez vite on apprend que le territoire se fait bien plus facilement sur les côtés que sur le centre du plateau, et on tend à délaisser des coups très haut comme celui-là où l’on a l’impression de ne pas construire grand chose.
    Il me semble surtout que ce coup est risqué, justement parce qu’il crée une légère influence (moyo) sur le centre, mais sans franchement attaquer le côté. Si l’on ne parvient pas à l’exploiter pleinement, il peut vite devenir un coup dans l’eau. De mon petit niveau, je suis certain d’être incapable d’exploiter l’influence de ce coup, à part éventuellement sur un déroulement simple comme une échelle (shicho).

    Était-ce particulièrement innovant ou particulièrement culotté ? Venant d’un être humain, on aurait peut-être même pu se demander s’il sous-estimait son adversaire ?

  3. Si le 19ème coup est réellement exceptionnel, il serait intéressant d’étudier le cheminement de l’information qui a conduit AlphaGo à le choisir. En effet, il faut bien comprendre que ce coup n’est pas créé, mais est le simple résultat de millions d’opérations basées sur le match actuel et la base de données d’autres parties.

    Peut-on dire que AlphaGo est intelligent ? J’aimerais renverser la question… Peut-on dire que l’homme est intelligent ? AlphaGo agit par mimétisme, et ses actions sont le résultat de millions d’opérations, on peut penser qu’il n’est pas doué de « création ». Et si maintenant, on prenait le problème dans l’autre sens… Comment nous viennent nos idées ? Le cerveau humain agit également par mimétisme, peut-être que ce que nous appelons « création » n’est que le bête résultat d’opérations semblables à celles qu’effectuent AlphaGo. Seulement, si pour AlphaGo, nous pouvons analyser le cheminement qui conduit à une décision, c’est beaucoup plus complexe pour le cerveau humain. Peut-être que nous ne sommes pas si différents des intelligences artificielles !

    L’homme peut faire ce qu’il veut, mais peut-il vouloir ce qu’il veut ? Schopenhauer et le problème du libre arbitre 🙂

    Merci pour la vidéo et cet article.

  4. D’ailleurs au passage, je regardais en direct le 3ème match, et je trouve intéressant de voir que Alphago a joué des coups objectivement sans intérêts ou même carrément mauvais, car laissant l’initiative à Lee Sedol sans aucun gain. Cependant, il ne l’a fait que lorsque dans la bataille du centre (assez complexe) il s’est trouvé sans option qui lui permette un échange équitable. C’est comme si il avait alors choisi de jouer des coups quelconques juste pour laisser le plateau évoluer et pouvoir chercher de nouveau des choses à faire.
    Il y avait pourtant beaucoup de coups intéressants à jouer ailleurs, comme dans la partie basse du plateau, et il avait une large avance de temps de réflexion (Lee Sedol est arrivé au temps complémentaire alors qu’il restait à Alphago 1h10 sur ses 2h je crois).

    Bug ?

    • Un développeur, lors d’une interview, expliquait que le but d’Alphago était la victoire et non la différence de point. Il préférera ainsi sécuriser sa victoire, même avec une différence faible, plutôt que de creuser la différence de point. Cette stratégie est assez contre-intuitive pour un humain et donne lieu aux coups que vous décrivez. La vérité est donc que du point de vu d’Alphago, le match était déjà joué à ce moment-là de la partie.

      • Euh, justement, non, ce n’est pas du tout contre-intuitif pour un humain. C’est la bonne manière de jouer : le but, au go, est de gagner, peu importe la différence de point. Donc, c’est comme au foot : une fois qu’on a pris l’avantage, on cherche d’abord à garder l’avantage en fermant le jeu. Par contre, un autre principe important, c’est qu’il faut éviter de laisser l’initiative à l’adversaire.

  5. Concernant le coup 19 (enfin 37 si on compte comme les joueurs de go ^^), c’est typiquement le genre de coup pour lesquels on se ferait vertement critiquer par un joueur plus fort. En le voyant j’ai tiqué parce qu’à vue de nez ça ressemble furieusement à un mauvais coup de débutant. Mais on bat rarement Lee Sedol comme ça ^^

  6. Une modeste réflexion sur la question de savoir si l’algorithme est vraiment intelligent. Cette question me semble liée à celle de la conscience, or j’ai lu récemment un petit article fort intéressant sur le sujet : http://www.pourlascience.fr/ewb_pages/a/article-quelle-conscience-pour-les-ordinateurs-36568.php (Pour la Science, mars 2016 – pas en accès libre, désolé). En reprenant un critère attribué à Leibniz, on peut considérer qu’un ordinateur est conscient s’il sait lui-même produire la suite des opérations qui l’ont conduit à la conclusion. (Bien sûr, la plus grande partie des élaborations du cerveau humain échappe aussi à sa « conscience » !). Il existe des algorithmes qui se prêtent à cela, mais (à ma connaissance), cette capacité échappe totalement aux réseaux de neurones ! Je ne parviens pas à me remémorer qui avait dit, après qu’un réseau de neurone ait résolu un problème, quelque chose du genre : « l’ordinateur a compris, mais pas moi ! ».

  7. À mon tout petit niveau de faible amateur, j’intuite que ces deux coups NE SONT PAS DU TOUT « dans le même genre ». 😉 Le 102 de la première partie ressemble furieusement à un coup tactique justifié par une énorme puissance de calcul. Le 37 de la deuxième est (a posteriori) purement stratégique, et repose sur l’équivalent d’une approche globale d’une grande profondeur. En tout cas c’est fascinant.

  8. Elargissons le débat. Le débat sur l’intelligence artificielle, je veux dire, pas celui sur cette partie de jeu de go.
    Je pense que la meilleure définition de l’intelligence c’est la capacité de se poser des questions. Elle rend en tout cas compte de l’intelligence humaine et de celle de certains animaux. Par contre, je ne crois pas qu’on ait pour l’instant réussi à prouver que des machines pouvaient se poser des questions. On sait leur faire poser des questions prévues dans des algorithmes, mais sont-elles capables de poser des questions nouvelles auxquelles elles seraient seules à avoir « pensé » ? Le genre de question comme celle que se posait Einstein, par exemple, qui se demandait comment il verrait les choses s’il voyageait sur un photon ? Le genre de questions dont on n’entrevoit même pas qu’elles puissent avoir un jour un début de réponse mais auxquelles on s’efforce quand même de réfléchir, tout simplement parce qu’elles s’imposent à vous sans qu’on puisse rien y faire.
    Alors pour en revenir à Alphago, je voudrais savoir s’il se pose des questions pendant qu’il dispute une partie ou s’il ne fait que répondre aux problèmes que lui pose son adversaire.
    Mais il faudrait déjà savoir si les joueurs de go humains se posent des questions ou s’ils ne font que répondre aux problèmes que leur posent leurs adversaires.

    • Je pense qu’au dela de savoir si une IA se pose des questions, c’est surtout, comment y repond elle ? On peut considerer que l’AlphaGO se pose la question: « Comment battre mon adversaire? » et que toute son ‘algorithme’ constitue sa recherche de reponse a cette question.

      Apres, comme le dit Yann LeCun, on est encore tres loin de pouvoir creer une IA ‘multifonction’, qui puisse reflechir a de multiples domaine etc… (d’ou l’inquietude d’une IA reduisant l’humanite en esclavage, infondee pour le moment).

      Ce qui me fascine surtout dans ce domaine, c’est qu’on en vient a se poser des questions sur nous meme: qu’est ce que l’intelligence ? la creativite ? l’imagination ? En quoi sommes nous different ?

  9. Pingback: Jeu de Go, intelligence artificielle et le 19e ...

    • je viens de t’entendre sur Inter. Bravo pour ta bonne prestation (j’imagine que la radio est une expéricnce particulière), et donc à tout à l’heure pour ta prochaine vidéo. Comment de physicien fonda tu t’es retrouvé chez St-Gobain ?

  10. Pingback: Jeu de Go, intelligence artificielle et le 19e ...

  11. A propos du passage : « ou s’il ne fait qu’imiter les maîtres qu’il a étudiés dans sa grosse base de données », je voudrais faire remarquer qu’Alphago n’a pas de parties de maitres dans sa base de données: son point de départ est constitué d’un grand nombre de parties d’amateurs jouant sur internet. Même si certains amateurs sont forts, le niveau de ces parties est sans comparaison avec le niveau pro. La vraie force d’Alphago est d’avoir réussi à augmenter énormément son niveau à partir de ce point de départ relativement bas, en jouant des millions de parties contre lui-même. Du coup ce n’est pas si étonnant que son style se différencie assez de ce qu’on attendrait de la part d’un pro : il ne se base pas sur le jeu des pros, mais sur une évolution « personnelle ».
    La partie 4 gagnée par Lee Sedol montre qu’il n’est pas encore invincible, on peut au moins se réjouir de l’excellent spectacle pour les amateurs de go, avec des parties très excitantes pleines d’imprévu 🙂

  12. « Un point sur lequelle je voudrai revenir, c’est celui de savoir si on peut considérer que l’algorithme est vraiment intelligent, ou s’il ne fait qu’imiter les maîtres qu’il a étudiés dans sa grosse base de données. Eh bien pour moi l’élément décisif pour répondre vient d’UN coup joué par AlphaGo au cours de la deuxième manche : son 19e coup (le 37e de la partie). »

    Vous assimilez « la force de calcul » à partir de données préétablies à de l’intelligence artificielle, alors que l’intelligence est la faculté de faire, dans le sens, de savoir assembler ou désassembler à partir des idées. Le jour où un programme ou un algorithme aura une idée, faites-moi signe !

    Le 19e coup s’explique par la sérendipité. La sérendipité étant souvent à la base du génie humain. Ici, l’abduction alliée à la vitesse d’analyse en est la cause, non pas le hasard et encore moins l’intelligence dans le sens d’un coup volontaire.

    Bien à vous…

  13. Pingback: LUNDISPENSABLE #17 SPÉCIAL INTELLIGENCE ARTIFICIELLE - La Fribune

  14. Cela fait 40 ans que je n’ai pas joué au Go. De toute façon je n’étais pas de niveau pour commenter ce match, et je ne le suis toujours pas. Ce match pose plusieurs questions, notamment comment explorer un arbre et élaguer des branches a priori mortes? Il y a des algorithmes , type min / max, alpha/beta… C’est ce genre de choses qui était utilisées par Deep blue contre Kasparov il y a 20 ans (+ une bibliothèque d’ouvertures et de parties). Mais je m’interroge sur deux autres questions.
    1) Est-ce que ce programme aurait aussi battu un autre joueur, de même niveau que Lee Sedol? Je m’explique : en plus des milliers de joseki (ouvertures) stockés, et de centaines de parties jouées par des maîtres, les auteurs du programme savaient que leur adversaire serait Lee Sedol, et pas un autre. Même s’il n’en est pas conscient, il est probable que chaque joueur possède un « style », un répertoire de réactions à certaines situations qui peut être analysé en amont par un autre programme. Dans ce cas, il est peut être possible pour la machine de jouer des coups « étranges », et étrangers à Lee Sedol, et donc très perturbants. Notons au passage que cette remarque avait déjà été faite par Kasparov, qui reprochait à IBM d’avoir connaissance de toutes ses parties, alors que lui même ignorait les parties analysées en amont, pour concevoir Deep Blue (voir Wikipedia).
    La seconde question porte sur l’intelligence éventuelle de la machine (ou du programme). Est ce bien raisonnable de se poser cette question alors qu’on n’a pas de définition précise de ce qu’est l’intelligence humaine (ou animale), ou des différentes formes d’intelligence? Jacques Pitrat, un pionnier de l’IA, me disait il y a 20 ans, qu’un grand pas serait fait en IA le jour où une machine serait capable a) d’apprendre à jouer à n’importe quel jeu (et non programmée pour un seul), et b) susceptible de faire des fautes, de s’en « rendre compte », et de corriger.
    Pour finir, je crois que c’est Turing qui avait suggéré le test suivant : mettez une machine dans une pièce, vous dans un autre, et un messager pour transmettre les coups. Voyez si vous êtes capable de deviner si vous êtes face à un humain ou non. Et éventuellement, concluez vous même.

    Félicitations pour votre site. C’est un plaisir de vous lire.

    • Quelques réponses à cet intéressant commentaire:

      1) AlphaGo n’a pas du tout été élaboré spécifiquement pour Lee Sedol, il est parti d’une base de données de parties de joueurs forts sur internet (dont Lee Sedol ne fait pas partie) et s’est entrainé contre lui-même tout seul, donc les concepteurs n’ont pas tiré partie du fait que l’adversaire était connu.

      2) Sans débattre sur la définition de l’intelligence, qui est effectivement un noeud du problème, il est intéressant de noter que la même entreprise, DeepMind, s’était déjà faite remarquer avec un programme capable d’apprendre à jouer à n’importe quel jeu de la console Atari, sans connaitre les règles a priori, et de développer petit à petit la meilleure stratégie, comme le ferait un humain. Le résultat est assez impressionnant et semble répondre à votre requête. Voir par exemple cet article: http://www.lemonde.fr/pixels/article/2015/02/25/un-algorithme-capable-d-apprendre-a-jouer-aux-jeux-video_4583358_4408996.html

  15. Pingback: L’an 70 avant Google DeepMind | La Forêt des Sciences

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s