Robert Axelrod et l’évolution de la coopération

Pourquoi la coopération existe-t-elle ? Comment se fait-il que la plupart des hommes et certains animaux coopèrent entre eux, alors que la nature semble favoriser les comportements individualistes et égoïstes.

En 1981, pour essayer de répondre à cette question, un professeur en sciences politiques et un spécialiste en zoologie ont écrit un des papiers les plus étonnants qu’il m’ait été donné de lire.

L’existence de la coopération

La coopération existe chez de nombreuses espèces vivantes. C’est bien entendu manifeste chez l’homme, mais ça n’est pas son privilège. Elle se retrouve chez toutes les espèces qui vivent en société, de la meute de loup à la colonie de fourmis, mais également entre des espèces différentes voire très différentes.

On peut penser au poisson nettoyeur, qui rend service à un plus gros poisson en échange de la promesse de ne pas se faire manger;  mais aussi aux situations de symbiose en général, par exemple pour les bactéries qui composent notre flore intestinale.

Pourtant, le comportement altruiste ne va pas de soi. De même que l’être humain trouve parfois un intérêt à entuber son prochain, on peut se demander pourquoi le gros poisson ne mange pas le petit, une fois que ce dernier lui a lavé les dents. Du point de vue de la sélection naturelle, se comporter en salaud peut sembler un avantage qui permet de maximiser ses probabilités de survie. Et on peut donc imaginer que les comportements altruistes auraient du être supprimés par l’évolution.

Et pourtant, dans les sociétés humaines et chez les animaux, il semble que les salauds égoïstes ne soient pas toujours ceux qui réussissent le mieux. Pour investiguer la nature des comportements de coopération et comprendre comment ils avaient pu apparaître chez les êtres vivants, Robert Axelrod et William Hamilton ont formalisé le problème en utilisant le cadre mathématique de la théorie des jeux.

Le jeu de la coopération

La théorie des jeux est une branche des mathématiques qui étudie les processus de décision en présence de plusieurs partenaires. Un exemple de la vie lycéenne : vous êtes un groupe de deux élèves et on vous confie la rédaction d’un exposé. Chacun des deux partenaires peut choisir soit de travailler, soit de ne rien faire. Tous les deux peuvent avoir la tentation de ne rien faire et de laisser l’autre bosser, mais si aucun des deux ne travaille, tout le monde sera perdant. L’idéal est de coopérer mais personne n’a vraiment envie.

On peut formaliser ce genre de situation en imaginant une situation à deux partenaires, où chacun a le choix entre deux options « Coopérer » ou « Trahir ». Les partenaires choisissent en secret, et en fonction des choix respectifs, ils gagnent plus ou moins de points. Considérez le tableau suivant, qui donne les points obtenus par les joueurs A et B en fonction de leurs choix :

Comme vous le voyez, si l’un trahit et l’autre coopère, le traitre empoche la mise. Du coup les deux sont tentés de trahir plutôt que de coopérer. Mais si les deux trahissent le gain sera plus faible que si les deux choisissent de coopérer. La coopération est la meilleure solution au global, mais aucun des deux n’a d’incitation à le faire. Cette situation est représentative du dilemme du prisonnier, dont j’ai parlé dans ce billet.

Si on ne joue le jeu qu’une seule fois, il est clair que chacun essaiera de trahir l’autre. Mais si on décide de le répéter plusieurs fois de suite, la donne change, car les joueurs peuvent par leur comportement punir la traitrise ou encourager la coopération. Voyons les différentes stratégies possibles.

Les stratégies en jeu répété

Imaginons qu’avec un même partenaire, vous jouiez 100 fois de suite au jeu que j’ai défini ci-dessus. Il vous faut choisir une stratégie, c’est-à-dire une méthode permettant pour chaque tour de décider de votre prochain coup, en fonction de ce qui s’est passé les tours précédents.

Une stratégie possible, dite stratégie méchante, c’est de choisir « Trahir » à tous les tours. Simple, bourrin, mais pas très constructif et probablement pas optimal. Une autre stratégie, dite stratégie gentille, c’est de choisir « Coopérer » à tous les tours. Mais si vous faites ça, il y a fort à parier que votre partenaire exploitera votre naïveté en vous trahissant tout le temps.

On peut bien sûr imaginer des règles de décision encore plus subtiles comme celle de la stratégie rancunière : « Coopérer au début, et à la moindre traîtrise du partenaire, le trahir jusqu’à la fin des temps » (reconnaissez que l’on fait souvent ça dans la vraie vie). Ou encore la stratégie lunatique où l’on joue au hasard l’un ou l’autre.

Pour tester la valeur des différentes stratégies possibles, Robert Axelrod a décidé d’organiser un grand tournoi informatisé. Il a demandé à près de 60 personnes (mathématiciens, physiciens, psychologues…) de soumettre des stratégies, et il les a programmées. Dans son tournoi par ordinateur, chaque stratégie a été confrontée à toutes les autres dans des jeux répétés, et à la fin on a compté les points accumulés par chaque stratégie.

Certains contributeurs ont soumis des stratégies très simples, comme simplement alterner « Trahir » et « Coopérer », ou encore « Coopérer sauf si l’autre a trahi 2 fois de suite » ; alors que d’autres ont imaginé des choses très compliquées, comme « faire un modèle markovien des décisions de l’adversaire et estimer le meilleur coup à l’aide d’inférence bayésienne ».

La supériorité du « donnant-donnant »

A la surprise générale, le grand gagnant du tournoi d’Axelrod fut une stratégie extrêmement simple, soumise par le théoricien des jeux Anatol Rapoport (ci-contre). Cette stratégie nommée « Donnant-donnant » (tit-for-tat en anglais) consiste simplement à rejouer exactement ce que votre partenaire vient de jouer : au premier tour, vous coopérez ; puis à chaque tour, si le partenaire vient de vous trahir, vous le trahissez, mais s’il a coopéré, vous coopérez.

C’est une stratégie à mémoire courte, qui ne se base que sur le dernier coup joué par l’adversaire. Dès qu’il vous trahit, pas de tergiversations, vous le punissez en trahissant. Mais s’il revient à la coopération, vous coopérez, même s’il a tenté de vous entuber 100 fois avant. On peut appeler cette stratégie « Punition immédiate, mais pardon inconditionnel ». Pour les parents, un principe éducatif à méditer.

Dans ses tournois, Robert Axelrod a pu constater que le donnant-donnant finissait toujours par accumuler plus de points que toutes les autres stratégies. Il a alors eu l’idée d’organiser une version évolutionnaire du tournoi : on part avec plein de stratégies, on organise le tournoi, on compte les points, puis on recommence un nouveau tournoi en changeant la proportion de chaque stratégie en fonction des points obtenus au tournoi précédent. De ce fait, les stratégies qui font peu de points sont progressivement éliminées, et celles qui font beaucoup de points se multiplient. Comme dans la nature…

Et Axelrod a pu constater qu’au bout d’un moment, seule la stratégie « donnant-donnant » reste ! Ce surprenant résultat montre qu’une stratégie coopérative peut parfaitement s’imposer dans un environnement de compétition et de sélection naturelle.  « Nice guys finish first », bonne nouvelle !

Pour aller plus loin

Axelrod et Hamilton ont détaillé les conditions nécessaires pour qu’une stratégie comme « donnant-donnant » s’impose. Il faut comprendre comment 1) elle peut survivre au départ, 2) être stable quand elle s’est imposée et 3) résister ensuite à l’invasion de quelqu’un pratiquant une autre stratégie.

Ils montrent alors qu’un élément clé est la probabilité que deux partenaires se rencontrent à nouveau. En effet si vous ne jouez qu’une seule fois au jeu, vous avez intérêt à trahir, mais pas s’il est répété. Donc à chaque tour, si vous pensez que vous allez retrouver plus tard votre partenaire, vous avez intérêt jouer coopératif. Par contre si vous jugez que la probabilité de se revoir est faible, vous avez intérêt à le trahir. Un principe bien connu des vendeurs.

De manière étonnante, les auteurs y voient une justification de l’existence de certaines maladies sous forme chronique ou aïgue. Tant que le porteur d’une bactérie reste valide, la bactérie a intérêt à coopérer et à le maintenir en vie, mais dès que la bactérie sent que le porteur risque de disparaître (le jeu va s’arrêter), elle achève son porteur pour en profiter au maximum.

Par ailleurs il y a pas mal de résultats sur des stratégies capables de faire mieux que donnant-donnant. Notamment une stratégie « Gagne/reste Perd/change » ou l’on joue le même coup qu’avant si on a gagné, mais on change si on a perdu.

Pour d’autres infos et une revue des différentes stratégies http://www.lifl.fr/IPD/ipd.html

Robert Axelrod et William Hamilton, The Evolution of Cooperation, Science 211, p1390 (1981)

24 réflexions sur “Robert Axelrod et l’évolution de la coopération

  1. Tit-for-tat, un grand classique, mais la question qu’on peut toujours se poser dans ce genre de travaux est la pertinence pour la biologie évolutive (et ayant fait des choses proches, je m’autocritique ici 😉 ). Le même problème se pose en économie : dans les deux cas, il est tellement difficile de faire des expériences qu’il n’est même pas sûr que la théorie en question soit « réfutable » dans la pratique (même si elle l’est bien sûr en théorie si on pouvait se donner quelques millions d’années pour faire un expérience naturelle d’évolution).

    • En effet, l’apport se situe plutôt au niveau de la « preuve de concept » que de la théorie scientifique. J’aime bien aussi la leçon pour la vie en société 🙂

      Au niveau théorique, une des difficultés semble être que la supériorité de tit-for-tat dépend de la distribution initiale des stratégies. Dans le tournoi initial, chaque stratégie est soumise une fois. Sur la page du LIFL que je mentionne, ils critiquent notamment un tournoi « à la Axelrod » organisé à l’occasion d’une conf, et où certains on soumit plusieurs fois la même stratégie…et notamment le vainqueur en a soumis 100 !

      Est-ce qu’on ne peut quand même pas prouver à un niveau plus général la supériorité des stratégies « nice », celles qui ne trahissent jamais en premier ?

  2. Est-ce qu’il n’y a pas dans Maynard Smith des choses qui antidatent un peu Axelrod? (sûrement pas le coup du tournoi informatique mais ça c’est du marketing…)

    • la stratégie donnant donnant pose problème quand le nombre de jeu répété est fini. Les joueurs savent qu’au dernier coup, ils peuvent trahir car il n »ya aura plus possibilité de repressailles. De là , ils décident de trahir aussi à l’avant dernier coup. puis au oup précédent, et ce choix remonte jusqu’au premier coup

  3. Intéressant article.
    Juste un détail : l’exemple de la colonie de fourmis en début d’article n’est peut-être pas très judicieux. Plus que par la théorie des jeux, c’est par l’haplodiploïdie qu’on explique l’altruisme chez les hyménoptères (donc par la proximité génétiques entre les sœurs).

    • Oui, j’ai fait l’impasse là-dessus mais de manière générale, il n’y a en effet pas besoin d’invoquer la théorie des jeux pour expliquer l’apparition de la coopération au sein d’un individus proches appartenant à une même espèce. On peut se contenter d’une explication de type « gène égoïste » pour justifier le fait que la coopération soit sélectionnée par l’évolution.

      Mais dès qu’on parle d’espèces très différentes, ce genre d’explication ne marche pas. Tout ça était bien expliqué dans l’intro du papier d’Axelrod et Hamilton, mais je ne l’ai pas repris faute de place…Heureusement que les commentaires me permettent de le faire !

  4. Pingback: Robert Axelrod et l'évolution de la coopération « Science étonnante | Le travail | Scoop.it

  5. Dans mon souvenir, la sélection de parentèle explique la coopération au premier coup (stratégie gentille), et la théorie des jeux (dilemme du prisonnier itéré) le maintien de la coopération par la suite. Effectivement ça ne marche que pour les animaux sociaux et la coopération intraspécifique / intrapopulationelle.

    Bon article en tout cas ! Je voulais faire le même suite à mon article sur le dilemme du prisonnier ( http://svtcolin.blogspot.com/2010/05/dilemme-prisonnier-theorie-jeux.html ) mais là je vais renoncer ou attendre un peu au moins !

  6. Le problème avec la démonstration d’Axelrod c’est que pour que Tit-for-tat marche, il faut que personne ne sache quand le jeu s’arrête. Car si l’on sait qu’il finit au coup n, alors comme tu l’expliques, on a intérêt à « trahir » au coup n-1. Mais sachant cela, il faut aussi trahir au coup n-2 et de fil en aiguille il faut trahir depuis le début. Et puis, chez les animaux sociaux, insectes ou mammifères, je n’ai pas connaissance d’un comportement plus porté à la « trahison » vers la fin des interactions: est-on plus enclins à voler les vieillards parce qu’ils arrivent en fin de vie?

    En fait comme Tom, ce qui me gêne dans la théorie des jeux appliquée à la biologie, c’est qu’elle présuppose une très grande capacité de l’évolution à adapter très finement les comportements pour les optimiser. Or il me semble que les comportements sont forgés et sélectionnés de façon un peu plus grossière: les animaux sociaux sont coopératifs entre eux, sans condition. Il suffit que cette attitude leur soit globalement bénéfique pour qu’elle soit sélectionnée par l’évolution et perpétuée de génération en génération sans trop finasser sur les détails. C’est en tous cas ce que montrent les travaux sur l’empathie de Franz de Waal…

    • Tu as raison, et c’est ce que j’évoque à la toute fin de l’article : Axelrod et Hamilton y voient une justification pour les maladies qui ont une forme chronique puis une forme aiguë. La maladie passe en mode aigu quand elle ‘sent’ que la probabilité que la coopération se poursuive est faible. Alors elle ‘trahit’ son hôte. Je ne sais pas ce que le raisonnement vaut.
      Les deux auteurs donnent aussi un autre exemple que je n’ai pas compris, sur des phénomènes du genre trisomie 21.

  7. Pingback: Pierre-Feuille-Ciseaux chez les animaux « Science étonnante

  8. Bonjour,
    tout d’abord j’adore ce site je me régale; une question:
    quand 2 personnes font un marché, elles tirent toutes deux parti de ce marché sans aucun autre raisonnement nécessaire non?
    Quand une espèce est attaquée par un parasite, seuls les individus qui lui résistent survivent, et ceux qui arrivent à tirer parti de cette bactérie se développent encore plus non?
    J’ai l’impression que M. Robert Axelrod est parti d’une observation pour l’adapter à l’évolution plutôt que d’observer la vie et d’en tirer les conclusions…?
    Comme si les données étaient:
    -Les individus, les espèces travaillent ensemble, comment cela se passe au mieux
    alors que la vie c’est plutôt
    -chacun pour soi et l’évolution fait le reste
    où me trompe-je?
    merci 🙂

    • Il me semble que la question n’est pas « pourquoi les individus coopèrent au départ », mais plutôt « pourquoi la coopération est-elle stable ». Comme tu le dis « elles tirent toutes deux parti de ce marché sans aucun autre raisonnement nécessaire », mais avec un petit peu de raisonnement, elles ont intérêt à trahir. Pourquoi ne le font-elles pas ?

  9. La coopération peut très bien être une SES (une stratégie évolutivement stable) mais peut être supplanté dans certains cas par des comportements égoïstes. En général, elle se maintient chez les espèces pratiquant la coercition(c’est à dire la punition des individus égoïstes). Cependant, il y a beaucoup moins d’altruisme dans la nature que ce que la théorie laisse supposer.

  10. Werber parle d’un tournoi ou plusieurs stratégies sont confrontées en même temps. Voilà j’aimerais avoir des informations sur comment se déroule chaque « manche » lorsqu’il y a plus de 2 joueurs. Qui rencontre qui ? Est-ce aléatoire ?
    Merci de votre aide et de cet excellent article.

  11. Pingback: Les bactéries aussi savent compter ! | Science étonnante

  12. Pingback: Deux stratégies révolutionnaires en théorie des jeux (1/2) | Science étonnante

  13. Pingback: Deux stratégies révolutionnaires en théorie des jeux (2/2) | Science étonnante

  14. Pingback: Stratégie jeux | Pearltrees

  15. Pingback: Une stratégie infaillible au poker | Science étonnante

  16. Pingback: Robert Axelrod et l'évolution de la coop...

  17. Pingback: Accorder sa missions aux principes qui régissent la vie, la société, l’économie et l’écologie | Maxime Lamontagne

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s