Tous racistes ? Les biais implicites

La vidéo du jour est un retour à ma série « Crétin de cerveau ». On y parle des biais implicites et des effets d’amorçage en psychologie cognitive et sociale.

Comme je l’explique dans la vidéo, les résultats publiés dans ces domaines sont parfois à prendre avec une certaine dose de sens critique. C’est vrai des tests d’association implicite, mais aussi de certains effets d’amorçage dont la réalité a été critiquée dans certaines publications (par exemple celle-ci.)

Biais implicites sur la science et les femmes

Une étude de complément dont je n’ai pas parlé dans la vidéo mais qui me semble assez intéressante est celle des associations implicites entre « Science/Lettres » et « Hommes/Femmes ». La publication suivante rapporte des résultats de tests réalisés dans différents pays, et montre de sacrés différences.

Nosek, B. A., Smyth, F. L., Sriram, N., Lindner, N. M., Devos, T., Ayala, A., … & Kesebir, S. (2009). National differences in gender–science stereotypes predict national sex differences in science and math achievement. Proceedings of the National Academy of Sciences, 106(26), 10593-10597.

On voit notamment sur la figure ci-dessous que les pays pour lesquelles l’association implicite « Hommes/sciences » et « Femmes/Lettres » est la plus forte sont aussi ceux où les différences hommes/femmes sont les plus importantes sur des tests de science réalisés en collège.

Pour être totalement rigoureux, on pourrait se demander qu’est-ce qui cause l’autre. Est-ce parce que les hommes sont meilleurs en sciences dans un pays donné que le biais implicite se crée, ou l’inverse. Après on peut aussi remarquer qu’il faut vraiment plisser les yeux pour voir la corrélation, même si sur le plan statistique elle semble exister.

Racisme et prophéties auto-réalisatrices

Dans ce billet, je voudrais donner quelques détails sur la dernière étude que j’ai mentionnée, car elle me semble justement d’une certaine solidité méthodologique.

GLOVER, Dylan, PALLAIS, Amanda, et PARIENTE, William. Discrimination as a self-fulfilling prophecy: Evidence from French grocery stores. The Quarterly Journal of Economics, 2017, p. qjx006.

Comme expliqué, dans la vidéo, l’étude porte sur 34 magasins d’une grande enseigne de distribution française (on ne sait pas laquelle !). Les employés considérés dans l’étude sont en contrat de professionnalisation pour une durée de 6 mois. Chaque magasin comporte plusieurs dizaines de caisses et ce sont au total 204 caissières et caissiers qui ont été suivis (majoritairement des femmes, je vais donc employer le féminin).

Chaque jour, un manager supervise un groupe de caisses et les caissières qui y travaillent. Un point clé est que contrairement aux employées en contrat classique, les caissières en contrat de professionnalisation n’ont pas la possibilité de soumettre de préférences pour leurs horaires d’affectation, et se retrouvent donc affectées aux managers par un programme informatique, et de façon plus ou moins aléatoire. C’est très intéressant d’un point de vue de l’analyse des données, car cela veut dire qu’une même employée va tomber sur plusieurs managers de façon quasi aléatoire. Donc on aura plus d’observations différentes.

Au total, ce sont 4371 observations qui ont été collectées, comprenant à chaque fois l’identité d’une caissière, d’un manager, et les chiffres de la performance de la caissière ce jour là. Par performance on entend notamment la vitesse de scan, la durée entre les clients, les éventuels retards ou absences, etc.

Pour les besoins de l’analyse, chaque employée a été classée selon son origine. Ça n’a pas été immédiat car en France il n’est pas autorisé de faire des statistiques ethniques sur une population. Les auteurs de l’article ont donc eu recours aux noms et prénoms des caissières, qui ont permis de proposer une catégorisation réalisée par le CORUM

Pour estimer les biais implicites des managers, les auteurs leur ont fait passer un test d’association implicite dans lequel les mots étaient soit des prénoms (connotés nord-africain, ou pas) soit des mots positifs ou négatifs (plutôt associé au domaine professionnel, la compétence, l’incompétence, etc.)

Ce test a révélé un biais modéré à sévère chez 66% des managers, un biais léger chez 20%, et peu ou pas de biais chez 9%. Chez 4% des managers, le biais était inversé (notons que 6% des managers étaient d’ailleurs issus de minorités).

Pour éliminer l’hypothèse selon laquelle les managers biaisés seraient simplement plus mauvais managers que les autres, les auteurs ont aussi considéré des caissières ne faisant pas partie de minorités, et ont comparé les variations de performance selon les managers.

Sur toutes les métriques considérées, les auteurs ont montré que l’affectation d’une caissière à un manager biaisé conduisait à une diminution de sa performance, diminution statistiquement significative.

Ils ont ensuite mené des entretiens téléphoniques avec les caissières pour tenter de déterminer si elles avaient ressenti un racisme explicite de la part des managers biaisés. Il en ressort que les caissières ne rapportent pas de racisme explicite, ne se plaignaient pas des managers biaisés plus que des autres. Sous la responsabilité des  managers biaisés, elles étaient moins susceptibles de se voir affecter des tâches déplaisantes, mais aussi qu’elles se voyaient moins souvent proposer de faire des heures supplémentaires. Enfin elles avaient aussi tendance à moins bien se rappeler des managers biaisés que des autres.

Cela a suggéré aux auteurs le fait que les managers biaisés interagissaient tout simplement moins que les autres avec les caissières, et que c’est ce déficit d’interaction qui a causé leur performance moindre.

C’est en ce sens que les auteurs parlent de prophétie auto-réalisatrice : parce que les managers biaisés pensent que les employées des minorités sont moins compétentes, ils interagissent moins, conduisant à une diminution de leur performance.

La Conscience

La vidéo du jour parle d’un sujet qui me fascine depuis longtemps, la conscience. Et jamais je n’y serais arrivé sans l’aide de l’excellent Monsieur Phi !

Contrairement à mon habitude, je ne vais pas ajouter trop de compléments dans ce billet, car beaucoup de choses sont déjà très bien traitées sur la chaîne du Sieur Phi, et je vous encourage à y aller pour regarder notamment sa série « Esprit & Matière ». Si vous souhaitez personnellement creuser la question, je vous recommande le livre que Thibaut m’a lui-même conseillé : Philosophie de l’esprit, de Jeagwon Kim. Lire la suite

Retour sur le jugement majoritaire (et l’élection présidentielle)

Alors ça y est, cette fameuse élection présidentielle est enfin terminée !

Je n’ai pas l’habitude de parler politique sur ce blog, mais comme vous le savez peut-être, j’ai publié il y a quelques mois une vidéo sur les différents modes de scrutin envisageables pour élire un(e) président(e). Cette vidéo n’est pas loin d’être la plus vue de la chaîne (plus de 500 000 vues à l’heure où j’écris ces lignes), et je me suis donc dit que c’était intéressant de revenir sur son contenu.

Autre raison d’écrire aujourd’hui : dans cette vidéo, je faisais notamment la promotion de la méthode dite « du jugement majoritaire », or les deux créateurs de la méthode, Rida Laraki et Michel Balinski, m’ont fait la gentillesse de me communiquer les résultats de l’expérience qu’ils ont mené sur le site jugementmajoritaire2017.com.

Si vous connaissez le jugement majoritaire, passez directement à la suite, pour les autres, je vous la remets :

Le vainqueur de Condorcet

Avant de commenter ces résultats, quelques préliminaires. Tout d’abord à cette élection, il s’est passé un truc inhabituel : pour la première fois depuis de nombreuses années, nous avons élu le vainqueur de Condorcet. Petit rappel : on appelle « vainqueur de Condorcet » le candidat qui aurait gagné selon la méthode proposée par le marquis de Condorcet, et qui consiste à opposer tous les candidats en duel (électoral), et à désigner comme vainqueur celui qui gagnerait tous ses duels.

L’histoire est connue, un tel vainqueur n’existe pas toujours en théorie, mais il existe souvent en pratique. Dans notre cas, le vainqueur de Condorcet est celui qui aurait gagné au second tour face à n’importe lequel des 10 autres candidats. Si l’on en croit les sondages (et j’y mettrai un bémol plus loin), Emmanuel Macron aurait battu n’importe quel adversaire au second tour, et est donc le vainqueur de Condorcet. Et ça c’est nouveau car les élections présidentielles précédentes nous avaient habitué à une bizarrerie : il existait un vainqueur de Condorcet (par exemple François Bayrou en 2007), mais celui-ci était incapable de se hisser au second tour.

Cette situation est vraiment étrange : par exemple en 2007, Nicolas Sarkozy a été désigné vainqueur, mais il aurait perdu au second tour contre Bayrou. Ce qui signifie que si le soir de l’élection on avait organisé un référendum pour savoir si les Français étaient d’accord pour remplacer immédiatement Sarkozy par Bayrou, une majorité d’électeurs auraient dit « oui ». Étrange, non ? Eh bien c’est ce qu’il se passe quand on a un système qui désigne un vainqueur qui n’est pas le vainqueur de Condorcet.

Et donc pour cette fois-ci, le système a fonctionné à peu près correctement, puisque nous avons désigné comme président celui qui aurait gagné avec la méthode de Condorcet. On lit çà et là qu’Emmanuel Macron est « mal élu », mais du point de vue des mathématiques du vote, il est « mieux élu » que ce que nous avons pu connaître lors des scrutins précédents.

Le jugement majoritaire

Passons maintenant au cas du jugement majoritaire. La vidéo que j’ai réalisée sur le sujet faisait explicitement la promotion de ce mode d’élection, et certains m’ont reproché de masquer ses défauts, ou d’exagérer ceux des autres scrutins possibles.  Le but premier de ma vidéo était surtout d’alerter les consciences sur les défauts du système actuel, et sur le fait que des alternatives existent. C’est vrai que ma vidéo sonnait peut-être un peu trop « unilatérale », et ça tient principalement au fait que pour des raisons de scénarisation (de « storytelling »), je l’avais construite comme une convergence vers cette méthode.

Donc mettons les choses au clair : en effet le jugement majoritaire (JM) possède des défauts.

On peut citer notamment l’existence de « contre-exemples » dans lesquels le JM désigne un candidat contre-intuitif, mais les cas de ce type ont en général été fabriqués de manière ad hoc, et font appel à des répartitions de mentions totalement irréalistes (du genre beaucoup de « très bien », beaucoup de « insuffisant » et aucun « bien » ou « assez bien ».) En bref je pense que ces exemples théoriques ne sont pas bien gênants.

On m’a ensuite souvent fait remarquer dans les commentaires de la vidéo que le JM est tout autant manipulable, et que les gens sont des bourrins machiavéliques, qui mettront tous « excellent » à leur candidat préféré et « à rejeter » à tous les autres. Eh bien nous verrons que ça n’est pas du tout ce que les gens font en pratique ! Ils utilisent bien toute l’échelle des mentions disponibles. Certes le JM est « théoriquement » manipulable, mais en pratique il est plus robuste que d’autres méthodes.

Le JM a d’autres défauts, certains très théoriques, d’autres assez pratiques (le dépouillement), je pense malgré tout que cela reste la moins mauvaise méthode disponible. Pour moi son défaut numéro 1 reste sa relative difficulté à expliquer…et c’est pour ça que j’ai essayé d’aider la cause !

Les résultats de l’expérience

Passons maintenant aux résultats de l’expérience, et commençons par les bonnes nouvelles. Plus de 52000 personnes ont participé, ce qui n’est pas mal du tout ! Ensuite à l’issue du scrutin, une question leur était posée pour savoir s’ils trouvaient que cette méthode exprimait mieux ou moins bien leur opinion que le scrutin usuel : 95% des répondants ont déclaré préférer cette méthode ! Cela montre que le JM est (au moment du vote) une méthode naturelle et simple pour les électeurs de donner leur opinion.

Et les résultats alors ? Eh bien avant de les révéler, on ne va pas se mentir, il y a un hic : la représentativité de l’expérience ! Celle-ci reposait sur la participation libre, via un site internet, et cela crée un biais de sélection. Comme nous le verrons, les gens ayant voté ne peuvent pas être considérés comme « représentatifs » de la population française. Vous êtes prévenus !

Voici la répartition des mentions obtenues par chacun(e) des candidat(e)s :

Je vous rappelle comment on procède ensuite : on calcule la mention majoritaire de chaque candidat en tirant un trait à « 50% ». C’est la mention que au moins 50% de l’électorat serait prêt à lui attribuer.

En tirant un trait à 50%, on peut lire ici que JL Mélenchon aurait obtenu la mention « Bien », B Hamon « Assez bien », E. Macron « Passable », tous les suivants « Insuffisant », sauf F.Fillon et M.Le Pen « A rejeter ».

Pas besoin de vous faire un dessin : visiblement ce vote est très biaisé à gauche, pas à cause du système de vote mais du fait de l’échantillon des personnes ayant voté. Cela se voit bien si on « simule » un scrutin classique à partir de ces données, en partant du principe que chaque électeur aurait donné sa voix au candidat qu’il a le mieux jugé, on aurait eu un premier tour avec les résultats suivants :

On voit que c’est franchement loin de ce qu’on a vu au premier tour de l’élection, ce qui confirme le biais de sélection. On peut certainement trouver plein d’explications pour cela : les électeurs intéressés au JM étaient plus souvent « à gauche », ou bien l’information concernant ce mode de scrutin a plus facilement tourné dans les cercles « de gauche » des réseaux sociaux (on notera aussi F. Asselineau dont les partisans doivent aimer le JM), etc.

Je me suis demandé s’il fallait parler ou pas de ces résultats, dans le sens où en première lecture, ce biais pourrait donner une mauvaise image de la méthode. Heureusement un deuxième jeu de données, plus représentatif, peut nous permettre d’enrichir l’analyse.

Un sondage représentatif

Un sondage a été mené les 11 et 12 avril par l’IFOP pour la Fabrique Spinoza, auprès d’un échantillon de 1000 personnes représentatives de la population française, agée de 18 ans et plus, comme le veut l’usage.

Bien que réalisé à deux semaines du scrutin définitif, ce sondage nous donne quand même une vue plus représentative que l’expérience précédente. Dans ce sondage, il était question de mettre des notes (entre 0 et 10), et il est possible de les interpréter comme des mentions : TB pour 10 et 9, B pour 8 et 7, … Insuffisant pour 2 et 1, et « A rejeter » pour 0.

Les résultats obtenus ont alors été les suivants :

A partir de ces résultats, on peut faire plein de choses intéressantes : calculer les mentions majoritaires, mais aussi calculer la moyenne des notes (résultat que l’on aurait avec un scrutin « vote par notes »), mais aussi « simuler » un premier tour en conservant pour chaque électeur son candidat préféré. Les résultats se trouvent dans le tableau suivant

(je vous épargne la résolution des ex-aequos au JM)

Premièrement, on constate que le scrutin classique « simulé » reproduit assez bien les résultats que l’on a eu finalement. On est donc bien sur un échantillon représentatif (modulo les barres d’erreur, le fait qu’on n’est pas le jour du scrutin, etc.)

Ensuite, on voit que le classement par jugement majoritaire produit un classement différent du classement par scrutin classique. Je note deux choses :

  • Deux candidats se trouvent significativement moins bien classés par le JM : M. Le Pen et F. Fillon
  • Deux candidats se trouvent significativement mieux classés : B. Hamon et N.Dupont-Aignan.

Pour les premiers, il s’agit de candidats qui polarisent beaucoup : une part significative de la population les a noté « à rejeter », tandis qu’ils se classent respectivement 1ère et 4eme si l’on regarde juste les pourcentages de mentions TB !

Concernant les seconds, je trouve cela particulièrement intéressant : il s’agit de deux candidats qui dans le scrutin traditionnel ont manifestement été pénalisés par le « vote utile ». Beaucoup d’électeurs potentiels de B.Hamon ont voté « utile » pour Macron ou Mélenchon, mais le jugement majoritaire permet de révéler que B.Hamon était bien considéré par une partie des électeurs de ces deux camps.

Le cas de N. Dupont-Aignan est à mon sens encore plus intéressant, et je vais me risquer à faire un peu d’analyse politique. J’imagine qu’idéologiquement parlant, beaucoup de sympathisants de François Fillon auraient pu se retrouver dans les idées de N.Dupont-Aignan (en tout cas du point de vue du premier tour, avant que ce dernier passe une alliance pour le second tour.) On peut penser qu’après les affaires qui ont plombé la campagne de F.Fillon, Dupont-Aignan aurait pu être une solution de repli pour certains de ses électeurs. Sauf que…NDA était un « petit candidat », sans chance visible d’accéder au second tour. Donc j’imagine que beaucoup d’électeurs de droite n’ont pas pris au sérieux la candidature de NDA, préférant « voter utile » pour F.Fillon. Tout comme B.Hamon, NDA a donc certainement aussi été une victime du vote utile et de son statut de « petit candidat ».

Le problème des notions de « vote utile » et de « petit candidat », c’est qu’elles sont extrêmement influencées par les sondages, et qu’en plus les effets sont auto-amplificateurs. Plus un candidat est donné « petit », plus il va le rester. Inversement dès qu’un candidat devient crédible, et que les sondages le démontrent, un effet de rétroaction positif se met en route et peut les faire sortir soudainement de leur statut. Encore une fois je vais sortir de mon champ de compétence, mais je pense que c’est ce qui s’est produit avec F. Fillon lors de la primaire de la droite. Il a longtemps été considéré comme un « petit candidat » face au « vote utile » en faveur de Juppé, mais quelques sondages favorables ont entraîné une boucle de rétroaction positive qui l’ont propulsé en quelques semaines.

Faisons un peu de politique-fiction : imaginons que courant mars on ait publié un (faux) sondage donnant N. Dupont-Aignan à 12%, cela aurait entraîné le même genre de rétroaction positive, et le vote NDA serait devenu le « vote utile » de la droite. A ce train là il aurait même pu gagner cette élection réputée « imperdable » pour la droite il y a encore quelques mois.

Bref, pourquoi je vous raconte tout ça : pour illustrer que le jugement majoritaire est bien plus robuste aux sondages que le scrutin traditionnel ! Il évite les boucles de rétroaction qui condamnent les petits candidats à rester petits, ou au contraire qui peuvent, sur une fluctuation, propulser un candidat comme « le » candidat du vote utile.

Avec le jugement majoritaire, la notion de « petit candidat » disparaît, celle de « vote utile » aussi.

Et le vote par note ?

Quelques mots pour finir sur le vote par note, qui a été testé dans le sondage IFOP que je mentionne ci-dessus. Tout d’abord, on voit qu’il donne un résultat peu éloigné du jugement majoritaire, et pour cause il possède la même vertu de pouvoir permettre à chaque électeur de donner son opinion sur chaque candidat, et ce de manière indépendante.

Par rapport au JM, le vote par note a un avantage clair, et un défaut.

L’avantage est évident : le vainqueur est désigné par une moyenne, un concept que tout le monde comprend. Pourquoi X a-t-il gagné ? Il a eu la meilleure moyenne. Clair, net, précis, pas de contestation possible. Avec le JM, reconnaissons-le, ça n’est pas si simple. La notion de « médiane » (même s’il ne faut pas le présenter comme ça) est beaucoup moins intuitive pour 95% de la population, et le départage des ex-aequos n’est pas si aisé à expliquer.

En revanche, je suis absolument convaincu par le caractère plus « naturel » du vote utilisant des mentions que des notes. Cela parle plus aux électeurs, et même s’il peut subsister des différences d’échelle et d’interprétation d’un électeur à l’autre, je pense qu’elles sont beaucoup moins importantes qu’avec des notes. A l’appui de cette hypothèse : lors du sondage IFOP, moins de la moitié des sondés ont trouvé que le vote par note représentait mieux leur opinion que le scrutin classique, contre 95% qui préféraient la méthode du jugement majoritaire. Un résultat analogue a été constaté et publié dans la revue Nature :

Soyons optimiste, peut-être la présidentielle 2022 sera-t-elle celle de la réforme du mode de scrutin ?

Edit du 20/05 : les résultats publiés et analysés par les auteurs sur le site de laprimaire.org.

 

 

 

Alcool, hormones & décisions

Nouvel épisode de la série « Crétin de cerveau », qui examine l’influence de l’alcool et de certaines hormones sur nos jugements et notre prise de décision :

Comme toujours, quelques compléments.

Tout d’abord j’ai essayé de le faire ressortir dans la vidéo, mais j’en remets une couche : certaines de ces études ont un petit côté perturbant par le fait que les tailles d’effet ne sont pas énormes. Certes, la « significativité » est suffisante pour passer la barrière de la publication (généralement le « petit-p » est inférieur à 0.05), mais l’effet n’est pas dément. Lire la suite

Risques, décisions et incertitudes : la théorie des perspectives

Un nouvel épisode de « Crétin de cerveau » qui tourne autour de la prise de décision en environnement incertain, et particulièrement de la théorie des perspectives de Kahneman & Tversky.

Pas grand chose à ajouter aujourd’hui, les férus de détails trouveront plein d’infos dans l’épais et séminal papier des deux auteurs :

Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of decision under risk. Econometrica: Journal of the econometric society, 263-291.

Lire la suite

Réformons l’élection présidentielle !

Ma nouvelle vidéo est extrêmement importante, puisqu’elle nous parle de l’avenir du pays !

Avant toute chose, n’hésitez pas à la partager massivement pour faire connaître ces réflexions, et aider à populariser la méthode du jugement majoritaire. N’hésitez pas aussi à la relayer par exemple sur Twitter en interpelant vos hommes politiques préférés.

En complément de cette vidéo que j’espère relativement simple à comprendre, je voudrai revenir sur les deux aspects un peu plus techniques : le théorème d’impossibilité d’Arrow, et la question des ex-aequo dans le jugement majoritaire.

(Edit du 22/10 : je vais en fait commencer par la question de la robustesse du jugement majoritaire aux manipulations stratégique, question que j’ai traitée trop rapidement et sur laquelle j’ai eu beaucoup de questions/commentaires) Lire la suite