Le paradoxe des anniversaires

Hier soir, vous avez organisé une petite fête et invité une vingtaine d’amis. Alors qu’au milieu de la soirée, la conversation tourne (allez savoir pourquoi) sur les signes du zodiaque, deux de vos invités découvrent avec stupeur que leur anniversaire tombe le même jour !

– Incroyable !

– Ah oui, quelle coïncidence !

– Tu imagines la probabilité que ça arrive ?

Eh bien justement, parlons en de la probabilité !

Il se trouve qu’elle n’est pas du tout négligeable : dans un groupe d’environ 25 personnes, il y a plus de 50% de chance que deux de ces personnes soient nées le même jour. Ce résultat est tellement contraire à notre intuition qu’on l’appelle le paradoxe des anniversaires.

Pour les incrédules et les lycéens qui révisent les probas pour le bac, faisons ensemble le calcul pour un groupe de N personnes. Pour faire cela, on va prendre le problème à l’envers, et calculer la probabilité P que toutes les personnes aient leur anniversaire un jour différent. Et pour calculer cette probabilité, on va classiquement procéder par dénombrement.

Commençons par l’ensemble de tous les cas possibles : pour la première personne, 365 dates sont possibles, pour la seconde aussi, de même que pour la troisième et toutes les autres. Si on multiplie tout ça il y a donc 365^N cas possibles.

Maintenant quels sont les cas où les anniversaires sont tous différents : pour la première personne il y a 365 choix, pour la seconde il n’en reste que 364, pour la troisième 363, etc. et pour la Nième seulement (365-N+1). Si on multiplie tout ça on trouve la quantité 365! / (365-N)! (pour les lycéens, celle qu’on note parfois A(365,N), le nombre d’arrangements).

On peut donc calculer notre probabilité P qui vaut

P = \frac{365!}{365^N (365-N)!}

J’espère que vous me croyez pour l’application numérique, mais avec N=23 personnes on trouve P = 0,49. Mais rappelez vous que P est la probabilité que les anniversaires soient tous différents. Donc la probabilité qu’il y en ait au moins deux identiques est 1 – P, soit ici 0,51, c’est-à-dire 51% de chance !

Et plus il y a de personnes dans le groupe, plus cette probabilité augmente. Dans un groupe de 50 personnes, il y a plus de 95% de chance que deux personnes aient leur anniversaire le même jour.

Pour trouver d’autres paradoxes de ce genre, on peut calculer la probabilité en remplaçant 365 par n’importe quel nombre K, et pour n’importe quelle taille de groupe N. Le résultat est représenté dans le graphique ci-dessous, la couleur indiquant la probalité que 2 personnes au moins parmi les N aient une caractéristique identique, celle-ci étant prise dans un ensemble de taille K.

Prenons un exemple précis : il y a 365 jours dans l’année et 24 heures par jour, soit au total 8760 tranches horaires pour naître dans l’année. Le graphique montre que dès que vous réunissez une centaine de personnes, il y a plus de 50% de chance que deux personnes soient nées le même jour dans la même tranche horaire ! Encore un résultat contre-intuitif, qui justifie l’appellation de paradoxe !

Ah oui, sinon c’est mon anniversaire cette semaine 🙂

Pour aller plus loin…

Quelques considérations pour les plus curieux. Tout d’abord, ce raisonnement ne vaut que si les N personnes ont leur jour de naissance distribué de façon uniforme dans l’ensemble des possibles. On sait pour les naissances que c’est en gros le cas, mais le raisonnement ne tient pas par exemple avec les prénoms.

Petite précision technique : pour réaliser le graphique, je n’ai pas fait le calcul direct de la probabilité, mais je suis passé par son logarithme. Ça marche très bien grâce à la formule de Stirling qui donne une excellente approximation de N! dès que N dépasse 10, et ça évite de manipuler des chiffres astronomiques du genre la factorielle de 10000.

Il existe une application concrète de ce paradoxe, où plutôt de la nécessité de l’éviter. Comme vous le savez peut être, il existe des méthodes (comme le « MD5 checksum ») qui permettent d’associer un identifiant numérique à un fichier. Si vous voulez que ce nombre identifie de manière quasi-unique ce fichier parmi tous vos fichiers, vous devez vous assurer que la probabilité que deux fichiers différents aient le même MD5 soit suffisamment faible. Cela fixe la taille K de l’ensemble des identifiants. Si vous avez N fichiers, il faut prendre K suffisamment grand pour que p(N,K) soit suffisamment faible. Comme le montre la carte colorée, dès que N devient grand il faut aller chercher des K astronomiques pour avoir des probas de conflit disons de 1% ! Pour le MD5, il y 2^128 combinaisons, environ 10^38 !

A lire aussi : Le billet de ElJJ « Une chance sur beaucoup« , où l’on apprend entre autre qu’il y a 200 fois plus de chance de gagner au loto que de réunir 120 personnes sans qu’aucune n’ait son anniversaire le même jour qu’une autre…

20 réflexions sur “Le paradoxe des anniversaires

  1. Joyeux anniversaire en avance dans ce cas ! 😀
    Un grand classique, j’aurais juré que vous l’aviez fait, mais non ! En tout cas, il ouvre d’autres horizons sur l’application, et c’est ce qui fait le petit plus qui vous caractérise ! Bravo !

  2. Joyeux anniversaire aussi ! Un peu dommage que je connaisse déjà ce paradoxe … mais par contre le lien à la fin de l’article est super ! 🙂

  3. Il me semble que ce résultat parait paradoxal lorsque l’on compare 25 (le nombre de personne) à 1/365 (la probabilité que deux personnes fixées aient leur anniversaire le même jour) : le produit est petit.

    Le résultat parait beaucoup plus raisonnable une fois que l’on a compris qu’il faut plutôt comparer 25*24/2 (le nombre de couples) à 1/365 : le produit est proche de 1.

  4. À noter que, lorsque N atteint K+1, on retrouve le principe des tiroirs (ou des pigeonniers) : http://fr.wikipedia.org/wiki/Principe_des_tiroirs 😉
    Ainsi, pour les anniversaires, la 366e personne a (365-366+1)=0 choix pour que son anniversaire soit différent des 365 premières personnes, donc P=0, donc 1-P=1 : il y a *obligatoirement* 2 personnes avec le même anniversaire dans un groupe de 366 personnes ou plus (toujours dans le cas des années non bissextiles).

  5. Pingback: Les bébés du nouvel an sont de plus en plus nombreux | Bokéhterie

  6. Très simple finalement ! Je ne pensais pas qu’il y avait autant de chance dans un groupe de 50 personnes, impresionnant. Je vais essayer de calculer la probabilité qu’ils soient nés le même jour que moi, en comptant l’année bien entendu…

  7. intéressant, néanmoins l’exemple ne prend pas en compte que la distribution des naissances n’est pas homogène sur une année. Avec la contraception, certaines femmes trouvent opportun de programmer la naissance de leur enfant pour cumuler congés estivaux
    et maternité.

  8. Pingback: Actualités - Dossiers à lire | Pearltrees

  9. humm, petite question technique
    pourquoi utilise-t-on la formule de l’arrangement simple / arrangement multiple, qui sous entend que l’ordre a de l’importance plutôt que les formules de combinaisons simples et multiples qui ne font pas intervenir l’ordre ?

  10. Pingback: Statistiques | Pearltrees

  11. Pingback: Une probabilité peut en cacher une autre … | [Lab]map

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s