Les nombres premiers

Ma nouvelle vidéo porte sur le concept le plus simple et le plus déroutant des mathématiques : les nombres premiers !

Qu’est-ce qu’un nombre premier ?

Une petite précision de définition pour commencer : je n’ai pas voulu alourdir l’introduction en donnant une définition totalement précise de ce qu’est un nombre premier. Et je suis passé notamment sur cette convention de ne pas considérer 1 comme un nombre premier. Une manière élégante et compacte c’est de dire qu’un nombre premier est un nombre qui admet exactement 2 diviseurs distincts (1 et lui-même).

Le résultat de Zhang

Pour être précis, ce qu’à montré Zhang [3], c’est qu’il existe une infinité de paires de nombres premiers consécutifs séparés d’un gap de moins de 70 millions. Je vous laisse vous convaincre que l’on en déduit que forcément parmi les conjectures des nombres premiers jumeaux, cousins, sexys, etc. jusqu’à 70 millions, il y a en a au moins une de correcte.

Ce qui a été ensuite accompli par le projet Polymath 8 mené par Terry Tao, c’est de faire passer la borne de 70 millions à 246 (voir à 8 si on suppose certaines autres conjectures vraies).

La première conjecture de Hardy-Littlewood

Passons au gros morceau. Je ne suis pas rentré dans les détails, mais ce que je raconte à la fin correspond à ce qu’on appelle les conjectures de Hardy-Littlewood [1]. Il faut savoir qu’on dispose de conjectures encore plus précises concernant la répartition des nombres premiers comme les jumeaux, les cousins, etc. et même des combinaisons plus compliquées du type trois nombres premiers séparés par 2 puis 4 (p,p+2,p+6). On peut ainsi énoncer la conjecture suivante :

Conjecture (0,2,6) : il existe une infinité de p tels que (p,p+2,p+6) soient premiers.

Et on peut généraliser ! Prenons n’importe quelle suite croissante de k nombres nombres 0<a_2<a_3<\cdots<a_k. On appelle cela un k-uplet. On peut poser

Conjecture (0,a_2,a_3,\cdots,a_k) : il existe une infinité de p tels que (p,p+a_2,p+a_3,\cdots,p+a_k) soient tous premiers.

Alors attention, toutes ces conjectures ne sont pas vraies ! Certaines sont fausses de manière « évidente », par exemple la conjecture (0,2,4). Si p est premier, alors soit p+2, soit p+4, est forcément un multiple de 3 !

Heureusement, il est assez facile de caractériser les k-uplets pour lesquels la conjecture est « évidemment » fausse. Tous les autres k-uplets sont dits « admissibles », et on pense que pour tous les k-uplets admissibles, la conjecture est vraie.

(Pour les violents, un k-uplet est admissible si pour tout p, il ne contient pas tous les restes possibles modulo p : \forall p\ \exists r\ \forall i\ a_i\not\equiv r [p])

Continuons notre chemin. Prenons un k-uplet admissible (0,a_2,a_3,\cdots,a_k). Le plus grand nombre a_k est appelé le diamètre du k-uplet. Or ce qui est amusant pour un mathématicien, c’est de regarder des k-uplets de plus petit diamètre possible. En effet la conjecture (0,a_2,a_3,\cdots,a_k) associée à ces k-uplets va correspondre à des séquences de nombres premiers aussi proches les uns des autres que possible. Un k-uplet admissible de diamètre minimal est appelé une constellation.

Nous sommes enfin prêts à énoncer la première conjecture de Hardy-Littlewood ! Elle nous dit deux choses : premièrement pour toute constellation (0,a_2,a_3,\cdots,a_k), il existe une infinité de nombres p tels que (p,p+a_2,\cdots,p+a_k) soient tous premiers ; deuxièmement la répartition des nombres p qui marchent n’est pas quelconque, mais suit asymptotiquement une loi imbitable dont je vous épargne l’écriture mais que vous pouvez trouver ici.

La conjecture de Hardy-Littlewood est donc beaucoup plus puissante que le conjecture des nombres premiers jumeaux, puisque non seulement elle la généralise à tout un tas d’autres configurations, mais en plus elle ne se contente pas de dire qu’il y en a une infinité, mais elle en propose une loi asymptotique pour leur répartition !

La deuxième conjecture de Hardy-Littlewood

La deuxième conjecture de Hardy-Littlewood concerne la « sous-additivité » de la fonction qui compte les nombres premiers

\Pi(M+N) - \Pi(M) \leq \Pi(N)

Comme je l’explique dans la vidéo, cette conjecture semble parfaitement vraie quand on essaye numériquement. Et pourtant on pense qu’en allant suffisamment loin, elle devient fausse !

La raison, c’est qu’un jour un petit malin a démontré que les deux conjectures de Hardy-Littlewood sont contradictoires [2] ! Et on pense que c’est plutôt la première qui doit être vraie, et donc la seconde doit posséder un contre-exemple. Et grâce à la répartition asymptotique proposée par la première conjecture, on peut faire le portrait robot du contre exemple

A la recherche du contre-exemple

Revenons à la définition d’une constellation : il s’agit d’un k-uplet de taille minimale. Si la première conjecture de Hardy-Littlewood est vraie, chaque constellation va donner naissance à une infinité de séquences de nombres premiers. Comme les constellations sont aussi petites que possibles, cela correspond donc à des paquets de nombres premiers aussi proches que possible les uns des autres.

Eh bien figurez-vous qu’il existe des constellations comportant K nombres, dont le diamètre D est tel que la quantité de nombres premiers entre 0 est D est inférieure à K : \Phi(D)<K. Ca veut dire que si – comme l’affirme la première conjecture – ces constellations donnent effectivement naissance à ne serait-ce qu’une seule séquence de nombre premiers (p,p+a_2,\cdots,p+a_k), alors cette séquence va violer la deuxième conjecture : elle contiendra plus de nombres premiers que l’intervalle situé entre 0 et D. Vous voyez donc que si la première conjecture est vraie, elle permet de construire des contres-exemples à la deuxième.

Soyons clairs, des constellations intéressantes susceptibles de fournir ces contre-exemples, il n’y en a pas légion ! Une des plus petites comporte 447 nombres et son diamètre est 3159. Or il n’y a que 446 nombres premiers entre 2 et 3159.  Ce qu’il y a d’intéressant, c’est que la première conjecture de Hardy-Littlewood permet d’estimer la répartition des nombres premiers basés sur une constellation donnée. Et pour celle dont je viens de parler, le premier exemple est attendu quelque part entre 10^{174} et 10^{1197} (voir [4]). On n’est probablement pas près de le trouver !

Enfin petite spéculation pour finir : comme la première conjecture de Hardy-Littlewood ne donne qu’une répartition asymptotique des contre-exemples, je me demande si on peut imaginer que cette estimation soit assez fausse pour les petites valeurs, et donc qu’un contre-exemple soit trouvé beaucoup plus tôt qu’attendu ?


Références

[1] Hardy, Godfrey H., and John E. Littlewood. « Some problems of ‘Partitio numerorum’; III: On the expression of a number as a sum of primes. » Acta Mathematica 44.1 (1923): 1-70.

[2] Richards, Ian. « On the incompatibility of two conjectures concerning primes; a discussion of the use of computers in attacking a theoretical problem. » Bull. Amer. Math. Soc 80 (1974).

[3] Zhang, Yitang. « Bounded gaps between primes. » Annals of Mathematics (2013).

[4] Le site de Thomas J Engelsma

Le Bitcoin et la Blockchain

La vidéo du jour décrypte les mystères du bitcoin, et vous explique vraiment comment il marche, et ce qu’est cette mystérieuse blockchain.

Pour préparer cette vidéo, j’ai dû pas mal me documenter. J’ai trouvé beaucoup d’endroits où les grands principes du bitcoin sont expliqués, mais assez peu d’infos détaillées sur ce qu’il se passe vraiment « sous le capot ». A force de lecture, je pense avoir compris l’essentiel, et j’espère donc avoir donné à tout le monde les éléments nécessaires pour comprendre comment un système comme le bitcoin pouvait tenir debout, et en quoi le concept de la blockchain assure la décentralisation du système. Lire la suite

Est-ce mal de montrer une courbe dont l’axe des ordonnées ne démarre pas à zéro ?

La semaine dernière, j’ai publié une vidéo dont le but était d’examiner la physique qui se trouve derrière le réchauffement climatique. J’ai évidemment eu droit à une horde de commentaires climatosceptiques, dont je n’ai que faire puisque la vidéo ne s’adressait pas à eux : je l’avais plutôt faite pour toucher les « climato-agnostiques », ceux qui ne savaient pas trop quoi penser de tout ça et qui pouvaient avoir des doutes sur les fondements scientifiques du phénomène, ou sur l’opacité des modèles climatologiques.

Mais ça n’est pas de ça dont je veux vous parler aujourd’hui ! Je voudrai plutôt revenir sur une remarque qui m’a été faite plusieurs fois en commentaire (sans malveillance généralement) : le fait que ma courbe d’évolution du CO2 ait une ordonnée qui ne démarre pas à zéro. Voici la courbe en question :
CO2_600

Alors est-ce que c’est mal de faire une courbe avec l’ordonnée qui ne démarre pas à zéro ? Du point de vue des règles qui prévalent dans les revues scientifiques, absolument pas ! Et c’est vrai que je ne me suis pas posé la question en faisant le graphique.

Mais du point de vue de la communication vis-à-vis du grand public, a-t-on le droit de représenter des données comme ça ? ou bien est-ce trompeur ?

Commençons par rappeler ce que dit l’orthodoxie de la communication graphique (voir par exemple le gourou Edward Tufte). Pour un graphique « en barres », il est ABSOLUMENT interdit de ne pas démarrer l’échelle à zéro ! Par exemple, il est totalement proscrit de faire ça :

bargraph

Mais pourquoi est-ce interdit ? Parce que cela crée une manipulation sensorielle : intuitivement, on a tendance à juger de la magnitude du phénomène par la taille de la barre, donc si la taille de la barre n’est pas proportionnelle à la quantité qu’on représente, il y a clairement entourloupe.

Cela a notamment pour effet d’exagérer les différences, et donc éventuellement de faire croire qu’il y a un effet énorme là où il n’y en a pas forcément (en sciences il faudrait aussi parler des barres d’erreur, mais passons là-dessus pour l’instant.)

Maintenant posons nous la même question pour une courbe qui représente la variation d’une certaine quantité Y en fonction d’une autre quantité X, dans notre cas la concentration de CO2 en fonction du temps. Que dit la théorie orthodoxe ? Elle nous dit que dans le cas d’une courbe, notre cerveau ne note pas intuitivement la position de la courbe par rapport à zéro, mais compare plutôt la magnitude des évolutions.

Par exemple dans le cas du CO2, ce qui compte c’est que l’augmentation des deux derniers siècles est 5 à 10 fois plus importante que les fluctuations naturelles observées entre l’an 1000 et l’an 1800.

CO2 comparaison

Et ce résultat est vrai quelles que soient les unités et l’endroit d’où on démarre l’échelle de l’axe Y. On pourrait même ne pas mettre d’unités sur le graphe, cela reste vrai.

Tout ça pour dire que dans la théorie orthodoxe (et notamment celle qui prévaut dans les publications scientifiques), il n’y a absolument aucun problème à afficher une courbe dont l’échelle en ordonnées ne démarre pas à zéro. C’est même en général indispensable, voyez par exemple la courbe de fluctuation de l’irradiance solaire que je montre dans la vidéo

Solar-cycle-data

et imaginez ce qu’elle serait avec une échelle démarrant à 0 ! On ne verrait absolument rien.

Bon tout ça c’était pour la communication telle qu’elle est pratiquée par les scientifiques entre eux…mais qu’en est-il quand on s’adresse à du grand public ? Est-ce que « ne pas commencer l’axe Y à zéro » c’est « tromper » ? Commençons par remarquer que les standards auxquels nous habituent les journaux télévisés ne sont pas très élevés : pas d’échelle, ou une échelle non-linéaire, des corrélations tirées sur deux points, etc. Mais bon, on est quand même là pour faire un peu mieux que ça, non ?

Je l’avoue, en faisant cette courbe de CO2, je ne me suis absolument pas posé la question de savoir si ça allait induire le public en erreur, ou donner l’impression d’une manipulation. Mais vu que plusieurs personnes m’ont fait la remarque, peut-être aurais-je du être plus prudent et au minimum faire remarquer à l’oral que ma courbe ne commençait pas à zéro. Ou bien la commencer à zéro puis zoomer après coup.

Bref, chers lecteurs, chers spectateurs, est-ce que vous vous sentez manipulés par une courbe de ce genre ?

Amis scientifiques et vulgarisateurs, j’attends aussi votre opinion sur cette question !

La machine à inventer des mots, version Ikea

ikea-flatpack-furniture-1Vous connaissez le canapé Söft ? La commode Utrad ? L’étagère Hång ? L’armoire Muskydd ? Le mixeur Skymfor ? La poële Kukväde ? Le placard Klöstig ? Le circuit Rundering ? La table Oljulstad ? Les rideaux Lykofåtsly ? Le bureau Håkmanedfol ? La chaise Sjärganskig ?

Eh bien contrairement aux apparences, ces noms ne font pas partie du véritable catalogue Ikea ! Ils ont été fabriqués automatiquement par un algorithme qui s’inspire de vrais mots suédois pour en créer de nouveaux, qui « sonnent suédois » mais n’existent pas dans cette langue. Lire la suite