La Relativité Générale

Aujourd’hui, voici un gros morceau sur lequel je travaillais depuis longtemps : la relativité générale !

Comme toujours ci-dessous, petit florilège des choses que j’aurais aimé dire ou préciser, mais que j’ai dû couper par manque de place, ou désir de ne pas compliquer encore plus cette vidéo déjà bien lourde !

Sur le principe d’équivalence

L’idée nouvelle et perturbante qu’Einstein déduit du principe d’équivalence, c’est que la trajectoire naturelle des corps est la chute libre. C’est la trajectoire « de repos », celle quand aucune force ne s’applique (puisqu’on ne compte plus la gravité dans les forces).

Une conséquence amusante de ça, c’est que quand vous êtes affalés dans votre canapé, vous n’êtes pas au repos. Dans la vision newtonienne classique, vous subissez deux forces qui se compensent : votre poids et la réaction du canapé. En relativité générale, vous ne subissez que la réaction du canapé, dirigée vers le haut. Et vous n’êtes plus au repos puisque la réaction vous empêche de suivre votre trajectoire naturelle qui serait de continuer à tomber vers la Terre. Le canapé vous dévie de votre géodésique, et par rapport à elle il vous fait accélérer vers le haut ! Bizarre non ?

F = ma

Un point que j’ai caché sous le tapis pour ne pas m’en aller trop loin, c’est la forme exacte de la loi F=ma quand on passe en relativité générale. Déjà en relativité restreinte elle ne s’écrit pas comme celle qu’on apprend en physique au lycée, et une bonne raison pour ça est qu’on est passés en 4 dimensions. Force et accélération ne sont donc plus des vecteurs mais des quadrivecteurs. On note souvent ça avec des indices grecs, et l’équation correcte serait plutôt :

\displaystyle{F^{\mu}= m a^{\mu}}

Pour aller vite, cette équation est toujours valable en relativité générale, mais elle s’applique localement.

Le référentiel galiléen parfait ?

Parmi les motivations pour développer la relativité générale, j’ai parlé de la propagation instantanée de l’information en gravité newtonienne, mais il en existe une autre qui est intéressante, et qui porte sur les notions de référentiel.

J’ai cité la Terre comme exemple de référentiel galiléen, sauf que dans certaines circonstantes, elle n’est pas un bon référentiel galiléen. En effet, elle est en rotation sur elle-même, et autour du Soleil. Pour des expériences suffisamment courtes ça ne pose pas de problèmes, mais à plus grande échelle, on peut se rendre compte qu’elle n’est pas un véritable référentiel galiléen. En pratique, cela se traduit par des « forces virtuelles » comme la force de Coriolis, qui est celle qui explique que les alizés se dirigent vers l’ouest, ou encore que le pendule de Foucault tourne.

Si la Terre n’est pas un bon référentiel galiléen, on pourrait aller chercher la taille au-dessus : le Soleil. Sauf qu’à une certaine échelle, lui aussi est en mouvement dans la galaxie, galaxie qui elle-même se déplace.

Bref quand on cherche un référentiel galiléen « parfait », on en trouve pas. C’est un peu bizarre comme idée de poser qu’il existe des référentiels galiléens, mais de réaliser qu’il n’en existe en fait aucun.

La relativité générale permet de résoudre ce problème, en supprimant le besoin d’un  référentiel galiléen parfait, puisqu’une trajectoire en chute libre fait l’affaire dès qu’aucune autre force ne s’applique.

(Ces idées sont aussi un peu reliée au principe de Mach, qui dit que l’inertie d’un objet est dépendante de toute la distribution de matière dans le reste de l’Univers…mais ça nous emmènerait un peu loin !)

Les signes de la métrique

Passons maintenant aux mathématiques de la courbure. Autant le dire tout de suite, les paragraphes qui vont suivre pourraient occuper 200 pages, puisque des livres entiers sont consacrés à la géométrie riemanienne.

(J’en profite pour glisser un petit conseil lecture pour les plus furieux d’entre vous. Pour ma part, j’ai appris la relativité générale dans le bouquin de Wald. C’est un livre qui conviendra bien aux esprits matheux : le chemin est court mais la pente est raide. En gros ça commence par 2 chapitres de géométrie riemanienne bien bourrin, et au chapitre suivant l’essentiel physique va hyper vite car on a les bases de maths.)

Allons-y pour les précisions. Tout d’abord comme je l’ai dit rapidement dans la vidéo, toute l’histoire se passe en 4 dimensions; mais il y a une subtilité supplémentaire : quand on applique le « théorème de Pythagore », on calcule une distance d’espace-temps, qui a un sens particulier puisqu’on compte le temps et les distances avec un signe opposé. En l’absence de courbure, la distance d’espace-temps s’écrit

\displaystyle{ds^2=-dt^2+dx^2+dy^2+dz^2}

Ce que vous avez là est la métrique d’un espace-temps plat. Pour ceux que cette notion de distance d’espace-temps intrigue, je vous invite à d’abord la regarder à la relativité restreinte car elle y joue un rôle essentiel. Pour un espace temps-courbe, la métrique a une forme plus générale qu’on peut représenter comme une matrice 4×4 symétrique, et la condition se traduit par le fait qu’elle doit avoir une valeur propre négative et trois positives.

Vitesse et direction spatio-temporelle

Autre précision liée à l’idée d’espace-temps. Quand on fait de la géométrie courbe en 2D comme sur toutes les illustrations que j’ai faites, pour définir une géodésique il faut un point de départ et une direction. On applique alors l’équation des géodésiques à ces données initiales, et on construit la géodésique. Mais c’est de la pure géométrie, il n’y a pas de notion de vitesse.

En physique, la vitesse joue bien sûr un rôle sur la trajectoire. La géodésique que vous allez suivre au cours d’une chute libre va donc dépendre de votre point de départ, de votre direction mais aussi de votre vitesse. Cette dépendance à la vitesse apparait naturellement du fait qu’on travaille avec des espaces-temps.

En effet je vous laisse vous convaincre que le vecteur vitesse (avec sa direction et son norme) est simplement une direction dans l’espace-temps. Si vous êtes au même endroit, que vous allez dans la même direction (de l’espace) mais pas à la même vitesse que moi, nous avons des directions (de l’espace-temps) différentes.

Fibré, connexion et transport parallèle

Pour rester accessible, j’ai du passer sur les très jolies structures mathématiques qui se cachent derrière la mathématisation de la relativité générale. Il y a notamment les notions de fibré et de connexion, qui sont également au coeur de la formulation des théories de jauge en théorie quantique des champs !

Pour ma part, j’ai étudié ces notions dans le formidable polycopié de Robert Coquereaux, que je recommande chaudement aux étudiants en physique théorique !

Pour ceux qui veulent juste un aperçu : imaginez une surface courbe (oui, vous avez le droit de la visualiser comme « tordue »), prenez un point sur la surface et représentez vous un vecteur vitesse en ce point. Ce vecteur ne vit pas « dans la surface », mais dans un espace tangent à celle-ci : imaginez un plan tangent à la surface en ce point.

Si vous voulez pouvoir considérer toutes les vitesses possibles en tous les points, vous voyez qu’il vous faut un plan tangent en chaque point de la surface. « Au-dessus » de chaque point de la surface existe un espace tangent, qui, lui, est un bon vieil espace plat. C’est cette combinaison d’une surface et des espaces tangents qui existent au-dessus de chacun de ses points qu’on appelle un fibré.

Le point clé, c’est que pour une surface quelconque, il n’existe pas de façon naturelle de comparer un vecteur dans l’espace tangent au point M à un vecteur dans l’espace tangent à un autre point M’ situé un peu plus loin. Quand la surface est plate, ça se fait naturellement; dès qu’elle ne l’est plus, c’est fichu. En particulier, si vous prenez deux points voisins sur un espace-courbe et un vecteur tangent en chacun de ces deux points, on a pas de notion de « c’est le même vecteur aux deux points ». Et sans cette notion, impossible de définir la notion de parallèle, ou encore de « ligne droite » (qui est une ligne qui avance toujours de façon parallèle à elle-même).

Pour définir une manière de relier les espaces tangents de points voisins (et comparer les vecteurs qui y vivent), on peut définir une « connexion », c’est-à-dire un objet mathématique qui va permettre de faire ce lien en transportant un vecteur d’un espace tangent à un autre. La connexion est un objet à 3 indices C^i_{jk}, qui dit que si on transporte le vecteur x dans la direction y, il se transforme selon

\displaystyle x^i \to x^i + C^i_{jk}x^jy^k.

On appelle cette opération le transport parallèle. Un point important est qu’une fois qu’on a définit une notion de transport parallèle sur une surface, on peut avoir une notion de dérivée. En effet l’idée de dérivée impose de pouvoir comparer des quantités (notamment des vecteurs) d’un point à un autre de la surface. Par exemple, la dérivée d’un champ de vecteurs est nulle si le vecteur est « le même », et pour faire cette comparaison vous voyez que pour ça on a besoin d’une connexion.

Chaque fois qu’on définit une connexion, celle-ci fixe une manière de calculer des dérivées, on appelle ça la « dérivée covariante » associée à la connexion, et on la note généralement \nabla pour faire la distinction avec la dérivée usuelle.

Les symboles de Christoffel

A part quelques petites conditions, si on se choisit un fibré « nu », on a une grande liberté sur le choix de la connexion et on peut prendre un peu ce qu’on veut. Sauf que si sur notre espace-courbe on a préalablement défini une métrique, alors là on n’a plus le choix : il existe une unique connexion « naturelle » qui est découle de cette métrique, on la note \Gamma et on appelle ça les symboles de Christoffel.

On peut alors définir le transport parallèle qui soit compatible avec la métrique qu’on s’est choisie, et c’est cela qui permet de définir les géodésiques associées à une métrique donnée, selon l’équation des géodésiques qui utilise les symboles de Christoffel

\displaystyle \frac {d^2x^a}{ds^2}+\Gamma_{bc}^{a} \frac {dx^b}{ds}\frac {dx^c}{ds}=0

Petite précision : par ce procédé là, on obtient des géodésiques qui sont cohérentes avec la notion de « plus court chemin selon la métrique », c’est à dire que si on définit une géodésique comme la trajectoire qui extrémalise la distance entre deux points, calculée avec la métrique

{\displaystyle S=\int {\sqrt {-g_{\mu \nu }{\frac {dx^{\mu }}{d\lambda }}{\frac {dx^{\nu }}{d\lambda }}}}d\lambda }

on retrouve l’équation des géodésiques.

(Ah oui au fait, j’ai caché ça sous le tapis dans la vidéo, mais une géodésique ne minimise pas forcément le trajet entre deux points, mais elle l’extrémalise c’est-à-dire que c’est un minimum ou un maximum local.)

Morale de l’histoire : la métrique permet de calculer les distances, la connexion permet de définir une notion de transport parallèle, et si on a le bon goût de choisir la connexion compatible avec la métrique, ces deux concepts permettent de définir de façon cohérente et identique les géodésiques de notre espace.

Riemann, Ricci et Einstein

Maintenant qu’on a parlé de métrique et de Christoffel, on peut aborder les autres objets étranges qui peuplent les cours de relativité générale : les tenseurs de Riemann, de Ricci et d’Einstein.

Commençons par Riemann. Je vous ai dit que de façon générale, une connexion (et en particulier celle associée à une métrique) permet de définir une notion de transport parallèle, c’est-à-dire de prendre un vecteur (qui vit dans l’espace tangent à un point M) et de le transporter dans l’espace tangent à un point M’ voisin, pour voir ce qu’il vaut dans cet espace tangent. Un point essentiel et un peu contre-intuitif, c’est que le résultat va dépendre du chemin suivi pendant le transport.

Prenons un cas concret, on va transporter un vecteur X en suivant deux chemins différent : d’abord selon dY puis selon dZ pour le premier chemin, et selon dZ d’abord puis selon dY pour le second. Ces deux façon de transporter ne donneront pas le même résultat, c’est-à-dire que le vecteur X transporté par un chemin ne sera pas le même que le vecteur X transporté par l’autre. On peut calculer la différence entre ces deux vecteurs X transporté, et elle s’exprime comme :

\displaystyle \delta x^{\rho} = R^{\rho}_{\sigma\mu\nu}x^{\sigma}y^{\mu}z^{\nu}

où le tenseur de Riemann se calcule à partir des symboles de Christoffel en prenant en gros le commutateur des dérivées covariantes

{\displaystyle R^{\rho }{}_{\sigma \mu \nu }=\partial _{\mu }\Gamma ^{\rho }{}_{\nu \sigma }-\partial _{\nu }\Gamma ^{\rho }{}_{\mu \sigma }+\Gamma ^{\rho }{}_{\mu \lambda }\Gamma ^{\lambda }{}_{\nu \sigma }-\Gamma ^{\rho }{}_{\nu \lambda }\Gamma ^{\lambda }{}_{\mu \sigma }}

Bien sûr le détail de la formule n’est pas important, mais il faut retenir l’idée que ce tenseur exprime la « non-commutativité » du transport parallèle associé à une connexion.

On appelle ce tenseur « le tenseur de courbure », car c’est le fait qu’il soit non-nul qui caractérise véritablement l’existence d’une courbure. On peut avoir des métriques avec des formes tordues, et des symboles de Christoffel qui ont l’air compliqués, mais que tout cela ne décrive en réalité qu’un espace plat paramétrisé de façon bizarre. Le critère pour savoir si un espace est « vraiment courbe », c’est cette non-commutativité du transport parallèle, et donc le fait que le tenseur de Riemann ne soit pas nul.

Le tenseur de Ricci quant à lui est une « contraction » du tenseur de Riemann, c’est-à-dire qu’on somme sur 2 indices

\displaystyle R_{\mu\nu} = R^{\sigma}_{\mu\sigma\nu}

Il représente lui-aussi une certaine idée de la courbure, à travers la notion de contraction et dilatation d’un volume.

Prenons un exemple concret : imaginez un cube d’1 mètre de côté fait de petites billes, et que vous lachez à une certaine altitude de la Terre, sans vitesse initiale. Le cube va tomber et va se déformer. Les billes du bas étant accélérées plus fortement que celle du haut, le cube va s’étirer dans la direction verticale (et mesurer plus d’un mètre), en revanche les billes situées sur les côtés vont se rapprocher de celles du centre, pour la raison que j’illustre dans la vidéo : en tombant vers le centre de la Terre, les pommes se rapproche.

Mon cube va donc se contracter dans la direction transverse. Au total le cube se déforme et une question qu’on peut se poser, c’est si son volume global va changer. C’est en gros ce qu’exprime le tenseur de Ricci. Et comme l’équation d’Einstein relie le tenseur de Ricci au tenseur énergie-impulsion, dans le vide (c’est à dire en un point de l’espace sans matière ou énergie), le tenseur de Ricci est nul ce qui exprime que le volume du cube se conserve.

Enfin dernier ingrédient, donc, le tenseur d’Einstein, qui s’exprime simplement à partir du tenseur de Ricci et du scalaire de Ricci R qui correspond simplement à la contraction du tenseur de Ricci.

G_{\mu\nu} = R_{\mu\nu} - \frac12Rg_{\mu\nu}

Une question qu’on peut se poser, c’est pourquoi diable l’équation qui lie courbure et matière est G_{\mu\nu} = T_{\mu\nu} plutôt que R_{\mu\nu} = T_{\mu\nu}. Un élément de réponse est donné par une propriété du tenseur d’Einstein : sa divergence est nulle quand on utilise la dérivée covariante

\nabla^{\mu}G_{\mu\nu} = 0

ce qui est bien pratique, car c’est justement aussi ce qu’on attend du tenseur énergie-impulsion, pour exprimer une forme de « conservation de l’énergie »

\nabla^{\mu}T_{\mu\nu} = 0

J’en profite pour glisser qu’en Relativité générale, l’énergie n’est plus conservée au sens classique du terme, mais que c’est cette relation plus permissive qui la remplace. Et c’est cela qui permet des phénomènes qui a priori violent la conservation de l’énergie, comme la production d’énergie du vide quand on a une constante cosmologique.

Comment résoudre l’équation d’Einstein ?

Je l’ai mentionné brièvement, on ne peut explicitement résoudre l’équation d’Einstein que dans des cas très simple. La méthode de résolution est en gros la suivante : on identifie les symétries du problème, et on en déduit une forme réduite de la métrique, paramétrisée de façon simple. On injecte cette forme dans l’équation qui donne les symboles de Christoffel, puis dans celle qui donne le tenseur de Riemann et enfin le tenseur de Ricci et d’Einstein. Et là on résout l’équation.

Comme vous le voyez, c’est un long chemin très calculatoire, qui rend ces parties de la relativité générale un peu indigestes !

La courbure sans dimension supplémentaire

Une des idées principales que j’ai essayé de faire passer dans la vidéo, c’est le fait que mathématiquement, on n’a pas du tout besoin d’une dimension de plus pour parler de courbure. Et c’est même encore pire que ça : les courbures représentables avec une dimension supplémentaire (qu’on appelle extrinsèques) ne sont qu’une toute petite partie des courbures envisageables (intrinsèques). En particulier, une métrique simple comme celle de Schwarzschild n’est pas représentable de la sorte, ce qui est encore un défaut de la représentation « classique » du drap tordu, qui justement ne peut pas représenter correctement la courbure induite par une masse sphérique.

Voyons ça en détail sur le cas simple des surfaces 2D courbes. De façon générale, une métrique s’exprime sous la forme

\left(\begin{matrix}  \alpha(x,y) & \beta(x,y) \\  \beta(x,y) & \delta(x,y)  \end{matrix}\right)

où on a imposé la condition de symétrie de la métrique. Il faut donc 3 fonctions indépendantes pour la spécifier complètement. On va essayer de résoudre le « problème inverse », c’est-à-dire essayer de trouver une « surface 2D tordue » dont la métrique soit la même.

Imaginez donc une surface « tordue » en 3D, de la forme z = f(x,y), où f est une fonction. L’espace 3D étant lui-même plat, la métrique est :

\displaystyle ds^2 = dx^2 + dy^2 + dz^2

Puisque sur la surface z=f(x,y) la métrique induite s’obtient en exprimant

\displaystyle dz=\frac{\partial f}{\partial x} dx + \frac{\partial f}{\partial y}dy

et on a donc pour la métrique

\displaystyle ds^2 = (1 + \left(\frac{\partial f}{\partial x}\right)^2 ) dx^2 + (1 + \left(\frac{\partial f}{\partial y}\right)^2 ) dy^2 + 2\frac{\partial f}{\partial x}\frac{\partial f}{\partial y}dxdy

Vous pouvez maintenant essayer de vous amuser à résoudre le problème inverse, et vous convaincre que sauf condition très particulière sur \alpha, \beta, \delta, ça ne marche pas !
Une manière encore plus simple de s’en rendre compte, c’est que 3 fonctions définissent en général une métrique (intrinsèque) alors que sous la forme extrinsèque, on en a qu’une à choisir : f.

En particulier, si on prend la métrique de Schwarzschild projetée en 2D sur les coordonnées r et t, il n’est pas possible de résoudre le problème inverse. Donc il n’est pas possible de représenter la métrique de Schwarzschild comme « une surface tordue ». (Pour être précis, c’est possible à condition d’aller en 6 dimensions !)