RG I - GÉOMÉTRIE RIEMANNIENNE EN ESPACE PLAT


Introduction

• Dans la théorie newtonienne, le champ de gravitation est créé par les masses ; or, la relativité met en évidence une équivalence masse-énergie  E=mc2E=m\:c^2 ,  donc une théorie relativiste doit considérer que l'énergie du champ de gravitation contribue à la propre création de ce dernier... c'est à dire que la théorie est forcément non linéaire.

Comme cela est progressivement décrit dans la suite, la relativité générale considère que le champ de gravitation est associé à une “courbure” de l'espace-temps ; pour décrire précisément cela, l'usage de notations riemanniennes des coordonnées est en pratique indispensable. On commence ici par en aborder l'étude dans un espace “plat” (sans courbure).

Métrique locale

☞ remarque : la méthode envisagée dans ce chapitre n'est pas la plus générale ; elle est pour cette raison généralement “évitée” par les ouvrages traitant de ce sujet ; elle est au contraire abordée ici pour ses qualités en tant que “transition” dans la compréhension de l'usage des coordonnées.

◊ remarque : on adopte la convention de sommation d’Einstein ; tout indice répété en haut et en bas sous-entend une sommation :  xiaii(xiai)x_i \:a^i≝∑_i (x_i \:a^i\,) .

• Avec des coordonnées “quelconques”, par exemple polaires dans le plan, on peut définir une base locale  ei=iM\overset{→}{e}_i=∂_i \overset{→}{M}  ;  un déplacement de MM en MM' tel que  OM=OM+dM\overset{⟶}{OM}'=\overset{⟶}{OM}+d\overset{→}{M}  correspond à :  dM=iMdxi=eidxid\overset{→}{M}=∂_i \overset{→}{M} \: dx^i=\overset{→}{e}_i \: dx^i .

◊ remarque : on peut noter  dOMd\overset{⟶}{OM}  et  iOM∂_i \overset{\longrightarrow}{OM}  pour exprimer les variations du “vecteur position”  OM\overset{⟶}{OM} ,  mais ces quantités ne dépendent pas de l'origine fixe OO du repère ; or, c'est un des problèmes de la généralisation ultérieure (si on considère la géométrie à la surface d'une sphère en prenant l'origine OO au centre de la sphère, ce point n'est pas dans l'espace considéré).

• Les ei\overset{→}{e}_i ne sont généralement pas unitaires ; ils correspondent aux “déplacements” élémentaires iM∂_i \overset{→}{M} associés aux coordonnées. Ainsi, pour les coordonnées polaires dans le plan :  OM=rur(θ)\overset{\longrightarrow}{OM}=r \:\overset{→}{u}_r(θ)  correspond à  e1=1M=ur\overset{→}{e}_1=∂_1 \overset{→}{M}=\overset{→}{u}_r  mais  e2=2M=ruθ\overset{→}{e}_2=∂_2 \overset{→}{M}=r \:\overset{→}{u}_θ .

• On peut alors définir un “élément de longueur”  dsds  à l'aide de la relation :  ds2=dMdM=gijdxidxj{ds}^2=d\overset{→}{M}∙d\overset{→}{M}=g_{ij} \: dx^i \: dx^j  correspondant à :  gij=iMjM=eiejg_{ij}=∂_i \overset{→}{M}∙∂_j \overset{→}{M}=\overset{→}{e}_i∙\overset{→}{e}_j .  Ainsi, pour les coordonnées polaires dans le plan :  ds2=dr2+r2dθ2{ds}^2={dr}^2+r^2 \: {dθ}^2 .

• En un point voisin  M=M+dM\overset{→}{M}'=\overset{→}{M}+d\overset{→}{M} ,  le repère devient  ei=ei+dei\overset{→}{e}_i'=\overset{→}{e}_i+d\overset{→}{e}_i  ;  on exprime alors les  deid\overset{→}{e}_i  dans la base des ei\overset{→}{e}_i .  Les coefficients étant linéaires en  dxj{dx}^j ,  on peut donc écrire :  dei=Γ.ijkdxjekd\overset{→}{e}_i=Γ_{\phantom{.}ij}^k \: dx^j \:\: \overset{→}{e}_k .

• D’après  dei=keidxkd\overset{→}{e}_i=∂_k \overset{→}{e}_i \; dx^k ,  la relation précédente donne :  Γ.ijkkM=ijMΓ_{\phantom{.}ij}^k \: ∂_k \overset{→}{M}=∂_{ij} \overset{→}{M}  ;  les  Γ.ijkΓ_{\phantom{.}ij}^k  sont les “composantes contravariantes” des dérivées secondes  ijM∂_{ij} \overset{→}{M}  dans la base locale des  kM∂_k \overset{→}{M} .

Ainsi, pour les coordonnées polaires dans le plan :
1e1=0∂_1 \overset{→}{e}_1=\overset{→}{0}   donc   Γ.111=Γ.112=0Γ_{\phantom{.}11}^1=Γ_{\phantom{.}11}^2=0  ;
1e2=uθ=1re2\displaystyle ∂_1 \overset{→}{e}_2=\overset{→}{u}_θ=\frac{1}{r} \: \overset{→}{e}_2   donc   Γ.121=0Γ_{\phantom{.}12}^1=0   et   Γ.122=1r\displaystyle Γ_{\phantom{.}12}^2=\frac{1}{r}  ;
2e1=uθ=1re2\displaystyle ∂_2 \overset{→}{e}_1=\overset{→}{u}_θ=\frac{1}{r} \: \overset{→}{e}_2   donc   Γ.211=0Γ_{\phantom{.}21}^1=0   et   Γ.212=1r\displaystyle Γ_{\phantom{.}21}^2=\frac{1}{r}  ;
2e2=rur=re1∂_2 \overset{→}{e}_2=-r \:\overset{→}{u}_r=-r \:\overset{→}{e}_1   donc   Γ.221=rΓ_{\phantom{.}22}^1=-r   et   Γ.222=0Γ_{\phantom{.}22}^2=0 .

◊ remarque : on constate la symétrie par rapport aux deux derniers indices.

• Par ailleurs :  Γ.ijkek=jeiΓ_{\phantom{.}ij}^k \: \overset{→}{e}_k=∂_j \overset{→}{e}_i  d’où on déduit :  Γ.ijkeke𝓁=Γ.ijkgk𝓁=Γ𝓁ijΓ_{\phantom{.}ij}^k \: \overset{→}{e}_k∙\overset{→}{e}_𝓁=Γ_{\phantom{.}ij}^k \: g_{k𝓁}=Γ_{𝓁ij}  ;  c'est-à-dire que les  Γ𝓁ij=jeie𝓁=ijM𝓁MΓ_{𝓁ij}=∂_j \overset{→}{e}_i∙\overset{→}{e}_𝓁=∂_{ij} \overset{→}{M}∙∂_𝓁 \overset{→}{M}  sont les “composantes covariantes” des dérivées secondes  ijM∂_{ij} \overset{→}{M}  dans la base locale des  𝓁M∂_𝓁 \overset{→}{M} .

Ainsi, pour les coordonnées polaires dans le plan :
1e1=0∂_1 \overset{→}{e}_1=\overset{→}{0}   donc   Γ111=Γ211=0Γ_{111}=Γ_{211}=0  ;
1e2=uθ=1re2\displaystyle ∂_1 \overset{→}{e}_2=\overset{→}{u}_θ=\frac{1}{r} \: \overset{→}{e}_2   donc   Γ112=0Γ_{112}=0   et   Γ212=uθruθ=rΓ_{212}=\overset{→}{u}_θ∙r \:\overset{→}{u}_θ=r  ;
2e1=uθ=1re2\displaystyle ∂_2 \overset{→}{e}_1=\overset{→}{u}_θ=\frac{1}{r} \: \overset{→}{e}_2   donc   Γ121=0Γ_{121}=0   et   Γ221=rΓ_{221}=r  ;
2e2=rur=re1∂_2 \overset{→}{e}_2=-r \:\overset{→}{u}_r=-r \:\overset{→}{e}_1   donc   Γ122=rΓ_{122}=-r   et   Γ222=0Γ_{222}=0 .

◊ remarque : d'après  A=Aiei\overset{→}{A}=A^i \; \overset{→}{e}_i  les coordonnées  AiA^i  sont dites contravariantes car elles varient inversement à la base locale (AiA^i est divisé par deux si on double ei\overset{→}{e}_i ) ; les coordonnées  Ai=AeiA_i=\overset{→}{A}∙\overset{→}{e}_i  sont au contraire covariantes.

📖 exercice n° I.

Dérivation covariante

• Lorsqu'on dérive un scalaire 𝒻𝒻 , on peut définir la notion de “gradient” par une notation telle que :  d𝒻=i𝒻dxi=𝒻dMd𝒻=∂_i 𝒻 \:\:dx^i=\overset{→}{∇}𝒻∙d\overset{→}{M}  correspondant à :  𝒻=i𝒻ei\overset{→}{∇}𝒻=∂^i 𝒻 \:\:\overset{→}{e}_i .  Le seul changement est que la base n'est généralement pas orthonormée.

Ainsi, pour les coordonnées polaires dans le plan :
g11=1g^{11}=1  ;  g12=g21=0g^{12}=g^{21}=0  ;  g22=1r2\displaystyle g^{22}=\frac{1}{r^2}   ;
𝒻=g111𝒻e1+g222𝒻e2=𝒻rur+1r2𝒻θruθ\displaystyle \overset{→}{∇}𝒻=g^{11} \: ∂_1 𝒻 \:\:\overset{→}{e}_1+g^{22} \: ∂_2 𝒻 \:\:\overset{→}{e}_2=\frac{∂𝒻}{∂r} \: \overset{→}{u}_r+\frac{1}{r^2} \frac{∂𝒻}{∂θ} \: r \;\overset{→}{u}_θ  ;
𝒻=𝒻rur+1r𝒻θuθ\displaystyle \overset{→}{∇}𝒻=\frac{∂𝒻}{∂r} \: \overset{→}{u}_r+\frac{1}{r} \frac{∂𝒻}{∂θ} \: \overset{→}{u}_θ .

◊ remarque : gijg^{ij} est la matrice inverse telle que  gijgjk=δikg_{ij} \: g^{jk}=δ_i^{\:k}  (matrice unité).

• La situation se complique si on considère un vecteur  A=Aiei\overset{→}{A}=A^i \:\, \overset{→}{e}_i  exprimé dans la base locale et décrivant une propriété au point MM ; lorsqu'on étudie ses variations associées à des variations de MM ,  il faut tenir compte des variations de la base locale :
dA=dAiei+Aidei=dAiei+AiΓ.ijkdxjek=(dAi+Γ.jkiAjdxk)eid\overset{→}{A}=dA^i \:\, \overset{→}{e}_i+A^i \: d\overset{→}{e}_i=dA^i \:\, \overset{→}{e}_i+A^i \: Γ_{\phantom{.}ij}^k \: dx^j \:\, \overset{→}{e}_k=\left(dA^i+Γ_{\phantom{.}jk}^i \: A^j \: dx^k \right) \; \overset{→}{e}_i .

Ceci permet de définir une différentielle “absolue” telle que  dA=DAieid\overset{→}{A}=DA^i \:\, \overset{→}{e}_i :
DAi=dAi+Γ.jkiAjdxkDA^i=dA^i+Γ_{\phantom{.}jk}^i \: A^j \: dx^k   (soit  DAi=[dA]id[Ai]=dAiDA^i=\left[d\overset{→}{A} \,\right]^i≠d[A^i\, ]=dA^i ).

On définit de façon analogue la dérivée covariante telle que  DAi=DjAidxjDA^i=D_j A^i \; dx^j :
DjAi=jAi+Γ.jkiAkD_j A^i=∂_j A^i+Γ_{\phantom{.}jk}^i \: A^k   (soit  DjAi=[jA]ij[Ai]=jAiD_j A^i=\left[∂_j \overset{→}{A}\, \right]^i≠∂_j [A^i \,]=∂_j A^i ).

◊ remarque : en particulier lorsqu'on déplace un vecteur sans le modifier (cette transformation est généralement nommée “transport parallèle”, bien qu'une telle expression soit ambiguë pour la norme), ses coordonnées varient car la base locale change, alors que le vecteur est constant.

• Pour les coordonnées covariantes  Ai=gijAj=AeiA_i=g_{ij} \: A^j=\overset{→}{A}∙\overset{→}{e}_i  on obtient :
dAi=dgijAj+gijdAjdA_i=dg_{ij} \: A^j+g_{ij} \: dA^j .

Avec :  dgij=(Γ.ikldxke𝓁)ej+ei(Γ.jkldxke𝓁)dg_{ij}=\left(Γ_{\phantom{.}ik}^l \: dx^k \:\, \overset{→}{e}_𝓁 \right)∙\overset{→}{e}_j+\overset{→}{e}_i∙\left(Γ_{\phantom{.}jk}^l \: dx^k \:\, \overset{→}{e}_𝓁 \right)   et   dAj=DAjΓ.k𝓁jAkdx𝓁dA^j=DA^j-Γ_{\phantom{.}k𝓁}^j \: A^k \:\, dx^𝓁  on obtient :  dAi=ΓkijdxjAk+gijDAjdA_i=Γ_{kij} \; dx^j \: A^k+g_{ij} \: DA^j .

Il est donc possible de définir  DAi=gijDAj=[dA]iDA_i=g_{ij} \: DA^j=\left[d\overset{→}{A} \,\right]_i  telle que :
DAi=dAiΓkijdxjAk=dAiΓ.ijkdxjAkDA_i=dA_i-Γ_{kij} \; dx^j \: A^k=dA_i-Γ_{\phantom{.}ij}^k \; dx^j \: A_k  ;
DAi=DjAidxjDA_i=D_j A_i \; dx^j   avec   DjAi=jAiΓ.ijkAkD_j A_i=∂_j A_i-Γ_{\phantom{.}ij}^k \: A_k .

• De façon analogue pour un tenseur  𝐁=Bijeiej\mathbf{B}=B^{ij} \:\: \overset{→}{e}_i \, ⨂ \,\overset{→}{e}_j   (et plus généralement pour des combinaisons de coordonnées covariantes et contravariantes) :
DBi,j=dBi,jΓ.ilkdx𝓁Bk,j+Γ.𝓁kjBi𝓁dxkDB_i^{\phantom{,}j}=dB_i^{\phantom{,}j}-Γ_{\phantom{.}il}^k \; dx^𝓁 \: B_k^{\phantom{,}j}+Γ_{\phantom{.}𝓁k}^j \: B_i^{\;𝓁} \: dx^k .

• Ces propriétés doivent être prises en compte dans les dérivations pour définir les opérateurs divergence et laplacien :
A=DiAi=iAi+Γ.ikiAk\overset{→}{∇}∙\overset{→}{A}=D_i A^i=∂_i A^i+Γ_{\phantom{.}ik}^i \: A^k  ;
f=𝒻=Dii𝒻=ii𝒻+Γ.ikik𝒻∆f=\overset{→}{∇}∙\overset{→}{∇}𝒻=D_i ∂^i 𝒻=∂_i ∂^i 𝒻+Γ_{\phantom{.}ik}^i \: ∂^k 𝒻 .

Ainsi, pour les coordonnées polaires dans le plan :
A=1A1+2A2+Γ.212A1=Arr+1rAθθ+1rAr\displaystyle \overset{→}{∇}∙\overset{→}{A}=∂_1 A^1+∂_2 A^2+Γ_{\phantom{.}21}^2 \: A^1=\frac{∂A_r}{∂r}+\frac{1}{r} \frac{∂A_θ}{∂θ}+\frac{1}{r} \, A_r   (où  A2=Aθr\displaystyle A^2=\frac{A_θ}{r} )  ;
𝒻=11𝒻+22𝒻+Γ.2121𝒻=2𝒻r2+1r22𝒻θ2+1r𝒻r\displaystyle ∆𝒻=∂_1 ∂^1 𝒻+∂_2 ∂^2 𝒻+Γ_{\phantom{.}21}^2 \: ∂^1 𝒻=\frac{∂^2 𝒻}{{∂r}^2} +\frac{1}{r^2} \, \frac{∂^2 𝒻}{{∂θ}^2} +\frac{1}{r} \, \frac{∂𝒻}{∂r} .

◊ remarque : il n'y a par contre pas de changement dans le “rotationnel” (à part, comme pour le gradient, les précautions dues au fait que la base n'est généralement pas orthonormée) ; en effet :  DiAjDjAi=iAjjAiD_i A_j-D_j A_i=∂_i A_j-∂_j A_i .

📖 exercice n° II.

Relations avec la métrique

• Les relations précédentes donnent en particulier :
Dgij=dgijΓji𝓁dx𝓁Γij𝓁dx𝓁=0Dg_{ij}=dg_{ij}-Γ_{ji𝓁} \; dx^𝓁-Γ_{ij𝓁} \; dx^𝓁=0 .

Cette propriété est associée à l'invariance de la norme d'un vecteur transporté parallèlement, c'est-à-dire tel que  DAi=0DA^i=0 :
D(A2)=D(gijAiAj)=2AiDAi+DgijAiAj=0D\left(\left\|\,\overset{→}{A}\,\right\|^2 \right)=D\left(g_{ij} \: A^i \:A^j \,\right)=2\:A_i \: DA^i+Dg_{ij} \:A^i \:A^j=0 .

• Cette propriété correspond en outre à :  Dkgij=kgijΓjikΓijk=0D_k g_{ij}=∂_k g_{ij}-Γ_{jik}-Γ_{ijk}=0 .  On obtient ainsi par permutations une autre expression de la connexion affine, directement en fonction de la métrique :
kgij=Γjik+Γijk∂_k g_{ij}=Γ_{jik}+Γ_{ijk}  ;  igjk=Γkji+Γjki∂_i g_{jk}=Γ_{kji}+Γ_{jki}  ;  jgki=Γikj+Γkij∂_j g_{ki}=Γ_{ikj}+Γ_{kij}  ;
Γkij=12(igjk+jgikkgij)Γ_{kij}=\frac{1}{2} \,\left(∂_i g_{jk}+∂_j g_{ik}-∂_k g_{ij} \right)  ;  symboles de Christoffel.

◊ remarque : on peut généraliser à des espaces plus complexes où la connexion affine est éventuellement différente de l'expression précédente ; on utilise alors souvent une seconde notation de type  [kij]\left[kij\right]  pour distinguer la “connexion affine” des “symboles de Christoffel” (ou inversement).

• On en déduit par ailleurs :  Γ.ijj=12gjkigjkΓ_{\phantom{.}ij}^j=\frac{1}{2} \,g^{jk} \: ∂_i g_{jk} .  Mais la matrice inverse peut s'écrire  gjk=γjkg\displaystyle g^{jk}=\frac{γ^{jk}}{g}  en fonction du déterminant  gg  et des mineurs  γjkγ^{jk}  des  gjkg_{jk} .  Ainsi :  ig=γjkigjk=ggjkigjk∂_i g=γ^{jk} \: ∂_i g_{jk}=g \:g^{jk} \: ∂_i g_{jk}  et finalement :  Γ.ijj=i(|g|)|g|\displaystyle Γ_{\phantom{.}ij}^j=\frac{∂_i \left(\sqrt{|g|}\right)}{\sqrt{|g|}} .

On en déduit ainsi d'autres expressions des divergence et laplacien :
A=DiAi=iAi+i(|g|)|g|Ai=i(|g|Ai)|g|\displaystyle \overset{→}{∇}∙\overset{→}{A}=D_i A^i=∂_i A^i+\frac{∂_i \left(\sqrt{|g|}\right)}{\sqrt{|g|}} \, A^i=\frac{∂_i \left(\sqrt{|g|} \: A^i \,\right)}{\sqrt{|g|}}  ;
𝒻=𝒻=Dii𝒻=ii𝒻+i(|g|)|g|i𝒻=i(|g|i𝒻)|g|\displaystyle ∆𝒻=\overset{→}{∇}∙\overset{→}{∇}𝒻=D_i ∂^i 𝒻=∂_i ∂^i 𝒻+\frac{∂_i \left(\sqrt{|g|}\right)}{\sqrt{|g|}} \, ∂^i 𝒻=\frac{∂_i \left(\sqrt{|g|} \: ∂^i 𝒻\right)}{\sqrt{|g|}} .

📖 exercices n° III et IV.

Produit vectoriel

• Dans le cas particulier d'un espace de dimension trois (mais des généralisations sont possibles), tout tenseur antisymétrique a trois coordonnées indépendantes :  B23=B32B^{23}=-B^{32}  ;  B31=B13B^{31}=-B^{13}  ;  B12=B21B^{12}=-B^{21} .

Il est donc tentant de le représenter par un “pseudo-vecteur” :  Bi12εijkBjkB^i∝\frac{1}{2} ε^{ijk} \: B_{jk}  en utilisant les quantités εijkε^{ijk} “totalement antisymétriques” (les seules composantes non nulles sont  ±1±1  selon le signe de la permutation de {ijk}\{ijk\} ).

◊ remarque : le facteur 12\frac{1}{2} sert à compenser les doubles comptages, ou bien il faut limiter la sommation sur “jkjk” aux paires avec  k>j k>j .

• Une telle expression ne définit toutefois pas un vecteur ; en particulier :
εijkgimgjngkp=gεmnpεmnpε^{ijk} \: g_{im} \: g_{jn} \: g_{kp}=g \;ε_{mnp}≠ε_{mnp} .

On peut alors chercher s'il existe une fonction 𝒻𝒻 telle que  𝒻εijk𝒻 \;ε^{ijk}  soit un tenseur dont l'écriture soit invariante, de même que celle de la métrique  (Dgij=0Dg_{ij}=0 ).

Cette condition correspond à :
D(𝒻εijk)=d(𝒻εijk)+Γ.mni𝒻εmjkdxnD\left(𝒻 \;ε^{ijk} \,\right)=d\left(𝒻 \;ε^{ijk} \,\right)+Γ_{\phantom{.}mn}^i \: 𝒻 \;ε^{mjk} \; dx^n \;⋯
+Γ.mnj𝒻εimkdxn+Γ.mnk𝒻εijmdxn⋯+Γ_{\phantom{.}mn}^j \: 𝒻 \;ε^{imk} \; dx^n+Γ_{\phantom{.}mn}^k \: 𝒻 \;ε^{ijm} \; dx^n  ;
0=n𝒻εijk+Γ.mni𝒻εmjk+Γ.mnj𝒻εimk+Γ.mnk𝒻εijm0=∂_n 𝒻 \;ε^{ijk}+Γ_{\phantom{.}mn}^i \: 𝒻 \;ε^{mjk}+Γ_{\phantom{.}mn}^j \: 𝒻 \;ε^{imk}+Γ_{\phantom{.}mn}^k \: 𝒻 \;ε^{ijm}  ;
0=n𝒻ε123+Γ.mn1𝒻εm23+Γ.mn2𝒻ε1m3+Γ.mn3𝒻ε12m0=∂_n 𝒻 \;ε^{123}+Γ_{\phantom{.}mn}^1 \: 𝒻 \;ε^{m23}+Γ_{\phantom{.}mn}^2 \: 𝒻 \;ε^{1m3}+Γ_{\phantom{.}mn}^3 \: 𝒻 \;ε^{12m}  ;
0=n𝒻+Γ.1n1𝒻+Γ.2n2𝒻+Γ.3n3𝒻0=∂_n 𝒻+Γ_{\phantom{.}1n}^1 \: 𝒻+Γ_{\phantom{.}2n}^2 \: 𝒻+Γ_{\phantom{.}3n}^3 \: 𝒻  ;
0=n𝒻𝒻+n(|g|)|g|\displaystyle 0=\frac{∂_n 𝒻}{𝒻}+\frac{∂_n \left(\sqrt{|g|}\right)}{\sqrt{|g|}}   ;  𝒻=1|g|\displaystyle 𝒻=\frac{1}{\sqrt{|g|}}  .

• On peut alors en particulier définir une notion de produit vectoriel par :
[A×B]i=1|g|εijkAjBk\displaystyle \left[\overset{→}{A}×\overset{→}{B} \,\right]^i=\frac{1}{\sqrt{|g|}} \: ε^{ijk} \: A_j \: B_k   ;   [A×B]i=|g|εijkAjBk\left[\overset{→}{A}×\overset{→}{B} \,\right]_i=\sqrt{|g|} \:\: ε_{ijk} \: A^j \: B^k .

De même on peut représenter le rotationnel par :  [×A]i=1|g|εijkjAk\displaystyle \left[\overset{→}{∇}×\overset{→}{A} \,\right]^i=\frac{1}{\sqrt{|g|}} \: ε^{ijk} \: ∂_j A_k .

📖 exercice n° V.