Docstoc

physique

Document Sample
physique Powered By Docstoc
					                                                                             Sylvain POIRIER
                                                                             http://spoirier.lautre.net/


                                          e
                                 Relativit´ restreinte et
                                   a                   e
                        initiation ` la physique math´matique


                                                   e e
                                  1. Introduction g´n´rale
                                  e
1.1. Qu’est-ce que la science math´matique ?
                      e                  e              e     e
     Pour le dire bri`vement, c’est l’´tude des syst`mes ´ventuellement infinis mais constitu´s de    e
              ee                                                e                          e
purs objets ´l´mentaires, dont l’existence est abstraite, ind´pendante du monde ext´rieur. Chaque
               ee                                e                                   e
constituant (´l´ment, relation. . . ) de ces syst`mes a pour seule nature le fait d’ˆtre exact, du type
                                     e            e                 e                    e         e
“tout ou rien” : deux objets sont ´gaux ou diff´rents, sont reli´s ou ne sont pas reli´s, une op´ration
             e
donne un r´sultat exactement. . .
                          e      ae                 e      e                       e
     Le choix de tels syst`mes ` ´tudier est lui-mˆme ´galement un choix math´matique, en ce sens
               e                                  e       e                                a
qu’il est donn´ par des conditions de complexit´ limit´e (contrairement par exemple ` la biologie qui
  e                                 e                 e
d´pend des choix arbitraires secr`tement accumul´s par la Nature pendant des milliards d’ann´es).     e
                  e
La science math´matique est ainsi autonome par rapport aux contingences de notre Univers, mais
                            a
peut toujours s’appliquer ` chacun des innombrables lieux ou aspects particuliers de ce dernier o`       u
                                   e       e
de telles situations de complexit´ limit´e peuvent se rencontrer.
                                               e                                 e
     Bien que ces objets soient de nature ind´pendante de toute forme de repr´sentation sensible (ou
                      e                                                 e
apparence) particuli`re, on ne peut les comprendre qu’en se les repr´sentant sous une certaine forme.
                                                 e                e            e       e
Il peut y avoir plusieurs formulations ou mani`res de se repr´senter une mˆme th´orie, toutes ´tant  e
                  e                                          e                       e         e   e
rigoureusement ´quivalentes entre elles mais leur efficacit´, leur pertinence peut ˆtre tr`s diff´rente.
                        e                    e      e
Le plus souvent, les id´es sont d’abord d´velopp´es sous forme d’intuitions, d’imaginations plus ou
                                e                                       e           e
moins visuelles, puis cristallis´es en des formules et des phrases litt´raires pour ˆtre communiqu´es, e
e                   e                                                 e                          e
´crites ou travaill´es sous ces autres formes. Et on ne peut se lib´rer d’une forme de repr´sentation
          e           e                                      e                       c       a
particuli`re qu’en d´veloppant d’autres formes de repr´sentation et en s’exer¸ant ` traduire les
                                       a
objets et les concepts d’une forme ` l’autre.
                            e
1.2. Qu’est-ce que la g´om´trie ?e
     ´                             e e                                                  a
     Etymologiquement, le mot g´om´trie signifie “mesure de la terre”. C’est donc, ` l’origine, une
            e a      e e         e
science reli´e ` la r´alit´ concr`te : celle de l’espace qui nous entoure, ou celle des plans : celui
du sol lorsqu’il est plat, ou de toute surface plane (papier, tableau. . . ), que l’on peut voir et sur
                                           e e                       e
laquelle on peut dessiner facilement. Le g´om`tre grec Euclide en a ´crit le premier une formulation
                                       u              ea     e e
axiomatique dans le cas du plan, d’o` le nom donn´ ` la g´om´trie plane usuelle.
          e e                                     e     e                   a             e         e
     La g´om´trie euclidienne est ainsi la premi`re th´orie physique, c’est-`-dire une th´orie math´-
                   e        e e                      e
matique qui mod´lise la r´alit´ physique, en l’id´alisant : tandis que deux points trop proches
                                       e             e                                       e
l’un de l’autre peuvent difficilement ˆtre distingu´s par des mesures physiques, en math´matique
                                 e
il faut trancher : ils sont soit ´gaux, soit distincts (ainsi, entre deux points distincts se trouvent
d’autres points, et ainsi de suite : dans un segment de droite de longueur finie il existe une infinit´e
                                                       e e          e             e
de points). Et on tranche au plus simple : cette g´om´trie se d´finit comme ´tant la plus simple
   e                                                  e
th´orie du plan ou de l’espace en accord avec l’exp´rience physique habituelle. C’est aussi l’unique
   e                                               e     e
th´orie dans laquelle est vrai exactement tout ´nonc´ simple qui semble vrai, aux incertitudes de
           e                e        e
mesure pr`s, pour cette mˆme exp´rience.
                  e                              e e          e
    Pour un math´maticien moderne, le mot “g´om´trie” d´signe le nom de famille que portent
                       e           e
un grand nombre de th´ories math´matiques qui ont entre elles plus ou moins de liens de parent´,   e
notamment le fait qu’il est plus ou moins possible de les visualiser, d’en dessiner des figures. D’un
                 e                           e                                          a      e e
point de vue math´matique, elles sont toutes ´galement “vraies”, se rapportant toutes ` des r´alit´s
     e
math´matiques (des ensembles de “points”. . . ).
                                          e  e
1.3. Comment peut-on visualiser d’autres g´om´tries ?

                                                    1
                                        e e
     Mais comment visualise-t-on la g´om´trie euclidienne, d’abord ? Elle n’est pas celle que l’on
                           e e                                    e e          e
voit directement, car la g´om´trie du champ de vision est la g´om´trie sph´rique.
     En effet, la vue d’un point ne nous renseigne que sur la demi-droite issue de l’œil auquel ce
                                                       e
point appartient; et cette demi-droite peut se repr´senter par son point d’intersection avec une
    e         e                                                 e
sph`re centr´e sur l’œil. Lorsqu’on bouge l’œil et/ou la tˆte, la modification de ce qu’on voit
             a                           e
correspond ` une rotation de cette sph`re. L’exemple le plus clair en ce sens est celui des objets
                                 c                            e     e                   a
astronomiques dont on ne per¸oit que l’image sur la “sph`re c´leste” (qui tourne ` cause de la
                                e
rotation de la Terre sur elle-mˆme).
                e e
     Mais la g´om´trie euclidienne (du plan ou de l’espace) est seulement celle qu’on a le plus
l’habitude de concevoir. En effet, en voyant ou en imaginant une image de dimension 2 (sur la
    e                            a                                          e     e
sph`re de vision), on attribue ` chaque point une sensation de proximit´ ou d’´loignement, et on
                          e
est familier avec la mani`re dont cette perception se transforme lorsqu’on tourne l’objet ou qu’on
                                       a                          e
change de point de vue par rapport ` lui. C’est cette facult´, fruit d’une construction mentale,
                            e                e e                       e a
qui constitue notre compr´hension de la g´om´trie, et notre agilit´ ` l’employer en rend l’usage
                                               ee                          e
tellement facile comme celui d’une sensation ´l´mentaire, que son caract`re indirect en est presque
anecdotique.
                                             e e            e       e                               a
     Or, la perception intuitive des autres g´om´tries rel`ve du mˆme principe : celui qui consiste `
                                                                  a                         e e
voir une chose pour en concevoir une autre. Et pour parvenir ` concevoir ainsi d’autres g´om´tries
                                     e                   e
en s’appuyant sur une vision qui (h´las) demeure la mˆme, un bon moyen est de travailler sur cette
      e                                                                                   e e
facult´ de concevoir l’espace euclidien, en la particularisant, en la modifiant ou en la g´n´ralisant.
                                                              e
(Mais ensuite, il est vrai que ce lien avec la vision ne se pr´serve pas facilement, et que le travail
                                                                         o
de conception devient plus intense et traduit en formules avec un rˆle de la vision relativement
moindre).
                                                                                            e
     Par exemple, on peut concevoir des espaces (euclidiens ou non) de dimension sup´rieure `       a
                              e                       e                  e            a
3. Ils ne comportent math´matiquement aucune v´ritable nouveaut´ par rapport ` la droite, au
        a                   e                             e                   a
plan et ` l’espace usuel, mˆme si l’absence totale d’exp´rience par rapport ` eux donne aux novices
                            e
l’impression d’une difficult´ insurmontable. Pour concevoir ces espaces, on peut par exemple se dire
                                                   e
qu’on ne voit que deux ou trois dimensions en mˆme temps sous forme de coupe ou de projection,
                                e
mais qu’il y en a d’autres en r´serve, on peut les changer. . .
        e  e                  e
1.4 La g´om´trie euclidienne d´crit-elle exactement l’espace physique ?
                                                             e
    Non. Non seulement le temps s’y ajoute en relativit´ restreinte pour former un espace de
                                                                  e                  e e
dimension 4 qui n’est pas euclidien (l’espace-temps) et est plus r´el (proche de la r´alit´ physique)
                                                  e                      a       e
que notre espace de dimension 3 usuel, mais mˆme si on se restreint ` consid´rer son apparence
                               e                   e e e                           e e
d’espace de dimension 3, la th´orie de la relativit´ g´n´rale nous enseigne qu’en r´alit´, cet espace,
                                                      e                  a      e e
pour autant qu’on puisse encore le mesurer, n’ob´it pas exactement ` la g´om´trie euclidienne
    e                                          e                               e
(ind´pendamment de toute question de mat´rialisation des objets ou de pr´cision des mesures).
       u                                            e
Bien sˆr, l’erreur de le supposer euclidien est extrˆmement faible, plus encore que d’autres erreurs
                       e             ea                   e  e
beaucoup plus compr´hensibles et d´j` couramment n´glig´es : lorsqu’on cartographie une r´gion   e
                        a       e      e                                           a       e
de la Terre (de forme ` peu pr`s carr´e par exemple) de taille L, en l’assimilant ` une r´gion d’un
                e e                       a             e
plan, l’erreur g´om´trique normale due ` la rotondit´ de la Terre vaut (en distance sur le terrain)

                                                 L3
                                                 R2
  u                                                                                e
o` R = 6370 km est le rayon de la Terre, ce qui fait par exemple 2,4 cm pour une r´gion large de
10 km.
              a             e e e                            e              e
    Celle due ` la relativit´ g´n´rale, qui mesure donc le mˆme type de d´callage par rapport
` la g´om´trie euclidienne plane mais concerne le plan tangent ` la Terre et constitue un effet
a     e e                                                        a
     e                       a                                                     e
suppl´mentaire par rapport ` celui qu’on calculerait en termes de la seule rotondit´ de la Terre,
vaut
                                              2L3 g
                                              Rc2
o` g = 9, 8 m.s−2 est l’acc´l´ration de pesanteur et c = 3.108 m.s−1 est la vitesse de la lumi`re.
 u                         ee                                                                  e
                                                  e e                               e
Elle est donc 720 millions de fois plus faible (pr´cis´ment, pour n’importe quelle r´gion choisie);

                                                  2
                                          e                 e
dans le cas de la mesure de la Terre enti`re au lieu d’une r´gion, l’erreur est de l’ordre de quelques
         e            e           e               e
centim`tres. Ainsi, ´tant donn´ un choix d’“´quateur” parfaitement circulaire, sa longueur est
    e      a                                e                            e
inf´rieure ` sa distance au centre multipli´e par 2π (mais le calcul pr´cis de sa distance au centre
  e             e                                               e
d´pend de la r´partition de la masse de la Terre entre les diff´rentes profondeurs).
                              e
      Si maintenant on consid`re un plan vertical, une autre erreur survient, elle aussi plus forte que
                           e e e
celle issue de la relativit´ g´n´rale : le solide de longueur L que l’on tourne pour comparer des
                                          e                                  e
longueurs horizontales et verticales se d´forme sous son propre poids (il s’´tire s’il est pendu, il se
                      e
contracte s’il est pos´), d’une amplitude de l’ordre de

                                                    L2 g
                                                    c2

 u                                                        e         e       a         e
o` c est la vitesse du son dans le solide, qui est forc´ment inf´rieure ` c d’apr`s la relativit´   e
restreinte.
                 oe
     De l’autre cˆt´, la physique de l’infiniment petit pose actuellement tellement de probl`mes  e
                           e                      e                                          e e
que certains physiciens th´oriciens envisagent s´rieusement que les concepts usuels de g´om´trie
                          a e
ne seraient plus valables ` l’´chelle de Planck (qui est bien plus petite que la plus petite distance
pour laquelle le comportement des particules est actuellement connu).
                                   e
1.5. Qu’est-ce que la physique math´matique ?
 ´
Etat des lieux
                                                              e
     Il y a deux types de travaux en physique math´matique: la physique fondamentale et la
                    e                e                                   e
physique appliqu´e. La partie th´orique de la physique appliqu´e consiste essentiellement ` d´ve-      a e
                e                                           a                               e
lopper les cons´quences de la physique fondamentale ` l’aide d’approximations adapt´es (en s’aidant
                 e                                                            a e                    e
parfois de l’exp´rience quand les approximations sont trop difficiles ` r´aliser sur le plan th´orique).
                                                                   e              e
     La partie physique de cet ouvrage aura pour but de pr´senter des th´ories physiques fondamen-
           e                         e e a                                           e
tales bien ´tablies et largement v´rifi´es ` ce jour, des plus simples (math´matiquement simples et
                   e                            e      e            e                       e
proches de l’exp´rience courante) aux plus ´volu´es (math´matiquement sophistiqu´es et ` la base     a
                                                    e      e
de l’explication du plus grand nombre de ph´nom`nes). Mais cet ordre de rangement n’est pas
                                     e e                                   e
strict. Du point de vue de la “r´alit´ physique”, seules les derni`res auraient le titre de th´ories     e
physiques fondamentales puisqu’elles sont physiquement plus fondamentales et pr´cis´ment con-e e
         a     e e                    e                                e
formes ` la r´alit´ que les premi`res qui n’en sont que des r´sultats et approximations; mais il
                           e                  e
se trouve que l’ordre p´dagogique des th´ories fondamentales (l’ordre de la compr´hension danse
                                              e
leur apprentissage et le sens intuitif donn´ aux notions) est plus ou moins l’inverse de leur ordre
      e                            e
de d´pendance en tant que th´ories physiques. (C’est finalement logique puisque si une th´orie             e
      e e               e        a                               e
A pr´c´dait une th´orie B ` la fois physiquement et p´dagogiquement, on classerait B dans la
physique appliqu´e).e
                             e                                       e
     D’abord il y a la m´canique classique, celle de Galil´e et Newton, qui traite des forces et
                                                    e
des mouvements; la loi de la gravitation s’y ´nonce simplement. A partir d’elle on peut avancer
dans deux directions, qui sont les deux types de physique moderne qui s’opposent ` la physique a
                                     e                     e e
classique : d’une part la Relativit´ (restreinte puis g´n´rale), d’autre part, la physique quantique et
                                           e                       e              e
la physique statistique, qui sont deux th´ories parentes et ´troitement li´es entre elles. Ces th´ories  e
                                e
seront introduites plus en d´tails dans les chapitres correspondants.
                  e                                      e                 e
     Nous ne pr´ciserons pas les justifications th´oriques et exp´rimentales sur lesquelles repose
leur reconnaissance, car ces justifications sont actuellement innombrables et parmi elles, celles `          a
                                 e               e                                e
l’origine historique de leur d´couverte ont d´sormais perdu tout caract`re privil´gi´.    e e
                  e           e           e           e                                       e
     Une telle d´marche p´dagogique d´barrass´e des questions de justification exp´rimentale est
                                            e              e             e e                  e
largement satisfaisante du fait que ces th´ories bien ´tablies et v´rifi´es avec une extrˆme pr´cision, e
             ea                                                              e
englobent d´j` dans leur domaine d’application la plupart des exp´riences de physique r´alisables. e
                                        e        e                             a       e
Cependant, beaucoup de ces exp´riences ´chappent en pratique ` cette r´duction ` cause de        a
       e                e                         e                             e
l’extrˆme complexit´ de leur expression th´orique, ou des difficult´s parfois insurmontables de
    e                     e           e
la r´solution des probl`mes math´matiques correspondants.
     Ceci ne fait pas de la physique fondamentale une science morte pour autant, car non seule-
             e        e                                         e                   e e e
ment les th´ories ´tablies sont manifestement incompl`tes (la relativit´ g´n´rale et la physique

                                                     3
                                                                       a                       e
quantique sont difficilement conciliables pour des raisons impossibles ` vulgariser), mais la th´orie
                               e                                e              e
quantique sous sa forme compl`te compatible avec la relativit´ restreinte (th´orie quantique des
             e                                           e
champs) s’av`re, au niveau fondamental, d’une complexit´ quasi-insondable manquant d’un fonde-
           e                                                                    a
ment math´matique bien clair sur lequel reposer, et le travail de reformulation ` la recherche d’un
meilleur fondement demeure actif.
Aspects philosophiques
        e
     Mˆme si on supposait que les objets physiques aient une nature, nous ne pourrions de toute
      e
mani`re pas la connaˆ                 e
                        ıtre par l’exp´rience car toutes nos perceptions passent par une traduction
        e     e       e
des ph´nom`nes ext´rieurs en la conscience qu’on peut avoir d’eux. Donc, le mieux qu’on puisse
            e                                            e        e
faire est d’´tudier le monde physique en tant que syst`me math´matique, ce qui nous laisse libres
                e
de nous le repr´senter sous des formes sans rapport avec celles sous lesquelles nous le percevons
                                        e
habituellement. Expliquons cela en d´tails:
                         a                                      e          a           ee
       Au moins jusqu’` maintenant, il semble que toute pr´tention ` dire qu’un ´l´ment de l’ima-
                                                  a                                 ee
gination serait plus qu’un autre ressemblant ` la “vraie nature” d’un certain ´l´ment de la r´alit´ e e
physique est vaine, parce qu’il n’existe aucun moyen de comparer ces natures : toutes nos percep-
                       e
tions du monde ext´rieur sont indirectes, traduites par notre corps en impulsions nerveuses, que le
                                                                                             e
cerveau retraite pour en distinguer les formes globales. Donc, du monde physique ext´rieur, seules
                        a                                                     a
les structures, c’est-`-dire les relations entre les choses, sont accessibles ` nos sens et peuvent faire
l’objet de nos discours, non une quelconque nature ontologique. Et de toute mani`re, commente
     e                                                                   e
esp´rer qu’un objet physique puisse avoir une quelconque identit´ de nature avec un ph´nom`ne   e    e
mental ?
       Par exemple il n’y a aucune ressemblance de nature entre le sentiment d’une couleur et les
         e                                                                             e
qualit´s des objets vus, qui sont responsables de cette couleur. Cette qualit´ consiste en des
                                    e        e                   e            e
coefficients d’absorption de diff´rentes fr´quences d’ondes ´lectromagn´tiques par ces objets, qui
  e                                  e                   e                c
d´terminent la composition en fr´quences de la lumi`re que l’oeil re¸oit. Puis, ce n’est qu’une faible
partie de l’information sur cette composition que les cellules de l’oeil peuvent transmettre (suivant
             ee           e              e
les propri´t´s des mol´cules dans la r´tine qui font ce travail).
       ´                           a                               e                 e
       Egalement, nous pouvons ` peine imaginer le temps, mˆme juste conform´ment ` la mani`rea       e
                                                                 e
dont nous le vivons, qui montrerait la nature de cette exp´rience vivante du temps au-del` de la  a
                                       e            e
seule forme de la droite qui le repr´sente math´matiquement : en aucun instant nous ne pouvons
                     e                                                                    e
imaginer une dur´e en tant que telle, puisqu’un instant ne contient aucune dur´e; il n’y a que
           e                                                e          e
les dur´es futures qui n’existent pas encore, et les dur´es pass´es, que nous percevons dans notre
                     ea                         e                        e
souvenir. Mais d´j`, un souvenir d’une dur´e n’est plus une dur´e, car il ne fait que repr´senter e
             e
cette dur´e par une certaine autre sensation instantan´e.  e
                   e             e
       Ainsi, la pr´tention de d´crire les choses “comme elles sont” serait vaine, ou alors, ce n’est
                                       e                             e                   e
plus de la physique mais de la m´taphysique, ce qui peut ´ventuellement se d´fendre ` condi-    a
                                                                  e
tion de l’annoncer clairement. Eventuellement, cela peut ˆtre utile lorsqu’on travaille avec une
   e
th´orie provisoire qu’on est en train de remettre en question pour tenter d’en construire une autre
           e                                                       a                     e
plus pr´cise comme explicitation de structures sous-jacentes ` une structure donn´e (par exemple,
                                                       e
cela est pertinent pour passer des moles aux mol´cules, et de la thermodynamique classique ` la      a
   e                                                          e
m´canique statistique). Mais cela n’a lieu que de mani`re relative et non absolue, et n’est pas le
       e e
cas g´n´ral.
                                              e                               a
     L’objet de la Physique est donc de d´crire les lois physiques, c’est-`-dire l’expression sous
             e          e                                e           e
forme de th´orie math´matique des relations constat´es entre les r´sultats de nos observations du
                                            e           e e             e
monde physique, puisque c’est une caract´ristique g´n´rale des math´matiques que de s’int´ressere
                                                    a                                      e
aux structures, relations entre les objets, et non ` leur nature. Alors, entre plusieurs pr´sentations
      e               e                                       e                 e
math´matiquement ´quivalentes (ou traductions) d’une th´orie, faisant diff´rents choix de formes
                          e                                 e e
d’imagination pour repr´senter tel ou tel aspect de la r´alit´, la meilleure est celle qui permet de
               e          e                     e
saisir cette th´orie math´matique de la mani`re la plus facile ou efficace.
                                                             e a           e
     L’intuition quotidienne du monde physique est adapt´e ` la compr´hension des probl`mes dee
                                                  a e                           e e
la vie quotidienne. Mais lorsqu’on veut passer ` l’´tude des structures de la r´alit´ qui apparaissent
                                   e
dans d’autres contextes, il peut ˆtre judicieux de modifier ce choix. Mais de toute mani`re, un e
                                                       e
discours s’appuyant ainsi judicieusement sur un syst`me inhabituel de correspondances entre objets

                                                   4
 e                                             e a           e                         u
r´els et formes d’imagination employ´es ` les repr´senter, est donc bien sˆr pareillement vide de
                                                                              e e
signification sur la vraie nature de ces aspects ou objets de la r´alit´ physique que tout autre
discours.
                                e             e                                 e
      Faute d’avoir une th´orie compl`te de la physique, on a des th´ories partielles, dont chacune
                        ee          e                e                                    e
concerne les propri´t´s des r´sultats des exp´riences d’un certain domaine exp´rimental de la r´alit´,   e e
        a                               e                             e        e
c’est-`-dire un certain type d’exp´riences avec un certain degr´ de pr´cision des mesures (d´pendant   e
              e                e
des param`tres de l’exp´rience). Au cours de l’exploration de la physique math´matique, on est e
        ea         e                             e                     a     e
amen´ ` consid´rer une succession de th´ories correspondant ` diff´rents domaines exp´rimentaux,     e
                                                 e             e
de plus en plus larges et dont les cons´quences th´oriques sont de plus en plus pr´cis´ment en     e e
                      e                                                           a
accord avec l’exp´rience (ou donnent de plus en plus d’informations ` lui confronter).
                              e                                        e            e
      Chacune de ces th´ories est d’abord par nature une th´orie math´matique; sa signification
                                e                                a           a              e
physique (son titre de th´orie physique) consiste alors ` attribuer ` chaque exp´rience du domaine
     e                   ee                              e           a                             e
exp´rimental consid´r´ une traduction dans la th´orie, c’est-`-dire un certain sous-syst`me d’objets
          e                e              e                                e
de la th´orie qui repr´sente math´matiquement le dispositif exp´rimental utilis´.            e
                      e                                                  e
      Mais une th´orie a aussi une signification intuitive, qui r´side dans le choix de la forme de
      e                               e a           e               e
repr´sentation la mieux adapt´e ` la compr´hension de la th´orie. Dans cette exploration, beaucoup
        e        e e
de th´ories g´om´triques interviennent, non seulement pour rendre compte du comportement de
          e e             a        e
la mati`re ´voluant ` l’int´rieur de l’espace qui nous est familier, mais aussi pour remplacer cet
                e
espace lui-mˆme par d’autres (ce dernier cas n’arrive pas souvent : principalement en Relativit´               e
                         e e e
restreinte, Relativit´ g´n´rale et ce qui inclut la gravitation quantique). Et, parmi nos intuitions
              e                  a
ou capacit´s habituelles ` percevoir le monde physique, la vision est celle qui est la plus claire
        e                                      a
math´matiquement, et la plus facile ` exercer pour pouvoir, avec elle, concevoir beaucoup de ces
   e         e e
th´ories g´om´triques.
                    e         ıf a
      La difficult´ du na¨ ` remettre en question la forme de ses perceptions se pr´sente aussi en e
                              e e                         e e
termes du principe de r´alit´, suivant lequel “la r´alit´ physique existe” que nous la percevions ou
                                                   a                                           e
pas, au nom de quoi il voudrait continuer ` penser les choses en termes d’“objets r´els” ou concrets
                     c                                    e                                  e e
tels qu’il les per¸oit habituellement. Or le probl`me n’est pas de savoir si la r´alit´ comporte ou
                                                    e
non d’autres objets que ceux de notre exp´rience ou perception, car de toute mani`re les th´oriese       e
                                                         e                     e
physiques avec lesquelles nous travaillons en pr´sentent. Le probl`me est de savoir lesquels. Le
   ıf                                   e e
na¨ imagine ces objets de la r´alit´ sous-jacente, qu’il ne peut percevoir directement, comme
                a
ressemblant ` ceux qui lui sont familiers. Il n’a pas toujours tort, d’ailleurs, dans la mesure o` tel     u
            e     e                                       e      ua        e                e
ou tel ph´nom`ne qu’il a besoin d’expliquer peut ˆtre dˆ ` des m´canismes situ´s dans un domaine
     e                                       e
exp´rimental plus large que son exp´rience courante, mais pas encore assez pour que son intuition
           e                               e a                                e
cesse d’ˆtre valide, son incapacit´ ` observer directement ces m´canismes suivant cette mˆme               e
             e                                         e
intuition ´tant seulement contingente et rem´diable par des instruments adapt´s (microscopes,  e
 ee
t´l´scopes, etc.).
                                                                         e
      Par contre, lorsqu’en poussant plus avant le domaine exp´rimental on se trouve confront´ `             e a
                     e
une impossibilit´ plus fondamentale d’affiner les instruments de mesure pour observer le mˆme                e
              e             e                                                         a
type de m´canismes r´els explicatifs, il est temps d’envisager qu’il y ait ` cela une bonne raison:
a                                      e e                            a                ıf
` savoir qu’il n’existe pas de r´alit´ explicative ressemblant ` ce que le na¨ voudrait croire, parce
           e e                                             e
que la r´alit´ est d’une autre forme qui ne peut ˆtre comprise que par des moyens diff´rents, en       e
                  e
des termes diff´rents.
                              e    e
1.6. Quelques mots de g´om´trie euclidienne
     ´                  e e
     Evoquons ici les g´om´tries euclidiennes de dimensions 1, 2 et 3. Celle de dimension 1 (de
                                     e
la droite) est la plus simple math´matiquement; les deux suivantes (du plan et de l’espace) sont
                       ee                            e               e
presque de complexit´ ´quivalente, et seront trait´es ici de la mˆme mani`re. e
                              e a
     Notre vision est habitu´e ` comprendre le plan et l’espace, mais se trouve un peu large pour
                                                                                  a
parler de la droite : quelle droite ? horizontale, verticale. . . ? On a tendance ` vouloir placer cette
                               ea                   a
droite quelque part. On a d´j` moins tendance ` vouloir disposer le plan dans l’espace, puisque
les deux dimensions du plan remplissent les deux dimensions du champ de vision, ne laissant pas
                                        oe                                               e
voir le vide qui se trouve de chaque cˆt´. Mais quels que soient nos modes de repr´sentations et
  e                                                                      e e
d’´ventuels rapports avec notre Univers physique, chacune de ces g´om´tries, en tant que th´orie   e
      e                     a        e                                  e          a     e
math´matique, se limite ` consid´rer les constructions pouvant ˆtre faites ` l’int´rieur de son

                                                       5
     e                                     e                               e            e
syst`me (la droite, le plan, l’espace) ind´pendamment de toute consid´ration d’un ´ventuel espace
    e                            e              e          e    e
ext´rieur dans lequel ce syst`me pourrait ˆtre dispos´. Mˆme si une telle disposition peut ˆtre     e
                                                     e
utile pour des calculs et raisonnements interm´diaires ou comme support intuitif, elle n’est pas
       ee                                e e           e                 e
consid´r´e comme faisant partie des r´alit´s premi`res dans cette th´orie, et doit donc disparaˆ    ıtre
                   e               e                         e                        e e
dans les objets d’´tude et les r´sultats finaux. Cette ind´pendance de chaque g´om´trie apparaˆ        ıt
                                eae      e                                             e e
clairement dans l’exemple d´j` ´voqu´ du champ de vision, qui a la forme (ou g´om´trie) d’une
    e              e                               e
sph`re : cette sph`re a certes un centre bien d´fini (l’œil) mais n’a pas de rayon, il serait faux de la
                          e           e           e
confondre avec une sph`re particuli`re dispos´e dans l’espace. (Elle est l’ensemble des demi-droites
issues de l’œil.)
                                                a                                                 e
      Pour cette raison, il est bon de fournir ` disposition de notre intuition des formes de repr´sen-
                                                 e e                         e e
tations autres que visuelle pour figurer la g´om´trie de la droite (ou g´om´trie de dimension 1).
En voici deux. D’abord, la sensation du temps. Ensuite, la notion de fil (infiniment fin), en tant
            e                                 e      e
qu’objet m´canique dont la nature est pr´serv´e quelles que soient les dispositions dans l’espace
                                 e                             e
(droites, courbes, lignes bris´es. . . ) qu’on lui donne. Pr´sentons maintenant une introduction
          a     e e
intuitive ` la g´om´trie euclidienne.
            e                                    ee                e    e                 a
     Consid´rons des fils de longueur finie, arrˆt´s en deux extr´mit´s (on les coupe l`, ou bien on
oublie les prolongements comme s’ils n’existaient pas). On appellera courbe une image d’un fil,
                                               e          e                      e
lieu du plan ou de l’espace en lequel il peut ˆtre dispos´. Chaque fil se caract´rise par sa longueur,
                     e                                                  e           e
qui est une quantit´ positive. Pour toute courbe, les fils pouvant ˆtre dispos´s dessus sont tous
                    e
ceux qui ont une mˆme longueur, qu’on appelle alors la longueur de la courbe. Tout point d’un fil
                                                              e      a                       e
le divise en deux parties, dont la somme des longueurs est ´gale ` la longueur du fil de d´part. La
                                     e                                    a
longueur d’une courbe se mesure ´galement par le temps qu’on met ` parcourir cette courbe du
        a           e                  e
regard ` vitesse fix´e (ainsi sont reli´es ces 3 intuitions unidimensionnelles: les fils, le temps et les
courbes).
                                         e   e      e                                   e e
     Marquer le fil d’une graduation r´guli`re rep´rant les longueurs depuis une extr´mit´ (ou plus
  e e                                                           e e                      e
g´n´ralement depuis un point quelconque du fil), ou de mani`re ´quivalente chronom´trer le temps
              a
de parcours ` vitesse constante, fournit un marquage de chaque point de la courbe par un nombre
                 e     e
ou une quantit´ appel´ son abscisse curviligne.
     Entre deux points distincts A et B, il y a une valeur minimale non nulle des longueurs de
courbes qui les relient; c’est la seule longueur pour laquelle il n’existe qu’une seule courbe qui les
                              e                     e
relie. Cette courbe est not´e [AB], et est appel´e un segment. Sa longueur s’appelle la distance
                                                                 e     a
entre A et B. Inversement, la longueur d’une courbe peut se d´finir ` partir de la notion de distance
(sans utiliser la mesure des longueurs des fils) : c’est la valeur vers laquelle s’approche la somme
                                                  e
des distances entre des points de la courbe cons´cutifs pour le fil, lorsque ces points sont de plus en
                              e                                                                e
plus nombreux et rapproch´s dans le fil (envahissant toutes les parties du fil). On pourrait d´finir `   a
                                                                                    a
partir des segments les demi-droites et les droites, ou inversement les segments ` partir des droites
  e                         e                              e
d´finies en termes de sym´trie axiale qui sont des antid´placements (voir plus bas), mais passons.
                                                                             e e      a
     La notion de disposition d’un fil dans le plan ou dans l’espace se g´n´ralise ` la disposition
d’un morceau de plan dans l’espace (une feuille de papier), d’un volume dans l’espace (un solide),
                                                                     e
ou d’un morceau de plan dans un plan (une feuille de papier pos´e sur une table).
                                                       e e
     Exprimons-nous maintenant dans le cas de la g´om´trie plane.
                               ae                                  e
     L’ensemble des points ` ´gale distance d d’un point donn´ O s’appelle le cercle de centre O
                                                                                       e
et de rayon d. Une droite divise le plan en deux demi-plans. L’intersection ou la r´union de deux
                                                                                  e     a
demi-plans s’appelle un secteur angulaire S qui se mesure par son angle : O ´tant ` l’intersection
                        e
des deux droites fronti`res, l’intersection de S avec un cercle de centre O est une courbe, dont la
                e                                                             e
longueur divis´e par le rayon est la mesure en radians de l’angle (qui ne d´pend pas du rayon).
                          e e          a     e e                             c
     (Ce qui suit serait g´n´ralisable ` la g´om´trie dans l’espace en rempla¸ant feuille par solide
et table par espace.)
                                                                                               e
     Chaque disposition d’une feuille sur une table fait voir une figure sur la feuille comme ´tant
une figure sur la table.
                  e                                                e
    On appelle d´placement la transformation d’une figure (dessin´e sur la feuille mais vue comme
e                         e                                                                 e e
´tant sur la table), qui r´sulte d’un changement de disposition de la feuille sur la table r´alis´ par
                                                        e                e              e
simple glissement, sans retournement. La notion d’antid´placement se d´finit de la mˆme mani`re     e

                                                   6
                          ee                                            e
sauf que la feuille (de pr´f´rence un papier calque) est de plus retourn´e. (Dans le cas de l’espace,
                             e                          a                                e
le “retournement” ne peut ˆtre que virtuel, et consiste ` prendre l’image miroir). Les d´placements
                                                                                e
conservent l’orientation du plan (le sens des aiguilles d’une montre), les antid´placements les ren-
versent.
           e
     Tout d´placement dans le plan est soit une rotation, obtenue en tournant la feuille autour d’un
             e
point (appel´ centre et unique point fixe) suivant un certain angle et dans un certain sens (d´finie
             a
par rapport ` l’orientation du plan), soit une translation (qui avance la feuille sans la tourner, et
      e
peut ˆtre vue comme la limite d’une rotation d’angle infiniment petit autour d’un centre infiniment
e      e
´loign´).
    e e           e                           e
Th´or`me et d´finition. On appelle isom´trie une transformation f du plan (ou l’espace) dans
      e         e                          e
lui-mˆme qui v´rifie les trois conditions ´quivalentes suivantes :
     1) f conserve les distances (ou les longueurs de courbes)
                                            e e
     2) f conserve toutes les notions de g´om´trie euclidienne
                  e                         e
     3) f est un d´placement ou un antid´placement.
                  e                e  e
1.7. Fondement exp´rimental de la g´om´trie affine plane
             e            e e                               e
     Nous d´finirons la g´om´trie affine du plan par l’exp´rience suivante. On observe de loin une
           e                                                           a
figure trac´e sur une vitre; on ne sait pas (et on ne saura jamais) ` quelle distance cette vitre se
                                      e
trouve, ni comment elle est dispos´e (de face ou de biais; on ne voit pas son contour), ni si on
                                 e                             e     a
la voit par devant ou par derri`re (ou, ce qui revient au mˆme, ` travers un miroir). Diff´rents   e
                                        e           e                               e
observateurs seront toujours suppos´s ignorer mˆme comment ils sont dispos´s dans l’espace les
uns par rapport aux autres.
     On sait seulement ce qu’on en voit, et la taille apparente en est petite (elle pourrait tenir dans
                                                                                          e e
le disque lunaire par exemple) : on peut la prendre en photo, et faire des mesures g´om´triques
                                          e   a
sur la photo. Le passage de la figure r´elle ` la figure ainsi vue s’appelle une transformation affine.
                                                        e e              ee
     Dans ces conditions, quels sont les notions de g´om´trie (propri´t´s ou mesures d’une figure
– on appellera cela plus loin les structures) dont l’apparence de tout point de vue de ce type est
             e a      e e                                   e    e
toujours fid`le ` la r´alit´, aux incertitudes de mesure pr`s (n´gligeant les effets de distorsion li´se
                                    a
au quotient de la taille de l’objet ` sa distance) ?
                    e e                         e e                  e      a e
     On appelle g´om´trie affine du plan la g´om´trie du plan* r´duite ` l’´tude des notions qui
                 e                        e              e               e e                    a
apparaissent fid`lement dans cette exp´rience. Elle diff`re donc de la g´om´trie euclidienne ` laque-
                         e                                         e
lle nous sommes habitu´s, par le fait que son langage est plus r´duit : lorsque deux observateurs
     e                           e                                                      e
plac´s en des points de vue diff´rents se communiquent leurs observations d’une mˆme figure par
 ee
t´l´phone, en ayant seulement le droit de s’exprimer dans ce langage, ils seront toujours d’accord.
                   e                                                              e         e
Et ils peuvent mˆme introduire de nouveaux termes, tant qu’ils peuvent les d´finir enti`rement au
moyen de ce langage, ils resteront toujours d’accord.
                                    e e                                                        e e
     Ainsi, toutes les notions de g´om´trie affine sont des notions qui existent aussi en g´om´trie
                                                       e e                     e
euclidienne. Mais certaines notions habituelles de g´om´trie euclidienne n’´tant plus valables, on
                                                                a
a alors besoin, pour pouvoir encore travailler, de recourir ` des notions moins habituelles qui
                e e
subsistent en g´om´trie affine, pouvant correspondre aux anciennes notions pour des observateurs
particuliers.
           e               e e                                        e
     Un mˆme objet de g´om´trie affine admet de multiples interpr´tations (ou mesures) possibles
                         e e                                                         e        e
dans le langage de la g´om´trie euclidienne (chaque observateur a son interpr´tation d´finie par
                                               ee
ce qu’il voit), et aucune mesure ou propri´t´ qui utilise seulement le langage affine ne permet
                                                                                       e
d’exprimer comment distinguer “quelle est la vraie”. N’importe laquelle peut ˆtre consid´r´e        ee
comme vraie du point de vue correspondant.
                                             e e                                    e           a
     La notion de droite fait partie de la g´om´trie affine. Toutes les notions d´finissables ` partir
                 e e                                       e e
de notions de g´om´trie affine, font aussi partie de la g´om´trie affine. Par exemple, font partie
        e e
de la g´om´trie affine les notions d’alignement des points, de demi-droites, segments, parall`les ete

                                                                                            e
  * Voici pourquoi on se permettra de parler de plan (infini) bien que la figure soit suppos´e tenir
dans le disque lunaire : il suffit de partir de figures beaucoup plus petites que le disque lunaire (on
                     ee                         a
a donc besoin d’un t´l´scope pour l’observer), ` partir de quoi le disque lunaire semblera presque
infiniment grand comme un plan: on peut y continuer la figure librement. . .

                                                  7
       e                                                         e
parall´logrammes, rapports de longueurs de segments parall`les, rapports des aires, barycentres,
                         e
translations et homoth´ties, paraboles, ainsi que les ellipses et hyperboles avec leurs centres.
                                                         e                                   e e
     En fait, la notion de droite est suffisante pour d´finir toutes les autres notions de g´om´trie
             a                e                                          e
affine, c’est-`-dire qui ne d´pendent pas de l’observateur dans l’exp´rience ci-dessus. Par suite,
                                                                  e
toute transformation qui transforme les droites en droites pr´serve aussi toutes ces notions et est
une transformation affine.
                                 e e
     Ne font pas partie de la g´om´trie affine les notions de distances, longueurs de courbe ou de
                                   e
segment, d’angles, d’orthogonalit´, de cercles, de rotations, de produit scalaire, d’axes et de foyers
                                        e                   e                    e
de coniques, car des observateurs plac´s en des lieux diff´rents peuvent ne pas ˆtre d’accord dessus.
     Par exemple, si l’un croit voir un cercle, un autre ne verra pas un cercle mais seulement une el-
                       e
lipse. Ainsi peut-on d´finir la notion d’ellipse: une ellipse est une figure obtenue par transformation
       a                          e                           e                  e e
affine ` partir d’un cercle. De mˆme, les rotations et antid´placements de la g´om´trie euclidienne
                                                    e e
sont des transformations affines du plan qui en g´om´trie affine ne sont plus distinguables dans un
ensemble plus large de transformations affines.
                   e e
     On a vu en g´om´trie euclidienne les dispositions de fils dans le plan, qui sont certaines ap-
                                                                             a     e
plications d’un fil dans le plan. Ici, il n’y a plus lieu de les distinguer ` l’int´rieur d’un certain
                                                                                                e e
ensemble plus vaste d’applications d’un fil dans le plan, par exemple celui des courbes param´tr´es
                  e         e
(le fil est remplac´ par un ´lastique; si on garde l’intuition du temps pour imaginer le fil, la vitesse
                                                          e                  e
de parcours de la courbe peut alors varier d’une mani`re quelconque, diff´rente d’un point de vue
a
` l’autre suivant la transformation affine subie).

                        e       e         e                    e
                   2. L’´tranget´ de la th´orie de la Relativit´
                                    a            e   a       e       e                   a
      Ce chapitre d’introduction ` la relativit´ et ` son ´tranget´ vise notamment ` analyser la
  e                                                                          a             e
m´thodologie sur laquelle reposent traditionnellement les cours d’initiation ` la relativit´ restreinte,
    a                                                     e
et ` motiver l’adoption d’une nouvelle approche refl´tant mieux l’usage de cette th´orie dans e
                                          e                              e        a
un contexte plus large de physique th´orique. Il s’adresse particuli`rement ` ceux ayant vu la
  e                                     e                                  e
pr´sentation habituelle, mais devrait ˆtre au moins partiellement compr´hensible par tous.
                                                        e
      Il est possible d’aborder directement les choses s´rieuses en passant au chapitre 3.
                                           e
2.1. Son nom et quelques autres aspects ext´rieurs
                  e              e              e                 e e              e
     La relativit´ est en deux ´tapes nomm´es “restreinte” et “g´n´rale”. La th´orie de la relativit´ e
                         e                                                   e e          e
restreinte est une th´orie de l’espace et du temps qui remplace celle pr´c´demment ´nonc´e par  e
      e                    e                     e
Galil´e et Newton, en r´duisant cette derni`re au rang d’approximation valable lorsque les vitesses
                         e    e         e                                 e
relatives des objets ´tudi´s sont n´gligeables devant celle de la lumi`re. (Nous sous-entendrons
                                                                               e e e
parfois l’adjectif “restreinte”, comme nous n’aborderons pas ici la relativit´ g´n´rale).
                e                       e                                               e
     Une cons´quence de la relativit´ est qu’aucun signal, aucune information ne peut ˆtre transmis
                                        e
plus vite que la vitesse de la lumi`re dans le vide (qui est aussi celle des ondes radio), pas plus
                                     e                                                          e e
qu’elle ne peut arriver avant d’ˆtre partie, pour des raisons de non-contradiction de la r´alit´.
Cette vitesse est une constante universelle c ≈ 3.108 m.s−1 , ce qui signifie pr´cis´ment que celui qui
                                                                                e e
                    a               e      e                                                a
envoie un signal ` cette rapidit´ ind´passable, sous forme d’ondes radio par exemple, ` un point
situ´ ` 3.108 m de l` d’o` il est aussitˆt renvoy´, devra attendre deux secondes avant d’en recevoir
    ea                 a    u               o      e
le retour.
                                                                       e           e
     Il ne faut pas se laisser abuser par le nom de la “relativit´” qui refl`te mal le sens de
          e                                     e                             e
cette th´orie : certains auteurs de la th´orie l’ont par la suite regrett´, pensant que celui de
           e e                                                    e
“chronog´om´trie” par exemple aurait mieux convenu, mais il ´tait trop tard. Le slogan caricat-
                                  ea                                                              e
ural “tout est relatif” avait d´j` pris possession de l’imagination populaire, mais son sens n’´tait
                                      e               e
ni nouveau ni correctement repr´sentatif de la th´orie. En effet, d’une part le Principe de rel-
       e e       ea                        e       e                 e       e
ativit´ ´tait d´j` contenu dans la th´orie galil´enne, la seule diff´rence ´tant que le changement
     ee                                                  e
de r´f´rentiel affecte un plus grand nombre de param`tres (par exemple le temps) qui d´crivent e
                               e         e               e               a       e       e
des objets physiques donn´s, en th´orie de la relativit´ par rapport ` la th´orie galil´enne (et ce
                      e       e    e          e       e              e
principe est ainsi r´habilit´ apr`s que l’´lectromagn´tisme a sembl´ le contredire). D’autre part, ce
                                                                          a
slogan risque de provoquer par exemple des blocages psychologiques ` l’acceptation du caract`re     e
                                                                          e
objectif et mesurable du mouvement de rotation d’un objet sur lui-mˆme (gyroscope, pendule de
Foucault. . . ).

                                                   8
                   e                 ee e                       e
     La relativit´ restreinte a ´t´ d´couverte par diff´rents chercheurs : Poincar´, Lorentz, Minkow-e
                                e e e        ee e
ski, Einstein. La relativit´ g´n´rale a ´t´ d´couverte par Einstein et Hilbert; elle englobe la relativit´               e
                                                   e                e
restreinte et la gravitation (qu’elle interpr`te comme n’´tant pas une force mais l’effet de la courbure
de l’espace-temps. . . ).
                                          e               e
     Entre les deux on peut placer l’´lectromagn´tisme, pour son niveau de complexit´ (la relativit´       e             e
 e e              e                                                 a           e        e
g´n´rale n’en d´pend pas en toute rigueur mais utilise ` peu pr`s les mˆmes outils math´matiques).           e
             e e e                                                 e                 e
La relativit´ g´n´rale cohabite naturellement avec l’´lectromagn´tisme : le champ ´lectromagn´-            e            e
                                                                        e          e
tique et le champ gravitationnel interagissent de mani`re coh´rente tout en restant des objets
distincts.
                                             e
     On peut remarquer un outil math´matique qui traverse un grand nombre de th´ories physiques :      e
                                 e
le calcul tensoriel. Pour r´sumer, ce formalisme consiste en assemblages d’op´rations g´n´rales dee           e e
                                                                       a      e
“multiplications” entre des vecteurs pouvant appartenir ` diff´rents espaces vectoriels. Il s’exprime
                  e                  e                                    u
dans toute son ´tendue en th´orie quantique des champs o` n’importe quelle expression tensorielle
             e       a                                        e
qu’on peut ´crire ` partir de certains objets (donn´s par les types de particules pr´sents) se r´alise  e           e
par le diagramme de Feynman correspondant.
                                                              e                  e
     Son absence apparente des cours habituels d’´lectromagn´tisme est en fait une maladresse :
                            e                          e                e
certains calculs (en m´canique classique et ´lectromagn´tisme) utilisent des formules vectorielles
              e
ou autres r`gles de transformations d’expressions qui semblent alors d’origine tr`s myst´rieuse           e       e
      e                  e                              e
ou n´cessitent des d´monstrations compliqu´es, mais deviendraient simples et naturelles une fois
traduites en langage tensoriel. La raison pour laquelle cette situation perdure est qu’il ne semble
                                             e                  e
pas exister actuellement dans la litt´rature une pr´sentation suffisamment claire et p´dagogique                e
                                                        a                 a
du calcul tensoriel pour qu’on puisse songer ` l’introduire ` ce niveau d’enseignement.
                            e            e            ee e             e                       e
     Historiquement, l’´lectromagn´tisme a ´t´ d´velopp´ avant la relativit´ restreinte, et actuelle-
                                   e             e                                  e
ment on enseigne encore l’´lectromagn´tisme d’abord en premi`res ann´es d’universit´, pour ene                e
  e                      a                            e                       e
d´duire qu’il oblige ` construire la relativit´ restreinte d’apr`s la loi de constance de la vitesse de
          e                                  e            e e                              e e
la lumi`re qu’il induit. Mais cette d´marche h´rit´e de l’histoire, perp´tu´e par inertie, manque
               ee                          e              e                 e              e
fortement d’´l´gance (sans relativit´, le champ ´lectromagn´tique se pr´sente sous forme de deux
                  e                                 e            e
objets, champ ´lectrique et champ magn´tique, ob´issant aux quatre ´quations de Maxwell quie
                                                               e
semblent bien peu naturelles, alors qu’une ou deux ´quations tensorielles sur un seul objet suffit en
                           e                    ee
partant de la relativit´). Il serait plus ´l´gant et efficace de commencer par la relativit´ restreinte        e
                                                                                        e       e
et le calcul tensoriel, si seulement des approches convenables de ces th´ories ´taient trouvables dans
        e
la litt´rature.
         e            e                                                     e              e
     L’´lectromagn´tisme dans le cadre relativiste s’appelle ´galement l’´lectrodynamique classique
                    a e
(par opposition ` l’´lectrodynamique quantique qui traite cette force en physique quantique). On
                             e                                        e
peut concevoir cette th´orie comme une extension de l’´lectrostatique, de la mani`re suivante.          e
                                                       e             e
     Il y a une similitude formelle entre les th´ories de l’´lectrostatique et de l’induction magn´tique           e
                                                                                  c
(dans l’espace tridimensionnel) qui se correspondent en rempla¸ant les charges de dimension z´ro                      e
          e
(densit´s) par des charges de dimension 1 (courants). Une fois cela remarqu´ en termes de calcul  e
                            e                      e        e                              e
tensoriel, il suffit de r´appliquer cette mˆme th´orie, formellement ind´pendante du choix d’une
                       e                                                          e
dimension particuli`re, au cas de l’espace-temps de la relativit´, pour obtenir l’´lectrodynamique    e
                                   e                      e
classique. Le champ magn´tique et le champ ´lectrique ne sont que les deux composantes d’un
   e              e           e                a       ee
mˆme champ d´compos´ par rapport ` un r´f´rentiel choisi.
                e         e           e          e                                          e
     Cette th´orie pr´sente l’´trange d´faut de ne pas pouvoir consid´rer les ´lectrons comme          e
                                                   e
ponctuels en toute exactitude sans cons´quences absurdes, mais seulement suivant des approx-
                        c       a e                               e
imations, en renon¸ant ` d´finir la position d’un ´lectron avec une pr´cision plus fine qu’une  e
                                              ∗                                     −15
                                                      e
distance de l’ordre du rayon classique de l’´lectron re = 2, 82.10                      m. Cependant cette taille est

  ∗
                   a                                                                  e a        e
     Comparable ` la taille du noyau atomique, c’est le double du rayon de la sph`re ` l’ext´rieur
de laquelle l’´nergie du champ ´lectrique calcul´ classiquement atteint l’´nergie de masse mc2 de
              e                  e                   e                       e
  e                        e                 e          e                                      e
l’´lectron : vu de plus pr`s que cela, si l’´lectron ´tait ponctuel, en lui soustrayant cette ´nergie
                                                                                              e
et donc cette masse qui se trouve dans le champ qui l’entoure, il lui resterait une masse n´gative,
  e                     e                            e                              e       u
d´fiant les lois de la m´canique. . . mais en fait, l’´nergie de masse du champ magn´tique dˆ au spin
     e                                       e
de l’´lectron est plus importante encore pr`s de ce rayon classique, et donnerait donc un rayon plus
grand.

                                                            9
        e        a
bien inf´rieure ` la fameuse “incertitude” de la physique quantique (dans le cadre de laquelle ce
     e         e                     e                  e    e          e
probl`me de l’´nergie du champ se r´soud mais de mani`re tr`s compliqu´e).
                                                   e
2.2. L’origine de ses paradoxes : l’intuition galil´enne
                                                   e                              e
     Vue du haut d’une tour, une voiture peut s’´loigner tant qu’elle veut, ind´finiment; elle semble
                                   a
rapetisser et ralentir au fur et ` mesure qu’elle s’approche de l’horizon, bien qu’il ne lui arrive
     e e                e      a
en r´alit´ rien de sp´cial ` son approche. Elle ne pourra jamais atteindre cet horizon si ce n’est
a                          e                                  e                      e
` cause de la rotondit´ de la terre, ni encore moins le d´passer. Ces faits n’´tonnent personne.
             e
Pourquoi s’´tonnerait-t-on alors des fait suivants qui leur sont pourtant analogues : un voyageur
          ee
peut acc´l´rer tant qu’il veut sans qu’il ne lui arrive quoi que ce soit, tandis que quelqu’un qui se
   e
pr´tendrait immobile le verrait ainsi atteindre des vitesses arbitrairement proches de celle de la
     e                                                  a
lumi`re, sans jamais l’atteindre, mais en subissant ` son approche quelques distorsions, dont un
ralentissement du temps et une contraction des longueurs dans le sens de sa vitesse (qui n’apparaˆ    ıt
              e
d’ailleurs mˆme pas visuellement comme une contraction mais comme une rotation; voir les d´tails    e
plus loin) ?
          e                               e                                 ua
     Cet ´tonnement, qui traduit une l´gitime soif de comprendre, est dˆ ` notre tendance naturelle
a                    e              a
` penser le probl`me par ce que (` moins que vous ayez une meilleure suggestion) nous appellerons
                    e
“l’intuition galil´enne”, que nous allons maintenant expliquer.
                                                            c
     Nous percevons le monde sous forme d’images re¸ues par les yeux et instantan´ment in-     e
      ee
terpr´t´es par le cerveau en images tridimensionnelles. On a ainsi une succession continue d’images,
                                            e                e                  e e
ou pour le dire autrement une image en ´volution. De mˆme dans l’activit´ th´orique, on imagine
                                        e       e                                               e
des figures ou des images qui se succ`dent ou ´voluent au cours du temps. L’intuition galil´enne est
                                                                                        ea        e
alors le fait d’utiliser cette dimension temporelle de notre imagination, cette facult´ ` faire ´voluer
                                                                    e
dans notre imagination les images au cours du temps, pour repr´senter la dimension temporelle de
                                        a
l’univers physique que l’on cherche ` concevoir.
                         e         e           e`      e          e
     Ce mode de repr´sentation ´tait adapt´ a la th´orie galil´enne, qui autorisait les interactions
           e a                                                  e e
instantan´es ` distance et dans laquelle la vitesse de la lumi`re ´tait infinie. En effet, l’image qu’un
                  c              a                            a
observateur re¸oit du monde ` un instant y correspondait ` l’image qu’un autre observateur ´loign´e    e
                             e                               a            c         a
du premier (et pouvant ˆtre en mouvement par rapport ` lui) en re¸oit aussi ` un certain instant
                e                                                 e e                e
(donc au “mˆme” instant), par une simple transformation g´om´trique (un d´placement). C’est
                                             e                       a                         a
donc une image de dimension 3 que le th´oricien peut imaginer ` un certain instant, et ` laquelle
                           e e
il peut attribuer une r´alit´ objective.
                                          e                                 e                   e
     Mais cela devient faux en relativit´, du fait que la vitesse de la lumi`re est finie et ind´passable
                                      e                           e
par l’information. L’intuition galil´enne n’est donc pas adapt´e pour concevoir cette th´orie.e
          e    e
2.3. Le pi`ge m´thodologique de son enseignement actuel
                                        e              e      e
      La plupart des cours de relativit´ restreinte, mˆme r´cents, que l’on trouve sur le march´,   e
                                        e      e           e a                     e
emploient encore plus ou moins la mˆme d´marche fid`le ` l’histoire de sa d´couverte, loin de
                       e          e   e                                                e
toute tentative de r´novation r´put´e impossible ou sans objet, tellement cette m´thode a ´t´      ee
 e ee                                            o     e                                       e e
r´p´t´e plus ou moins telle quelle depuis bientˆt un si`cle: au nom du sens des principes et r´alit´s
     e                                        e             e e        e
exp´rimentales, ils commencent par consid´rer comme r´alit´ premi`re le type d’apparences du
            c                e
monde per¸ues par les mis´rables points dans l’univers que nous sommes. S’enfermant ainsi dans
                 e                                                             e             u
l’intuition galil´enne, ils ne peuvent alors qu’entreprendre d’y faire entrer ´galement coˆte que
   u       e e
coˆte la r´alit´ de l’espace-temps physique.
                                 e e                               e
      La correspondance entre r´alit´ physique et intuition galil´enne que donne naturellement
                 e
l’observation n’´tant pas satisfaisante, ils en construisent une autre artificielle plus satisfaisante
                      e     ee            e                                   e
pour l’esprit, appel´e “r´f´rentiel galil´en”, au moyen d’un dispositif exp´rimental fictif, com-
                             e                            ee            e        e       e e
plexe et pratiquement irr´alisable. Cette notion de r´f´rentiel galil´en qui ´tait h´rit´e de la
   e          e                                    e         e        a                   e
th´orie galil´enne, sera finalement un outil math´matique ´quivalent ` la notion de rep`re orthog-
           e e                               a         e
onal en g´om´trie euclidienne (ou parfois ` la donn´e d’un seul vecteur de base de ces rep`res,  e
a                                                                  a e               e e
` savoir le vecteur temps) : notion utile mais non essentielle ` l’´tude de la g´om´trie, et ici
  e      e                                                e                  e                 e
d´tourn´e de son sens au profit d’une intuition inadapt´e. (En effet, elle d´clare instantan´s des
e e              e                   a                            e e            e      e
´v`nements ind´pendants, donnant ` “voir” en imagination un ´v`nement “pr´sent” ´loign´ dont   e
        e
la lumi`re n’arrivera que plus tard, comme si on pouvait voir venir un signal lumineux avant qu’il

                                                  10
                                                  e        ee         e       u                       e
ne nous parvienne. . . ) (Le qualificatif “galil´en” des r´f´rentiels ´tait dˆ au fait que dans la th´orie
     e                                 e           ee                  e
galil´enne on pouvait aussi consid´rer des r´f´rentiels “non-galil´ens” sans trop de complications,
                                        e            e     ee e         e                        e e
ce qui n’est plus le cas : car les syst`mes mat´riels acc´l´r´s aussi ´tudiables, qui sont sens´s d´finir
             ee                                                                               e
ces autres r´f´rentiels, sont alors de plus mauvais points de vue pour l’intuition galil´enne; un tel
                                                     e           a                    e
emploi de cet intuition correspondrait math´matiquement ` l’emploi de syst`mes de coordonn´es           e
curvilignes.)
                                                                         e        a       e    a
     Naturellement incapables d’articuler cette intuition conform´ment ` la th´orie ` concevoir,
      e                   e                 e          e    e
ils d´clarent que la th´orie ne peut ˆtre appr´hend´e que par la rigueur des formules et des
  e                                                                         e
d´monstrations, en rejetant toute inspiration intuitive. Mais en mˆme temps, au nom du sens
       e e                      a                 a                 e      ee
des r´alit´s, ils continuent ` s’accrocher ` cette intuition d´sesp´r´ment. Car les formules ne
                  a e
peuvent exister ` l’´tat pur sous peine de perdre toute signification, elles ne peuvent qu’ˆtre dese
                             e                           a    e e                   e
relations entre des param`tres qui correspondent ` la r´alit´, laquelle se d´finit comme objet de
nos sens et donc de notre intuition, oui mais lesquels et suivant quelle correspondance ? C’est ce
                                          e              e                        e a       e
choix malheureux d’un mode de repr´sentation fix´ arbitrairement, ni fid`le ` l’exp´rience dans sa
          a    e e               ea             e                         e     a                e
relation ` la r´alit´, ni adapt´ ` la compr´hension interne de la th´orie ` concevoir, qui d´termine
l’apparence des formules “fondamentales” et leur complexit´.     e
                                                                        a
     Alors, faute de pouvoir donner un sens physique intuitif ` une formule, ils la consacrent
                       e
de la force d’autorit´ que lui donne la longueur des preuves du fait qu’il ne peut exister au-
         e                                         e
cune th´orie de l’espace-temps ou de la m´canique (compatible avec certains principes formul´s            e
    e
exp´rimentalement), aussi tordue soit-elle, dans laquelle elle ne serait rigoureusement vraie. Ainsi,
                        e e                                       e           e
au nom du sens des r´alit´s physiques, ils prouvent l’unicit´ de la th´orie sans la donner ` com-   a
                                                                             a
prendre vraiment, en oubliant presque d’en justifier l’existence (c’est-`-dire la non-contradiction),
                                                                    u            e
satisfaits pour cela de constater que l’univers existe. (D’o` la prolif´ration de pseudo physi-
        e                        e            e                e                        e
ciens r´volutionnaires qui pr´tendent r´futer la relativit´ par de simples exp´riences de pens´e,       e
      e                              e                     e
la pr´sentant comme une interpr´tation absurde et m´diocre des fameuses exp´riences).   e
                                        e
2.4. Pour une nouvelle approche de la th´orie
                                   e                       e                               a
     Nous aborderons la relativit´ restreinte par une pr´sentation intuitive qui consiste ` employer,
a                                e                     e e
` la place de l’intuition galil´enne, une intuition g´om´trique purement spatiale.
                                                                    e e
     En voici le motif. Nous percevons les dimensions de la r´alit´ physique sous forme de trois
sensations : images visuelles (de dimension 2), profondeur et temps; elles fournissent naturellement
                                        e                     ıt
trois formes d’imagination pour le th´oricien. On reconnaˆ que les trois dimensions d’espace sont
                        e                         e                  e           e
physiquement de mˆme nature et en continuit´ entre elles malgr´ leur diff´rence de forme sensible
                                       e                               e
(vision et profondeur). Cette identit´ de nature et cette continuit´ apparaissent intuitives lorsque
                                              e
par une rotation de l’objet la profondeur s’´change avec une des deux dimensions visuelles. Alors,
  e e
g´n´ralisons ce raisonnement en supposant que la dimension temporelle elle aussi est physiquement
      e                                                                      e
de mˆme nature que les trois autres, et rendons ce fait intuitif en repr´sentant le temps lui aussi
                                                                  e                           e
par une dimension visuelle de l’imagination (en fait l’identit´ de nature n’est pas compl`te mais
        e                                                   e             e e
cette d´marche n’en est pas moins pertinente, et la diff´rence sera pr´cis´e plus loin).
                  e          e            a         e                    e
     On pourra ˆtre tent´ de reprocher ` cette m´thode l’absence de d´marche rigoureuse fond´e sur e
    e e         e       e                                                  e
la r´alit´ (les ´nonc´s de principes physiques issus de constatations exp´rimentales) pour construire
                   e
et prouver la th´orie (ou pour le dire plus clairement, le fait qu’elle ne se fonde pas sur l’intuition
     e                                                                                             e
galil´enne). Mais son objectif est de donner une claire vision des choses sans s’embarrasser au d´part
                              e                 e                 e
de leurs apparences exp´rimentales. La coh´rence et les cons´quences de cette vision montreront
                            e
naturellement qu’elle d´crit un monde possible compatible avec les fameux principes physiques.
                  e       e                                                          a
Les lecteurs int´ress´s par la preuve qu’il n’y a pas d’autre monde possible, ` part la relativit´    e
                      e         e                      e a    ee
restreinte et la th´orie galil´enne, sont donc invit´s ` se r´f´rer pour cela aux cours traditionnels
                                                           e e e       e
sur ce sujet. (Remarquons en passant que la relativit´ g´n´rale d´crit justement un autre monde
                        e e
plus proche de la v´rit´. . . )
                                            e                                  e
     On pourra aussi lui reprocher de n’ˆtre pas plus simple, voire d’ˆtre plus difficile ` com-   a
                     e                      ea                   e a               e     e
prendre que la m´thode traditionnelle. D´j`, les gens habitu´s ` cette derni`re, ou mˆme ceux qui
                  ea
ayant commenc´ ` l’apprendre voudraient qu’on la leur explique mieux, risquent de mal accepter de
                          a e                           e                              e       e
reprendre les choses ` z´ro en changeant ainsi compl`tement d’approche. Mais peut-ˆtre mˆme cer-
                            e                         e
tains, suivant leur mani`re de penser, pouvaient r´ellement mieux s’y retrouver. En effet, elle avait

                                                    11
                                                               e          e                 e
en quelque sorte l’avantage de permettre de formuler la th´orie et r´soudre des probl`mes sans faire
                                                                                 e           e
vraiment le travail de la comprendre et de rentrer dedans : “il suffit” d’´crire les d´monstrations
                                                                                         a
et d’appliquer les formules. Cependant, cet avantage qu’on peut trouver jusqu’` la formulation
          e                                                                     a          e
de la th´orie risque de se transformer en handicap ensuite, lorsque face ` un probl`me concret on
se perd devant ces formules qu’on ne sait pas toujours comment appliquer ou manipuler, ou dont
               e
l’utilisation n´cessite des pages de calcul.
                           e        e                                          e
     Enfin, on pourrait ˆtre tent´ de penser qu’elle ne serait pas compl`te, omettant les formules
          e   e e       e          a    e                             e
consacr´es r´put´es n´cessaires ` la r´solution exacte des probl`mes pratiques (en confondant sou-
               e                            e                                    ee              e
vent le caract`re “pratique” d’un probl`me avec l’emploi arbitraire des r´f´rentiels galil´ens ainsi
                                                            e
que du vocabulaire et des formes d’imagination associ´s dans sa formulation). Mais finalement, il
             e               e                                    e                      e
n’est pas n´cessaire de d´velopper tellement de formules sp´cifiques comme si c’´tait une th´orie      e
             e      e a                                                                            e
totalement ´trang`re ` nos connaissances courantes, car la partie essentielle de la relativit´ est une
  e e                  e             a     e e
g´om´trie au fond tr`s similaire ` la g´om´trie euclidienne (comme on l’expliquera plus loin) : il
                                    a                       e
suffit donc, en vue de faire face ` la plupart des probl`mes, de reprendre les divers outils d’´tude   e
         e e                         e                                                e
de la g´om´trie euclidienne, port´s par l’intuition qui les accompagne, et de pr´ciser comment ils
             e                     e e
sont modifi´s dans la nouvelle g´om´trie.
                                                 e                        a                       e
     Et pourtant, le point de vue que la pr´sentation qui suit vise ` exprimer n’est pas r´ellement
                        e                      e                  e
nouveau, comme en t´moignent maints d´veloppements ult´rieurs de la physique th´orique ayant  e
                               e                         e
suivi historiquement la d´couverte de la relativit´. On observe en effet que les lourdes for-
                                                               e
mules (“transformation de Lorentz” et ce qui s’ensuit) pr´tendument constitutives de la relativit´,       e
                                                                                                e e e
tout en restant vraies, n’apparaissent plus telles quelles dans les chapitres de relativit´ g´n´rale,
e                                            e          e                   e
´lectrodynamique classique ou autres th´ories fond´es sur la relativit´ restreinte. A leur place, in-
                                    e                                            e
tervient un simple objet (une “m´trique” dite “pseudo-euclidienne”!) qui t´moigne de l’assimilation
 e                         e e
r´elle de cette nature g´om´trique de l’espace-temps dans l’esprit des physiciens. C’est pour eux
                                                                    e        e
si naturel qu’il est inutile se s’attarder sur ce fait, le plus int´ressant ´tant d’aller de l’avant dans
                                                      e                                          e
son utilisation. Donc, l’approche qui sera propos´e ici serait nouvelle non pas en elle-mˆme, mais
                           a
seulement relativement ` l’univers habituel de l’enseignement universitaire.
                                         e
     Alors, pourquoi donc une telle r´novation de son enseignement ne s’est-elle jamais produite
                                                             e                                    e
depuis que tant de physiciens l’ont si bien acquise ? La r´ponse est simple, mais seulement ´trang`re   e
` notre monde habitu´ ` juger les connaissances des ´l`ves et ´tudiants d’apr`s leur capacit´ `
a                         e a                                ee         e              e                e a
 e             e                                   e
r´diger des d´monstrations dans les formes r`glementaires : c’est qu’un abˆ               e
                                                                                    ıme s´pare parfois la
                                                                        ea
claire assimilation personnelle d’une connaissance, de la capacit´ ` trouver les mots justes pour la
traduire en une forme verbale claire et transmissible.

                             e                         e
               3. Nouvelle pr´sentation de la relativit´ restreinte
           e           e
3.1. Le sch´ma de la th´orie
                             e e                  c
     En vertu de ce qui pr´c`de, la meilleure fa¸on de comprendre l’espace-temps est de com-
                      a
mencer par renoncer ` la tentative de le comprendre en tant que tel, en sorte de pouvoir assimiler
tranquillement les notions qui le constituent comme si cela n’avait aucun rapport, pour ne pas
 e               e       e                    e                                                 e
d´pendre d’arri`re-pens´es qui risqueraient d’ˆtre contre-productives,. Le fait que la relativit´ re-
                         e              e        a
streinte a le titre de th´orie physique ´quivaut ` dire que le monde imaginaire que nous allons
               e                       e              a
maintenant pr´senter correspond math´matiquement ` l’espace-temps de notre univers dans le do-
                                 ee
maine d’approximation consid´r´. Mais ce fait n’a pour le moment aucune importance dans la
          u                   a         e                 e         e               a
mesure o` il n’apporte rien ` la compr´hension de la th´orie elle-mˆme. Il suffira ` la fin, quand
tout sera clairement compris, de remarquer simplement : “Et pourquoi pas ?”.
                                                        e
     Passons donc au contenu conceptuel de la relativit´.
     Voici:

                                 u                  e                      e
             Imaginons un monde o` toutes choses mat´rielles sont fixes, en ´quilibre.

                                                            u
     Pouvez-vous imaginer cela ? Vous allez dire : bien sˆr, c’est trop facile, ce genre de situation
                                 e                                                            e
est un cas particulier de l’exp´rience de la vie de tous les jours, laquelle est plus compliqu´e. Mais
            e                 e        e                                     e
la relativit´ restreinte doit ˆtre forc´ment quelque chose de plus compliqu´ encore, sinon on l’aurait
comprise depuis longtemps, non ?

                                                    12
     Certes, il n’est pas exactement suffisant d’imaginer un monde immobile, mais math´mati-       e
                 e                                                 e
quement la diff´rence est accessoire. L’essentiel de la complexit´ des choses se trouve contenu dans
                           e
ce type particulier d’exp´rience quotidienne.
               e                  e
     Cette exp´rience n’est math´matiquement pas une chose triviale du tout. En effet, pour d´criree
                       e                 e                                                 e e
la disposition des diff´rents objets en ´quilibre, il faut faire appel au langage de la g´om´trie. Or
    e e                                       e           e
la g´om´trie euclidienne est en fait une th´orie math´matiquement complexe, qu’on ne pourrait
                                    e
pas facilement expliquer de mani`re simple et purement logique sans s’appuyer sur l’exp´rience  e
                         a                                e                 e
visuelle (par exemple ` un aveugle qui n’aurait au d´part aucune exp´rience de l’espace, s’il en
               e                      e
existe). De mˆme pour la notion d’´quilibre. Mais nous avons de la chance, ces deux choses nous
            e                   a
sont famili`res. Il ne reste qu’` y ajouter les trois points suivants, qui peuvent s’introduire chacun
   e                                     a e                                       e
ind´pendamment des autres, ainsi qu’` pr´ciser certaines interactions particuli`res qu’il y a entre
eux.
                              e e       a
     – Le rapport de cette g´om´trie ` la perception spatio-temporelle que nous en donne l’exp´-     e
rience.
                             e e                                                        e     e a
     – Le changement de g´om´trie: l’espace dans lequel les choses sont ainsi dispos´es ob´it ` une
 e e           e                                  e                     e
g´om´trie diff´rente de celle qui nous est famili`re; il faut donc la d´finir.
                           e                 e              e                     ee      e
     – L’expression math´matique de la m´canique de l’´quilibre et les propri´t´s m´caniques des
particules.

                  e             e e                                          e e          e
      Cette diff´rence de g´om´trie est faible en soi, la nouvelle g´om´trie n’´tant pas partic-
    e                          e                e e
uli`rement plus compliqu´e que la g´om´trie euclidienne, mais nous sommes tellement marqu´s                e
                                          e
par notre habitude que cette diff´rence peut nous sembler extraordinaire et insurmontable.
               e e                             e        e e                  e
      Plus pr´cis´ment, il y a deux diff´rences de g´om´trie. La premi`re est la dimension: elle vaut
                                              e                                     e
4, alors que nous ne sommes habitu´s qu’aux dimensions 2 et 3. La deuxi`me est qu’il ne s’agit
       a          e e                                          e e
pas l` de la g´om´trie euclidienne de dimension 4 qui g´n´ralise automatiquement celles du plan
                                                      e e                              e
et de l’espace usuels. Mais c’est une autre g´om´trie qui a de fortes parent´s avec la g´om´trie   e e
                                    e
euclidienne, et quelques diff´rences. Suivant un certain usage, nous l’appellerons la g´om´trie     e e
pseudo-euclidienne. Comme la g´om´trie euclidienne, elle existe en dimension quelconque n ≥ 2.
                                          e e
                                   e                                       e
      Il y a environ trois mani`res possibles de l’introduire. La premi`re serait de partir de principes
                                                          e
physiques dont l’invariance de la vitesse de la lumi`re. Elle masque son analogie profonde avec la
 e e                                    e                                e           e        o
g´om´trie euclidienne, en privil´giant les structures qui lui sont sp´cifiques, li´es au cˆne de lumi`re   e
(que nous verrons en dernier).
                   e     e                       a                                e
      Une deuxi`me m´thode consiste ` en donner une construction math´matique ` partir de la   a
 e e                         e                  a                   e e
g´om´trie affine, de mani`re analogue ` la construction de la g´om´trie euclidienne (le moyen le plus
             e
commode ´tant probablement l’introduction d’un produit scalaire sur l’espace vectoriel associ´).        e
                                  e         e
      Comme ces deux premi`res m´thodes se trouvent facilement par ailleurs, ce que nous pr´sen-       e
                            e          e
terons ici sera une troisi`me m´thode (non qu’elle soit meilleure dans l’absolu mais qu’elle a aussi
des avantages qui lui sont propres), qui consiste en une sorte de transformation “magique” (non
                                                     e e                       e e
rigoureuse) qui fait la correspondance entre g´om´trie euclidienne et g´om´trie pseudo-euclidienne.
                                   e                                               e
Son avantage est qu’elle ne n´cessite pas de remonter aux fondements math´matiques de la g´om´-       e e
                                      e
trie, mais qu’elle permet de r´utiliser les connaissances na¨                   e          e e
                                                                  ıves et les m´thodes g´n´rales dont on
                e e
dispose en g´om´trie euclidienne, en appliquant finalement une simple traduction des r´sultats       e
                                                 e e
pour obtenir ceux correspondants en g´om´trie pseudo-euclidienne. Elle a donc l’avantage de nous
                                                                e e                          e
permettre de transporter directement dans la nouvelle g´om´trie des intuitions tr`s diverses que
                     e                e                          e e                            e
nous avons pu h´riter de l’exp´rience en rapport avec la g´om´trie euclidienne sans n´cessiter leur
                       e
reconstruction math´matique, avantage dont nous ne nous priverons pas par la suite.
                e                             e
      Cette m´thode s’exprime math´matiquement par la notion de prolongement analytique: on
  e                                             e e
d´montre des formules ou relations g´om´triques pour les valeurs positives d’une variable, avant
                                 e          a           e
d’appliquer finalement le r´sultat ` une valeur n´gative. Dans cette correspondance, les ´galit´s    e      e
         e e            e      e
sont g´n´ralement pr´serv´es, mais non les in´galit´s.e   e
                                                                     e e
      Nous nous contenterons de l’introduire en dimension 2 (g´om´trie du plan pseudo-euclidien),
                                                               e e                       a e
car il est plus facile d’y exercer l’intuition visuelle de la g´om´trie, et cela suffit ` r´aliser l’essentiel
                    e                              e         a    e e
du travail de pr´sentation des nouveaut´s par rapport ` la g´om´trie euclidienne. Ensuite, passer `         a
la dimension 3 ou 4 serait un exercice d’intuition difficile mais secondairement utile, car d’un point

                                                     13
                        e e                                                               e
de vue abstrait cette g´n´ralisation est quasi automatique et ne comporte que peu de ph´nom`nes e
nouveaux (qu’on abordera par la suite; mais on n’a pas souvent besoin en pratique de tenir compte
                                  e
de toutes les dimensions en mˆme temps).
                            e                a     e               e
     Les deux autres probl`mes, le rapport ` l’exp´rience et la m´canique, s’appuient sur les struc-
        e e                                  e                    e e
tures g´om´triques de l’espace, donc ils d´pendent de cette g´om´trie. Cependant, ils peuvent
                     e          e                                          e e
s’exprimer de la mˆme mani`re avec n’importe laquelle de toutes ces g´om´tries (euclidienne ou
                                                   a                    e e
pseudo-euclidienne, de dimension quelconque), grˆce au fait que ces g´om´tries ont toutes en com-
           e                               e                                       ee
mun le mˆme langage fondamental (la mˆme liste de structures; seules les propri´t´s de certaines
                      e                e
de ces structures pr´sentent des diff´rences).
                                                                  e e
     Nous les exprimerons donc en invoquant les structures g´om´triques suivant le langage de
    e e                                                       e
la g´om´trie euclidienne. Et il sera permis de les interpr´ter effectivement dans le cadre de la
 e e                                                        e
g´om´trie euclidienne, autrement dit celui de notre exp´rience quotidienne d’objets fixes, pour
bien en comprendre la nature.
                                         e                             e                   e
     Le fait que l’expression de la m´canique relativiste soit la mˆme que celle de l’´quilibre
                              e                                 e                   u          e
s’explique simplement : l’´quilibre est la situation de la m´canique relativiste o` les syst`mes
    e                               e
mat´riels ne subissent aucune ´volution dans une certaine direction temporelle; alors, tout peut
                                                                                           e
encore se produire dans les trois dimensions restantes suivant les lois normales de la m´canique
             a             e          e                                       e e
relativiste, ` la seule diff´rence pr`s que la dimension temporelle (plus pr´cis´ment la direction
                                                       e                      e            e
temporelle en question) n’intervient plus. La loi de l’´quilibre est donc la mˆme que la m´canique
                                                           e
relativiste avec une dimension de moins, ce qu’il fallait d´montrer.

          a      e
3.2. Lien ` l’exp´rience
                                          e ea                 e
     La question du rapport de cette r´alit´ ` notre exp´rience de l’espace et du temps, est la seule
                              e                              e
question facile, qui ne n´cessite pas de travail math´matique important; elle n’apporte aucune
                                                     e
information sur les lois de la physique elles-mˆmes. La question est celle-ci: de quelle mani`re    e
                                             u
visitons-nous ce monde de dimension 4 o` les choses sont fixes, en sorte qu’il nous apparaisse sous
                                        u              e
forme d’un monde de dimension 3 o` les choses ´voluent ?
     En g´n´ral, cette question s’applique ` la visite d’un monde de dimension n ≥ 2 o` les choses
          e e                                  a                                           u
sont fixes (et pour lesquelles le temps n’existe donc pas), le laissant percevoir sous la forme d’un
monde de dimension n − 1 o` les choses ´voluent.
                                u            e
                                                                             e
     Dans cette histoire, le temps au cours duquel les choses paraissent ´voluer n’est pas un temps
                                                   e       e     e e
objectif, mais il n’a de sens que subjectif, ´tant v´cu s´par´ment pour chaque observateur, et
                                         e                                                  e
n’ayant donc pas d’autres relations n´cessaires a priori avec celui des autres que celles s’´tablissant
              e                      e
par l’interm´diaire des choses mat´rielles qui sont fixes.
                             ea      e     e                             e e
     En fait, nous avons d´j` effleur´ la r´ponse en introduisant la g´om´trie euclidienne : physique-
                                                                           e
ment, chaque observateur (ou son corps ou son vaisseau spatial ou mˆme la Terre si on veut, vu
                                               e                                     e
qu’ici la taille de la Terre est finalement n´gligeable car elle vaut moins d’un dixi`me de seconde-
     e                       a             e                                     e
lumi`re), est semblable ` un fil dispos´ dans l’espace en une courbe appel´e sa ligne d’univers.
     e                                                               o
L’id´e est que ce fil en tant qu’espace de dimension 1 joue le rˆle de ligne du temps personnel de
                                                 a
l’observateur. Ainsi, au cours de son temps ` lui, il visite le monde en parcourant sa ligne d’univers
a                                                                 e a
` vitesse constante, comme un train suivrait une voie ferr´e ` vitesse constante ou comme une
impulsion lumineuse suit une fibre optique. On postule que cette vitesse de parcours est une con-
                         e                               e
stante universelle not´e v; on peut lui donner num´riquement la valeur qu’on veut puisque le temps
e                          e
´tant ainsi une quantit´ subjective et non physique (les objets physiques ne peuvent pas le mesurer
                                       e                               e
puisqu’ils sont fixes), on ne peut d´finir physiquement son unit´ qu’en termes de la longueur de
                     a
courbe parcourue ` cette vitesse.
     Un observateur peut, de sa ligne d’univers, observer la ligne d’univers d’un autre observa-
                                       e                                         e
teur, non l’autre observateur lui-mˆme (car seule la ligne d’univers est mat´rielle). La sensation
       ee             e                                             e          e
d’acc´l´ration est d´finie par la courbure de cette ligne de la mˆme mani`re que la force centrifuge
                              a                          e
dans une voiture roulant ` vitesse constante est d´finie par la courbure de la route ou de mani`re   e
e
´quivalente par la position du volant.
                                                     a
     Une horloge est physiquement semblable ` un observateur: c’est aussi un fil dispos´ dans    e
                        e e     e
l’espace, mais gradu´ r´guli`rement. Donc si la ligne d’univers d’un observateur est superpos´e      e

                                                  14
a
` celle d’une horloge (il garde l’horloge avec lui), il voit au cours de son temps personnel les
                          e     a            e
graduations de l’horloge d´filer ` un rythme r´gulier, comme une bonne horloge doit se comporter.
                                      e                     e e                    e
     Les paradoxes de la relativit´ viennent des effets g´om´triques qui se pr´sentent dans leur
          e              e                 e e
complexit´ mais coup´s de l’intuition g´om´trique explicative.
                 e               e        e                                                        e
     On peut v´rifier que la th´orie galil´enne de l’espace-temps s’obtient comme limite de ce mod`le
                                                                                          a      e
lorsque la vitesse de parcours v des lignes d’univers tend vers l’infini; et par rapport ` la th´orie
     e             e          e
galil´enne, le pr´sent mod`le apporte des corrections dont le premier terme a une amplitude de
l’ordre de v −2 . Or, le travail de changement de g´om´trie que nous ferons plus loin peut se r´sumer
                                                   e e                                         e
                       e                                e          e                      a
(si on oublie les exp´riences faisant intervenir la lumi`re elle-mˆme, qui ne correspond ` rien dans
ce mod`le euclidien) au fait de donner ` ce v −2 une valeur n´gative, suivant la formule
        e                                  a                     e

                                              v 2 = −c2 .

                                       e a                                     e              a
Donc les effets relativistes (exprim´s ` l’aide de c) sont finalement invers´s par rapport ` ceux
                                                                                 e
qu’on obtiendrait normalement dans la situation telle que nous venons de la d´crire dans le cas de
    e e
la g´om´trie euclidienne.
                   e e
     Les effets g´om´triques suivants, exactement inverses des effets relativistes correspondants,
ne seraient-ils pas paradoxaux d’un point vue purement logique en l’absence de support visuel
explicatif :
                                                              a                  e e
     – Quand on voit au loin un camion avancer de gauche ` droite, pourquoi r´tr´cit-il subitement
lorsque son chemin se tourne vers nous ou vers le lointain (dilatation relativiste du temps) ?
                                             e                e      e                        a
     – Pourquoi ses deux roues avant qui ´taient superpos´es se s´parent-elles par rapport ` nous
          e                 e e
(relativit´ de la simultan´it´) ?
                                                e                             a
     – Pourquoi cela prend-il des temps diff´rents pour aller d’un point ` un autre suivant des
               e                                         a      e
chemins diff´rents, alors qu’on y va dans tous les cas ` la mˆme vitesse (paradoxe des jumeaux) ?
                    e
     – Enfin, en d´finissant la grosseur d’un saucisson par la largeur de ses rondelles, comment se
                                                      e
fait-il qu’il est plus gros lorsque son axe est inclin´ par rapport au plan de coupe que lorsqu’il lui
est orthogonal (contraction relativiste des longueurs) ?
         a
     Voil`, l’essentiel est dit. Ajoutons quelques remarques.
          ee               e               e
     Un r´f´rentiel galil´en est la donn´e d’une direction temporelle (i.e. qu’on peut parcourir
                              e e                                  e
comme temps, ce qui en g´om´trie pseudo-euclidienne ne peut pas ˆtre une direction “spatiale”)
      e
pour ˆtre la direction de droite d’univers d’un observateur ou des observateurs choisi(s) comme
 ee
r´f´rence.
                                e                             e
Vocabulaire. Par commodit´ pour la suite de cet expos´, nous emploierons le qualificatif de
    e                 e                                   e            e e
“th´orique” comme d´signant l’emploi du mode de repr´sentation g´om´trique de l’espace-temps,
 u                                                                                 e e      e
o` les choses apparaissent fixes (pouvant se comprendre d’abord comme si la g´om´trie ´tait eu-
clidienne, puis en tenant compte de sa forme pseudo-euclidienne). A cela s’opposera le qualificatif
       e                  e                          e                        e
d’“exp´rimental” pour d´signer la description donn´e par les apparences exp´rimentales ordinaires
        e              e               a                                                    e
de fixit´ ou de non fixit´ dans l’espace ` 3 dimensions que peuvent prendre les objets de la m´canique
                        a     ee              e        e                   e
relativiste par rapport ` un r´f´rentiel donn´ (la fixit´ qualifiant les syst`mes invariants par trans-
                              ee
lation temporelle suivant le r´f´rentiel).
                              e      e                   e        e            e
     Cet usage quelque peu d´tourn´ des termes oppos´s de “th´orie” et “exp´rience” ne devrait
      e    a
pas prˆter ` confusion puisque leur usage normal auquel il fait concurrence n’apparaˆ  ıtra pas dans
          e u              e
cet expos´ (o` tout est th´orique au sens usuel).
                              e                     e    e     e                              e e
     Par exemple, la notion th´orique de point est d´sign´e exp´rimentalement par le terme d’´v`ne-
            a                                                  ıt   a              e
ment, c’est-`-dire un point qui pour un observateur n’apparaˆ qu’` un instant pr´cis.
                                                                                 e
Remarque 1. A la description ci-dessus il faut ajouter deux informations n´cessitant l’usage de
           e        a     e e
notions sp´cifiques ` la g´om´trie pseudo-euclidienne.
              e                                                      e               e
     La premi`re information est la condition pour qu’une courbe th´orique puisse ˆtre le lieu d’une
                                                                          e e
ligne d’univers (d’un observateur ou d’une particule). En effet, en g´om´trie euclidienne toute
                e                                                  e
courbe pouvait ˆtre le lieu de disposition d’un fil (qui permet de d´finir l’abscisse curviligne), ce qui
                    e e                                                              e
n’est plus vrai en g´om´trie pseudo-euclidienne. Notamment, une courbe referm´e sur elle-mˆme      e

                                                  15
                                                                                              e e
n’est pas une ligne d’univers possible, de sorte qu’on ne puisse pas remonter le temps. Pr´cis´ment,
la succession des points d’une ligne d’univers doit respecter l’ordre temporel (ou ordre de causalit´):e
                                                                                                e
c’est une relation d’ordre partiel qui se conserve par le groupe des rotations-translations th´oriques.
       e                                                                            e e
Il est ´vident qu’une telle relation d’ordre ne peut pas exister dans le cas de la g´om´trie euclidienne,
                 e                  e
puisque la sym´trie centrale y ´tant une rotation de pi radians la renverserait. Mais la sym´trie    e
centrale du plan pseudo-euclidien n’est pas une rotation.
               e                    e
     La deuxi`me chose est de d´finir ce que l’observateur observe effectivement : l’image observ´e       e
         e e                                 e             e                 a
en un ´v`nement d’observation, est donn´e par la lumi`re, qui arrive “` la vitesse de la lumi`re”,  e
                                e e                        o                   e e
donc issue d’un ensemble d’´v`nements formant un cˆne de sommet l’´v`nement d’observation,
       e     o          e         e          e                            ee e e
appel´ le cˆne de lumi`re pass´e. Nous d´crirons plus loin ses propri´t´s g´om´triques.
                     e
Remarque 2. Un d´faut superficiel de cette vision est qu’elle semble porter une conception fatal-
                                  e                         a               e
iste du monde (philosophie d’apr`s laquelle toutes choses ` venir seraient ´crites avant qu’elles ne se
                                                 e                            a                      e
produisent), ainsi qu’une distinction entre mati`re et esprit. Mais ce n’est l` qu’une impression li´e
` l’usage d’une forme d’intuition particuli`re choisie pour ses avantages pratiques de compr´hension
a                                          e                                                 e
                                                  e
de l’espace physique, et qui n’exprime aucun v´ritable argument en faveur de l’une ou l’autre de
ces philosophies.

            e    e         e  e
3.3. Etude d´form´e de la g´om´trie euclidienne plane
                    e               e e                           e a
     Nous allons pr´senter ici la g´om´trie euclidienne exprim´e ` travers des modes de repr´sen- e
         e     e                           e                e
tation d´form´s. Puis les moyens ici n´cessaires pour g´rer une telle approche nous permettront
                            a     e e
“magiquement” de passer ` la g´om´trie pseudo-euclidienne.
             e                                  e e
     Cette d´formation s’applique, de mani`re ´quivalente, aux deux modes de repr´sentation  e
                  e e                                                           e
habituels de la g´om´trie: les dessins (dans le plan habituel), et les syst`mes de coordonn´es.     e
                    e                   e                  ee               e e
Les dessins ne repr´senteront pas fid`lement les propri´t´s des figures g´om´triques que l’on veut
e                        a     e e                 ıtront ´cras´es dans une certaine direction, comme
´tudier, car par rapport ` la r´alit´, elles apparaˆ      e    e
                                                 e     e
lorsqu’on les voit de biais, d’un point de vue ´loign´. On ne peut alors se fier aux apparences du
                                                 e e
dessin qu’en ce qui concerne les notions de g´om´trie affine du plan. Les autres notions doivent
e                               e                  a
ˆtre reconstruites, d’une mani`re non conforme ` ce qui se voit sur le dessin.
Les cercles
    Un cercle a sur le dessin l’aspect d’une ellipse, avec un grand axe et un petit axe, qui sont des
                                      e e
droites orthogonales (aussi bien en r´alit´ que sur le dessin; leurs directions sont la seule paire de
                             ee                                                   e
directions ayant cette propri´t´). La direction du petit axe et le rapport mesur´ sur le dessin

                                           longueur du petit axe
                                     k=
                                          longueur du grand axe
 e                                  e                                  e
d´pendent du point de vue employ´ pour faire le dessin, mais ne d´pendent pas du cercle.
                 a                                                                                e
    Remarque: ` partir d’une ellipse quelconque dans un dessin, on peut supposer qu’elle repr´sente
                                                         o                                     e
un cercle. Puis, ayant choisi une ellipse pour jouer le rˆle de cercle, les autres cercles se d´finissent
        e                           a                                e
comme ´tant les ellipses obtenues ` partir de celle-ci par homoth´ties et translations.
        e
Les rep`res orthogonaux
                                                         e                 e               e
     Nous allons utiliser ces axes pour former un syst`me de coordonn´es, orthonorm´ sur le dessin
          a               e e                                                   e
(en effet, ` l’aide de la g´om´trie euclidienne du dessin on peut copier l’unit´ de longueur apparente
                                                           e e                  e              e
d’un axe sur l’autre), mais seulement orthogonal en r´alit´. Les coordonn´es seront not´es (t, x),
  u                    e                                                                 e
o` l’axe du temps (d’´quation x = 0) est le petit axe de l’ellipse, et l’axe d’espace (d’´quation t = 0)
                                            e
est le grand axe. Notons (O, t, x) ce rep`re. Les vecteurs t et x semblent tous deux de norme 1 sur
le dessin, mais en fait ||x|| = k||t|| = 1.
                                                                                       e
     Cet emploi purement artificiel du vocabulaire d’espace et de temps pour d´signer les coor-
      e                        e                                                             a
donn´es est seulement motiv´ ici par le fait qu’un point parcourant l’“axe du temps” ` la vitesse v
                              e       a                                            e
aura une vitesse apparente ´gale ` 1 sur le dessin, en sorte que la “coordonn´e de temps” sur cet
axe s’identifie au temps de ce parcours. On aura donc v = k −1 .
               a                    e                           e
     Ensuite, ` partir d’un tel rep`re principal, les autres rep`res qu’on se permettra d’utiliser seront
                 e                                    e
ceux qui sont r´ellement orthogonaux et ont les mˆmes valeurs des normes des vecteurs de base (et

                                                   16
         e                                                                                   e
donc la mˆme valeur de k) sans tenir compte des apparences du dessin, autrement dit des rep`res
                                a                e                e
obtenus par de vraies rotations ` partir d’un rep`re orthogonal fix´ construit comme ci-dessus.



                                                  1
                          43
                            2                                                     4 3
                             1                        k²                              2
                                                  0                                   x1

                                     4                                    t                     4
                                                                                           3
                                 3                                            1     2
                      1     2
                      e     e    e
              Figure r´elle ´tudi´e                                           e
                                                                 Dessin utilis´ (agrandi ici)

Les distances
    Il ne sera pas question de mentionner les distances apparentes sur le dessin, car elles n’ont pas
                            e ee        e                     e                                e
de rapport naturel avec la r´alit´ ´tudi´e. Nous allons consid´rer les mesures des distances r´elles,
                       e                                                 e
mais suivant deux unit´s de longueur possibles, qui sont les longueurs r´elles des deux vecteurs de
                     e e              e                           e
base principaux. Pr´cis´ment, l’unit´ d’espace vaut k fois l’unit´ de temps. Ainsi, la mesure en
    e                                                    e                 e
unit´ de temps de la norme d’un vecteur u de coordonn´es (t, x) est donn´e par

                                                                          x2
                                     ||u||t =   t2 + k 2 x2 =      t2 +
                                                                          v2

et est la longueur apparente sur le dessin du vecteur obtenu par une vraie rotation de u pour
                                       e                             e                  e
l’amener sur l’axe du temps, et de mani`re analogue sa mesure en unit´ d’espace est donn´e par

                                     ||u||x = k −1 ||u||t =     v 2 t2 + x2 .

      `                      e                      e            e
     A chacune de ces unit´s correspond de la mˆme mani`re une mesure du produit scalaire :
                2          2
u · u = tt + k xx ou v tt + xx .
                        e                                                                e      e
     Ainsi, k sera trait´ comme un nombre fixe. Cependant, sans le traiter d’une mani`re diff´rente,
et puisque sa valeur effective n’intervient pas dans les calculs formels, on peut plus judicieusement
          e            e                      e                      e                    e
l’interpr´ter comme ´tant non un nombre r´el mais une quantit´ dans le cas d’une ´tude en co-
        e                         e                                             ee
ordonn´es : les mesures en unit´s de temps et d’espace sont alors interpr´t´es non comme des
            e                   e     e
nombres r´els mais des quantit´s ind´pendantes (des temps et des longueurs), et la quantit´ v oue
son inverse k est alors la constante universelle qui fait le lien physique naturel entre les deux.
Les angles
                       e                                                       a
     Les angles sont d´finis par le rapport de la longueur d’un arc de cercle ` la mesure du rayon.
                                              e                                            e
Or, pour cela on mesurera le rayon en unit´ de temps, et la longueur de l’arc en unit´ d’espace.
       e              e            e     a
L’unit´ d’angle utilis´e sera donc ´gale ` k radians. Les fonctions cos et sin utilisant comme il se
                                                                           e
doit la mesure des angles en radians, la rotation d’un angle α exprim´ dans cette nouvelle unit´     e
enverra donc le vecteur temps t = (1, 0) sur le vecteur de composantes (cos(kα), k −1 sin(kα)), et le
vecteur espace x = (0, 1) sur (−k sin(kα), cos(kα)).
                                            e                                         e
     On remarque que tant qu’on ne s’int´resse jamais aux intersections d’un mˆme cercle avec
                         e
les deux axes d’un rep`re, ni aux rotations d’un angle droit, le coefficient k et les fonctions
          e                                     e      e
trigonom´triques n’apparaissent pas de mani`re ind´pendante, mais on peut toujours regrouper
leurs apparitions en blocs de cos(kα), k −1 sin(kα) et k 2 . (Ou plus g´n´ralement, les fonctions de k
                                                                       e e
qui interviennent sont des fonctions analytiques de k 2 ). Nous exclurons dans la suite toute notion
 e e
g´om´trique dans laquelle ils n’apparaissent pas ainsi group´s.e

             a     e  e
3.4. Passage ` la g´om´trie pseudo-euclidienne

                                                      17
                      e       e     e         e e                  a              e e
    Pour passer de l’´tude d´form´e de la g´om´trie euclidienne ` celle de la g´om´trie pseudo-
euclidienne (dont toute r´pr´sentation est n´cessairement d´form´e), il suffit de supposer k 2 n´gatif.
                         e e                e              e     e                            e
   e e            e e                             u
Pr´cis´ment, la g´om´trie pseudo-euclidienne, o` la correspondance naturelle entre les mesures
                                  e                            e                a
d’espace et de temps est exprim´e par la vitesse de la lumi`re c, s’obtient ` partir du mod`le   e
  e e
pr´c´dent par la formule
                                        v 2 = −c2 (= k −2 )
   u          e
d’o` on peut d´duire que
                                                    α       α
                                      cos(kα) = cos( ) = ch( )
                                                    v       c
                                   −1                 α        α
                                  k sin(kα) = v sin( ) = c sh( )
                                                      v        c
 u                                                                      e
o` les fonctions cosinus hyperbolique ch et sinus hyperbolique sh sont d´finies par

                                        eu + e−u                   eu − e−u
                               ch u =            ,        sh u =            .
                                            2                          2
                                      e                                   e             e     e
(Ces expressions peuvent aussi se d´duire des calculs suivant les rep`res de lumi`re pr´sent´s pluse
loin).
            e    e      e                   e e                                 e e
     Les in´galit´s qui ´taient vraies en g´om´trie euclidienne ne le sont g´n´ralement plus ici. En
                                           a                     e
particulier, le produit scalaire continue ` exister mais le carr´ scalaire n’est plus toujours positif.
                               e e                                                    e
     Contrairement au cas pr´c´dent, pour mesurer la norme d’un vecteur donn´ u(t, x) on ne peut
                                         e                                                   e
plus choisir arbitrairement entre l’unit´ de temps et celle d’espace, mais ce choix est d´termin´ pare
                           a                              e                                     e
le genre du vecteur, c’est-`-dire par le signe de son carr´ scalaire, disons ici (celui en unit´ de temps
au carr´) t2 − c−2 x2 : s’il est positif, le vecteur u est du genre temps et ||u|| peut seulement se
        e
mesurer en unit´ de temps; s’il est n´gatif, u est du genre espace et ||u|| peut seulement se mesurer
                 e                     e
        e
en unit´ d’espace; s’il est nul bien que u = 0, u est un vecteur isotrope ou vecteur de lumi`re (sae
direction est une direction possible d’un photon dans l’espace-temps) et ||u|| = 0.
     En fixant l’origine du plan (ou mieux en regardant l’ensemble des vecteurs, ensemble qui forme
                               e                          e
un plan), les vecteurs de lumi`re forment deux droites s´cantes qui divisent le plan en quatre parties,
dont l’une est constitu´e des vecteurs isotropes ou du genre temps tels que t ≥ 0, et du vecteur
                         e
nul : ce sont les vecteurs futurs.
             e e                              e
     Plus g´n´ralement, cette notion de d´finit en dimension plus grande: dans un syst`me de       e
          e                                             e                  e         e
coordonn´es, soit le vecteur u = (x, y, z, t). Son carr´ scalaire compt´ en unit´ de temps au carr´     e
vaut
                                     u2 = t2 − c−2 (x2 + y 2 + z 2 ).
Le vecteur u est appel´ un vecteur futur si en ce sens u2 ≥ 0 et t ≥ 0.
                        e
                             e
     On peut maintenant d´finir la relation d’ordre temporel entre les points du plan pseudo-
euclidien: ´tant donn´s deux points M et N , on pose que M ≤ N (M est ant´rieur ` N ) si
             e         e                                                                  e      a
                 −→−
                                                        e
et seulement si M N est un vecteur futur. On peut v´rifier que ceci est bien une relation d’ordre.
                                                                                          −
                                                                                        − →2
Si M ≤ N , l’intervalle de temps (distance en mesure temporelle) de M ` N est M N .
                                                                             a
                                                     a
     Une courbe est une ligne d’univers possible ` condition que la relation d’ordre temporel ci-
         e                                                                   ıncide alors avec l’ordre du
dessus d´finie entre les points de la courbe soit un ordre total; cet ordre co¨
         e                                                                      e           a
temps v´cu par le visiteur qui suit cette ligne. En fait, cette condition est ´quivalente ` demander
                                                   e        e
que la longueur de cette courbe soit une quantit´ bien d´finie.
     Pour deux points M ≤ N , parmi les lignes d’univers possibles de M ` N , la ligne droite est
                                                                                a
la plus longue ligne d’univers possible et la seule dont la longueur en mesure temporelle soit ´gale e
` l’intervalle de temps de M ` N . Les plus courtes lignes sont de longueur nulle et constitu´es de
a                              a                                                                   e
                                         e
segments ayant des directions de lumi`re, mais ce ne sont pas des lignes d’univers possibles pour
des observateurs ou tout objet de masse non nulle, qui ne peuvent pas atteindre la vitesse de la
      e                                                                             e
lumi`re: pour la ligne d’univers d’un photon les vecteurs tangents sont de carr´ scalaire nul tandis
que pour celle d’une particule de masse non nulle ou d’un observateur, tous les vecteurs tangents
                                           e
sont strictement de genre temps (de carr´ scalaire non nul).

                                                     18
                           e e                                          e
     Les cercles de cette g´om´trie sont non plus des ellipses particuli`res mais des hyperboles parti-
    e                                                    e                                         e
culi`res, de deux genres possibles (le genre d’un cercle ´tant celui de ses rayons). Celles d’un mˆme
             a                        a
genre sont l` encore celles obtenues ` partir de l’une d’elles (qu’on peut choisir arbitrairement) par
        e
homoth´ties et translations. Tous les cercles (des deux genres) sont les hyperboles ayant la mˆme  e
                                                                       e
paire de directions des asymptotes, qui sont les directions de lumi`re. Chaque cercle est en deux
branches de longueur infinie chacune, puisque la longueur d’un arc de cercle est proportionnelle `    a
l’angle qui se voit aussi comme angle de rotation, et que les rotations peuvent toujours se composer
(additionnant les angles) sans jamais boucler un tour.
                                                                                 a                e
     Deux droites sont orthogonales si et seulement si on peut passer de l’une ` l’autre par sym´trie
              a                    e            e         a                           e
par rapport ` une droite de lumi`re et parall`lement ` l’autre direction de lumi`re. Les vecteurs
        e                                   a       e
de lumi`re sont les vecteurs orthogonaux ` eux-mˆmes.




             1
                 2 3                       0                       x   1
                       4                       c -2                     2
                                                                            3
                                                                                4


                                       4                   t
                                   3       1
                               2                               1       2
                           1                                                        3
                                                                                         4



         e           e
Les rep`res de lumi`re
                                                       e                  a    e e
     Le plan pseudo-euclidien admet un nouvel outil d’´tude par rapport ` la g´om´trie euclidienne :
                       e                                                        e
l’utilisation d’un rep`re dont les deux axes sont suivant les directions de lumi`re. En notant (a, b)
              e                  e
les coordonn´es dans un tel rep`re, la rotation d’un angle α autour de l’origine s’exprime par

                                           a = a exp( α )
                                                      c
                                           b = b exp(− α )
                                                       c

                                                                                      e e
     On peut remarquer le rapport avec l’utilisation des nombres complexes en g´om´trie eucli-
            u
dienne, o` la rotation d’un angle α s’exprime par la multiplication par exp(iα). En effet, en
    e                 e                         e
coh´rence avec la d´finition de la nouvelle unit´ d’angle que nous avons introduite, abordons cette
              e            e                   e                                                 e
fois le probl`me en unit´ de temps, et en repr´sentant le plan euclidien (x, y) par des coordonn´es
d’espace-temps (t, x ) d´finies par (t = x, x = k −1 y). Cette d´formation des coordonn´es se
                            e                                         e                       e
 e                e
r´percute sur l’´criture des nombres complexes: on remplace l’emploi de i par celui d’un certain
                              e
i pour pouvoir toujours ´crire le “nombre complexe” sous la forme z = x + iy = t + i x , d’o`      u
  2       2     −2
i = −k = c .
     Le carr´ de i ´tant alors positif, Cette formule admet donc deux solutions r´elles i = ±c−1
              e      e                                                              e
                                        e                e          e
qui correspondent aux deux coordonn´es dans un rep`re de lumi`re. C’est ainsi le fait de pouvoir
                                  e
regarder les solutions de cette ´quation (au lieu de la conserver telle quelle lors des calculs) qui
                              a    e e                                          e
est nouveau par rapport ` la g´om´trie euclidienne et permet, en imitant l’´criture en nombres
                    e e
complexes de la g´om´trie euclidienne, de rendre certains calculs en quelque sorte plus simples ou
explicites.
     Il est facile de voir que le coefficient exp( α ) est la mesure de l’effet Doppler (le nombre par
                                                 c
                          e                  e             e
lequel se multiplie la fr´quence d’une onde ´lectromagn´tique lors de cette rotation).
     L’ordre temporel M ≤ N s’exprime dans un rep`re de lumi`re par le mˆme ordre sur chacune
                                                       e          e           e
des coordonn´es : (aM ≤ aN et bM ≤ bN ).
                e

Exemple de calcul concret
Enonc´ e
    Imaginons un voyageur qui part de la Terre en subissant de son propre point de vue une
   ee                         e                                e          ee
acc´l´ration g pendant une dur´e t1 , puis continue sur sa lanc´e sans acc´l´ration pendant une

                                                      19
    e                 e ee                  e        ee                  e
dur´e t2 , et enfin d´c´l`re suivant la mˆme acc´l´ration qu’au d´part en sens contraire. A quelle
                                                                                              e
distance d de la Terre se trouve-t-il alors ? Et s’il revient ensuite sur Terre de la mˆme mani`re,    e
                          e                         e
de combien sera la diff´rence ∆t entre la dur´e de son voyage pour lui et pour quelqu’un rest´             e
                                  e                                  e
immobile sur la Terre ? (Pr´cisons que pour que ce probl`me soit effectivement trait´ par la       e
         e                             a             e e e                 e                         e
relativit´ restreinte sans faire appel ` la relativit´ g´n´rale, il faut n´gliger d’une certaine mani`re la
                              e e                      e
pesanteur terrestre, plus pr´cis´ment la vitesse d’´chappement du champ de gravitation terrestre).
Solution
                           e     e             e                           e e
     Traduisons d’abord l’´nonc´ de ce probl`me dans le langage de la g´om´trie euclidienne.
                                       e               e              a
     Partant d’une route droite appel´e “Terre”, un v´hicule (allant ` une grande vitesse constante
v = k −1 ) se met ` d´vier, le volant ´tant braqu´ dans une certaine position qui lui fait sentir
                   a e                   e           e
          e     e                          e                                               e
une pouss´e lat´rale g pendant une dur´e t1 . Puis brusquement le volant est redress´, et reste
                        e                                                    e        e
ainsi pendant une dur´e t2 . Enfin, en braquant dans l’autre sens de la mˆme mani`re on parvient
    e                 e    a               e                                   e a
apr`s encore une dur´e t1 ` redresser le v´hicule sur une route droite parall`le ` la Terre. A quelle
                                                                  e        e                   e
distance de la Terre se trouve-t-on alors ? Si on revient de la mˆme mani`re, quelle est la diff´rence
        e                                         e    a                       e
de dur´e mise pour y atteindre le point d’arriv´e B ` partir du point de d´part A, par rapport `    a
      e                        e
un v´hicule qui les aurait reli´s en restant sur la route droite “Terre” ?

                                           Véhicule

                                           t1
                                R                     d
                                      t2
                              t1
                        A                                                       B
                                            Terre
                   e              e       e                                                     e
    Pendant la dur´e de la pouss´e, le v´hicule parcourt un arc de cercle de longueur t1 en unit´
                                                                                        −1
                        e
de temps ou vt1 en unit´ d’espace, d’angle α = t1 g (ce qui donne en radians αk = t1 gv ) et de
rayon (en unit´ d’espace) R = v 2 g −1 .
              e
            e                            e e       ee
    On en d´duit par une observation g´om´trique ´l´mentaire

                                                                                          t1 g
             d = 2R(1 − cos(kα)) + vt2 sin(kα) = 2v 2 g −1 (1 − cos(kt1 g)) + vt2 sin(         )
                                                                                           v

donc en utilisant la “formule magique” v 2 = k −2 = −c2 on obtient le r´sultat au probl`me de
                                                                             e         e
         e
relativit´
                                               t1 g                  t1 g
                             d = 2c2 g −1 (ch(      ) − 1) + ct2 sh(      ).
                                                c                     c
      e                  e
De mˆme on calcule la diff´rence de longueur en mesure temporelle entre la courbe et la ligne
droite :
                                                                         t1 g                   t1 g
      ∆t = 4(t1 − kR sin(kα)) + 2t2 (1 − cos(kα)) = 4(t1 − cg −1 sh(          )) + 2t2 (1 − ch(      ))
                                                                          c                      c

                             e e                         e
qui est finalement une quantit´ n´gative, la ligne droite ´tant plus longue que la ligne courbe comme
                 e
on l’avait annonc´.
                                                                                 e
Note. A partir d’ici il est possible de passer directement au chapitre suivant (m´canique classique).

                            e               e ea
3.5. Visions de la relativit´ de la simultan´it´ ` une dimension
                                               e                 ee                        e
     Dans les sections 3.5 et 3.6, nous allons ´tudier les propri´t´s de ce qu’on voit exp´rimentale-
                  e                                                                    e
ment, par la lumi`re qui se propage dans le vide dans l’espace-temps de la relativit´ restreinte.
                                                 e                c
     L’image du monde qu’un observateur situ´ en un point re¸oit alors en un instant, est donn´e    e
par l’ensemble des photons qui lui parviennent. La ligne d’univers d’un photon est une droite de
                                                   ee            e
l’espace-temps de direction isotrope (dans tout r´f´rentiel galil´en, son vecteur vitesse est constant
de norme c).

                                                      20
                                e e
     Autrement dit, de son ´v`nement O d’observation, il voit l’ensemble des points M tels que
−→−
                                       e
M O est un vecteur futur de carr´ scalaire nul. Mais, sauf effet de perspective o` la largeur de  u
                                                                                                 c
l’observateur lui permet de reconstituer une information sur la profondeur, il ne per¸oit pas le point
          e
M lui-mˆme mais seulement la direction de droite (OM ). On posera ici par convention c = 1.
                                                                          e
     Dans cette section 3.5, on se concentrera sur les visions exp´rimentales possibles de la g´om´trie e e
du plan pseudo-euclidien, soit une droite au cours du temps.
                                   u                                                  e      u
     Un premier cas est celui o` l’observateur se trouve sur la droite mˆme o` ont lieu les ph´no-            e
m`nes observ´s. On passe des coordonn´es (t, x) aux coordonn´es de lumi`re (t + x, t − x) dont
   e           e                              e                              e             e
l’une donne la mesure de la date d’observation par un observateur immobile (x0 = constante),
suivant l’ascisse x de l’´v`nement observ´ (` une constante additive pr`s ±x0 ; de toute fa¸on la
                           e e                 e a                                     e                   c
mesure du temps n’a de sens physique qu’` une constante additive pr`s) : la premi`re (t + x − x0 )
                                                a                                   e            e
si x > x0 , la deuxi`me (t − x + x0 ) si x < x0 .
                    e
     Nous avons vu que ce syst`me de coordonn´es (t + x, t − x) pr´sente l’immense avantage de
                                   e                    e                         e
 e                                                       a
r´duire les “rotations” du plan pseudo-euclidien, ` la multiplication de chaque coordonn´e par une    e
                                                                                e
valeur de l’effet Doppler, l’une inverse de l’autre : ces deux axes ´tant de directions invariantes,
                                e
une “rotation” s’obtient en ´tirant l’un et en contractant l’autre.
     Que deviennent les vecteurs t et x d’une base orthogonale de ce plan lors d’une telle rotation ?
                                 e
Remarquons qu’il suffit de d´crire au premier ordre d’approximation l’effet d’une rotation de petit
                                                            e             e e
angle α, car une rotation d’angle quelconque s’en d´duit en r´p´tant une rotation de petit angle
                                     e       e      e           e e
un grand nombre de fois. Dans l’´tude d´form´e de la g´om´trie euclidienne, cette rotation qui fait
avancer le vecteur t d’environ αx fait avancer le vecteur x de −k 2 αt. Donc en posant c = 1, cela
                                                                               e e
fait avancer le vecteur spatial x (directeur des droites d’instantan´it´), de αt. C’est l’effet nomm´              e
           e                 e e
“relativit´ de la simultan´it´”. Nous savons que cette appellation ne doit pas nous abuser, car cette
                     e e e                 e                                                      ee
notion de simultan´it´ d´finie par une ´quation de la forme t = constante dans un r´f´rentiel, n’est
                      e      e                      e
au fond rien qu’un ´nonc´ sur cette coordonn´e t dont nous ne venons de voir qu’un rapport t´nu                e
` l’exp´rience, celui d’ˆtre d´fini par la formule t = 1 ((t + x) + (t − x)) ` partir des coordonn´es
a       e                 e      e                           2                           a                      e
de lumi`re t + x et t − x qui correspondent ` des mesures de temps de r´ceptions de photons par
         e                                        a                                     e
                     ee                                       e
des horloges consid´r´es comme fixes. Cette coordonn´e de “temps” est bien diff´rente des notionse
physiques de temps, les temps que mesurent les horloges d’une part, l’ordre de causalit´ temporel     e
  e             o             e
d´fini par le cˆne de lumi`re d’autre part.
                                                                            e
     C’est de cette construction abstraite, artificielle, de la repr´sentation de la coordonn´e t sous   e
                                      e             e      e
forme du “temps” intuitif, que r´sulte ce ph´nom`ne a priori paradoxal de “relativit´ de la si-       e
        e e                                                       e                      e
multan´it´”. On peut alors se demander si cette repr´sentation est d´finitivement inutilisable
               a             e                 e      e              e
comme aide ` la compr´hension des ph´nom`nes. La r´ponse est non, ` condition de fonder    a
                       e
ses motivations exp´rimentales non sur des constructions artificielles mais en termes de ce que
      e             e
l’exp´rience elle-mˆme nous propose. Alors, la pertinence de l’intuition temporelle (que nous avons
                  ee
jusqu’ici consid´r´e comme nulle pour ne pas en abuser) sera, sans plus, celle qui r´sidera dans    e
           e
cette exp´rience.
                                                        e                         a
     Nous avons donc besoin d’une situation exp´rimentale donnant ` un observateur de percevoir
                     e e
naturellement des ´v`nements se produisant sur un segment d’une droite spatiale D au cours du
                            e                                          e          a
temps (en fait on peut ´tendre automatiquement cette exp´rience ` la perception d’un morceau
de plan au cours du temps), suivant des sensations visio-temporelles conformes aux coordonn´es                  e
                                                                 e             e
orthogonales d’espace-temps (t, x) que nous avons utilis´es dans l’´tude geom´trique.        e
                     e              e e           a
     Voici cette exp´rience. Les ´v`nements ` observer se produisant en apparence sur un segment
de droite S ⊂ D et dans certaines limites de temps (donc th´oriquement dans une certaine r´gion
                                                                       e                                    e
                                                                e       e
d’un plan P pseudo-euclidien), soit un observateur O ´loign´ de D dans une direction autre que
                                               a                   e                    a
celle de D (par exemple perpendiculaire ` D mais pas n´cessairement) ` une distance infiniment
                        a
grande par rapport ` la longueur de S. Autrement dit, posons S immobile par rapport ` O et                a
                                a              a
infiniment petit par rapport ` sa distance ` O (on peut dessiner le tout comme vu point de vue d’un
                                             a           e
autre observateur immobile par rapport ` O, situ´ encore infiniment plus loin perpendiculairement
au plan contenant O et D).
           e                           e e
     On d´finit alors le temps des ´v`nements sur S sous forme du temps qu’indique l’horloge de
                                                        e
O lors de la perception en O des photons qu’ils ´mettent, et leur position par la direction visuelle
                                                                                                 e
de ces photons (dont la variation est infiniment petite, autour d’une direction donn´e). Ceci forme

                                                        21
        e                 e
un syst`me de coordonn´es affine de P .
                               a                        e                  e
    La question est alors : ` quelle condition ce syst`me de coordonn´es d’espace-temps est-il
                     e e
orthogonal pour la g´om´trie pseudo-euclidienne, avec des mesures de temps et d’espace conformes
` ce que nous avons d´crit ? R´ponse : il est orthogonal si et seulement si l’observateur O voit les
a                      e         e
                     e      ae                                                                e
points de S comme ´tant ` ´gale distance de lui, autrement dit, s’il voit le plan P comme ´tant `     a
                                              a
chaque instant une droite D perpendiculaire ` la direction de son regard (la direction allant de O
                        e
vers S; pour le dire th´oriquement, le plan contenant la droite d’univers O et un rayon lumineux
                         a
vu est perpendiculaire ` P ). Sa mesure d’espace est alors correcte. Ensuite, dans ce cas, l’unit´    e
                                                                                    a
de mesure de temps sera correcte si et seulement si D est immobile par rapport ` O (c’est-`-direa
                a
que sa distance ` D est fixe au cours du temps, sans regarder les mouvements de coulissement de
                       e           e                        e a
la droite D sur elle-mˆme; dit th´oriquement, O est parall`le ` P ).
                                                                e              e
    Remarquons que la position visuelle d’un point de D peut ´galement se d´finir par une gradu-
                                    a                         e
ation de D immobile par rapport ` O (chaque marque est th´oriquement une droite de P parall`le      e
a
` O).
                                                          e                e e
    Nous allons maintenant rendre compte de la relativit´ de la simultan´it´ quand on passe ` un  a
      e                                               a
deuxi`me observateur O en mouvement par rapport ` O, dans la direction de D.
                                                  e e                  a
    Pour cela, partons de la notion de simultan´it´ dans S relative ` l’observateur O par rapport
                                          a                          a               e
auquel S est immobile et perpendiculaire ` la direction qui le relie ` O. La subtilit´ se trouve dans
        e                                       e
la mani`re suivant laquelle cette condition exp´rimentale se retrouve avec O .

                               O1

                               O’                                    S’

                               O                                     S

                                             a
Soit S un segment immobile par rapport ` O , coulissant le long de D, et rencontrant S lorsque
    e e                                                        e                    a
les ´v`nements s’y produisent. C’est ce segment S qui doit ˆtre perpendiculaire ` sa direction `   a
                      e                                          a        a
O . Or, S est parall`le au mouvement, donc la direction de O ` S est ` chaque instant parall`le  e
` celle de O ` S. (En effet, si on imagine le syst`me (O , S ) comme ´tant une boˆ rigide tr`s
a             a                                     e                    e            ıte         e
       e                e                                 a
allong´e, elle est lanc´e dans la direction orthogonale ` sa longueur, donc il n’y a pas de raison
                    e    e
qu’une de ses extr´mit´s devance l’autre, et sa direction reste fixe).
                                            e                         e e
     Pour que les conditions soient respect´es, O doit observer des ´v`nements qui se produisent
sur S . Mais S doit recouvrir S quand ils se produisent; pendant ce temps, O rencontre O. Mais
       e                                                      eae      e
la lum`re ne lui en parvient que plus tard, alors que O est d´j` ´loign´ de O. Les rayons lumineux
                        e e                                                        a
arrivant en O de ces ´v`nements, bien que de direction spatiale perpendiculaires ` D par rapport
` O , ne sont pas perpendiculaires ` D par rapport ` O. Cette perception pour O correspond ` la
a                                    a                a                                         a
perception de tout observateur que O rencontre alors, en particulier de O1 immobile par rapport
a                                  e
` O. La condition d’orthogonalit´ est fausse pour O1 : les points en avant de S sont plus proches
                                 e                     e e                 e              a
de O1 que ceux qui sont en arri`re. Donc, pour des ´v`nement simultan´s par rapport ` O qui se
                                                         c                                    e
produisent sur S, ceux qui sont en avant de S sont per¸us par O avant ceux qui sont en arri`re.
                                           e                e e
     Ce raisonnement redonne la relativit´ de la simultan´it´, et la forme de la rotation pseudo-
                      e
euclidienne en premi`re approximation, que nous avons mentionn´es. e
3.6. Transformation relativiste d’une photographie en relief

                         a                          e e             e       a
Cas d’un espace-temps ` 2+1 dimensions (qui se g´n´raliserait ais´ment ` 3+1 dimensions).
                        e                                                                      e
    Nous n’allons pas ´tudier ici les rapports de toutes les observations possibles mais consid´rer
seulement la question suivante.
                             a
    Soit l’image en relief (` deux dimensions, une dimension angulaire et une dimension de pro-
                                 c                                            o          e
fondeur) qu’un observateur per¸oit du monde en UN instant. C’est donc le cˆne de lumi`re pass´e  e
    e    e                     e                         e        a
repr´sent´ sous forme projet´e sur le plan t = 0 parall`lement ` l’axe du temps. Soit un autre
                                                                         a
observateur en mouvement par rapport au premier mais le rencontrant ` l’instant de l’observation.
                           e                                              e
En cet instant, il observe ´galement le monde en relief en recevant les mˆmes rayons lumineux que

                                                  22
                   o          e       e           e
le premier (son cˆne de lumi`re pass´e est le mˆme). Quelle est alors la loi de transformation qui
                                a
fait passer de ce que voit l’un ` ce que voit l’autre ?
                                                                             o        e e
     Il s’agit d’une transformation du plan. L’origine O du plan y joue un rˆle privil´gi´, puisque
                               o          e                   e
c’est l’image du sommet du cˆne de lumi`re. Voici quelques r´sultats:
   e e
Th´or`me 1. Une telle transformation envoie toute ellipse de foyer O en une autre ellipse de
               e                                       a                            ıncide avec une
foyer O ayant mˆme mesure du petit axe; sa restriction ` toute ellipse de foyer O co¨
transformation affine.
  e e                      a                                     e
Th´or`me 2. Sa restriction ` toute demi-droite issue de O est lin´aire.
    e e                                                            e
Th´or`me 3. Quelles que soient deux ellipses de foyer O et de mˆme mesure du petit axe, toute
            a                                                                           c
restriction ` l’une d’une transformation affine qui l’envoie sur l’autre se prolonge de fa¸on unique
                                                           e                      e
en une transformation possible produite par ce type d’exp´rience, pour un deuxi`me observateur
de mouvement et de disposition convenables.
                   e        e
     Tout cela se d´duit ais´ment du fait qu’une ellipse de foyer O est l’image de l’intersection du
 o            e                                                        e               e    e
cˆne de lumi`re avec un plan, et que la longueur du petit axe est li´e au volume d´limit´ entre le
 o                                 e                                       e                    e
cˆne et le plan, ou encore au carr´ scalaire du vecteur u = (a, b, c) qui d´finit ce plan comme ´tant
celui d’´quation “(produit scalaire par u) = 1”, soit at − bx − cy = 1.
        e
          e e                                                           e e               a
     Le th´or`me 2 s’obtient soit directement, soit comme limite du th´or`me 1, et suffit ` construire
                         e     e       e e
le prolongement unique ´voqu´ au th´or`me 3.
                                 e
     On peut ajouter pour la mˆme raison :
   e e                                                 a                               e
Th´or`me 4. La restriction d’une telle transformation ` toute parabole de foyer O, de mˆme qu’`a
toute branche d’hyperbole de foyer O, co¨ıncide avec une transformation affine et O est toujours
                                                       e                                       a
foyer de l’image. (La condition sur le petit axe a un ´quivalent ici mais qui est moins facile `
exprimer).
                                                 e
    Attention : les deux branches d’une mˆme hyperbole de foyer O se transforment en deux
                              e                                                        a
branches d’hyperboles diff´rentes (on ne peut retrouver une correspondance qu’` travers une
    e                                         e        e
sym´trie centrale. . . ). Les droites doivent ˆtre rang´es parmi les branches d’hyperboles de foyer O
               e       e
car elles sont ´chang´es avec elles par ces transformations.
                                    e         e        ea                                      e
Autre explication : la preuve th´orique ´tant d´j` faite ci-dessus, ajoutons une interpr´tation en
                  e
termes plus exp´rimentaux de ces faits. Comme ces transformations forment un groupe, il suffit
de les justifier au premier ordre d’approximation pour des vitesses faibles. Pour cela, voyons le
                                        e           e e    a    e
premier ordre d’approximation du r´sultat pr´c´dent ` red´montrer, concernant l’effet sur un cercle
C de centre O : son image sera une ellipse de foyer O et de faible excentricit´, donc approxima-
                                                                                        e
                            e                               e   e                  a
tivement un cercle de mˆme rayon mais de centre d´call´ par rapport ` O, et on passe de l’un
a                                                           e                              e
` l’autre par translation. Pour justifier cela, consid´rons (en imaginant encore ´videmment les
                                      e
choses du point de vue d’un troisi`me observateur immobile par rapport au premier et situ´ dans   e
la troisi`me dimension, loin perpendiculairement au plan de la sc`ne) une figure C d´finie par les
         e                                                               e                   e
deux propri´t´s suivantes: d’abord, C co¨
             ee                                ıncidera avec C lorsqu’il ´mettra sa lumi`re vers O, donc
                                                                         e                e
                                                                  a                 e
c’est un cercle par rapport au premier observateur O (donc ` un instant pr´cis pour O, qui pr´c`de  e e
  e e                                     e e
l’´v`nement d’observation d’une dur´e ´gale au rayon du cercle); ensuite, il est immobile par rap-
port au deuxi`me observateur O qui rejoindra le centre O de C lors de l’observation. Donc il n’en
               e
                            e                                    e    eee                    e
est pas le centre, car il n’´tait pas au centre quand la lumi`re a ´t´ ´mise. Fin de red´monstration
(d’o` r´sulte la forme d’ellipse de C par propri´t´ de groupe, c’est-`-dire d´duite de la premi`re
     u e                                                ee                    a       e               e
                     e e                                     e
approximation en r´p´tant celle-ci, d’amplitude infinit´simale, un grand nombre de fois).
                         e
     En reprenant les mˆmes notations, on remarque ensuite la contraction relativiste des longueurs :
cette ellipse C que O observe se contracte en un cercle (de diam`tre donn´ par le petit axe) en
                                                                           e          e
passant au premier observateur. On parle de contraction des longueurs puisque cet ensemble
   e e                          e                 a                              a
d’´v`nements est synchronis´ par rapport ` O mais non par rapport ` O : c’est l’ensemble des
e e             e                                                           a
´v`nements d’´missions des photons d’un objet fixe par rapport ` O donc en mouvement par
          a                                     a                  e           a
rapport ` O, qui parviendront au centre ` un instant donn´, venus ` la vitesse de la lumi`re de   e
              e                ee                                                     e
distances diff´rentes, interpr´t´s comme une observation abstraite instantan´e par rapport ` O.    a

                                                  23
        e                                    a
La sph`re de vision dans l’espace-temps ` 3+1 dimension
               c                              e e                                    e
     Commen¸ons par motiver les choses g´om´triquement. Cette fois, en consid´rant l’image qu’on
   c               e
re¸oit par la lumi`re, nous allons oublier la profondeur et ne retenir que l’image qu’on a des choses
           e                           c                                                e
sur la sph`re de vision. De toute fa¸on, la transformation de la profondeur se d´duit de celle de
l’angle de vision d’un petit objet, puisque la largeur-image de cet objet (produit de la profondeur par
l’angle de vision) se conserve (en effet, il n’y a pas de contraction des longueurs perpendiculairement
au mouvement, ou on peut encore le voir en prenant une ellipse presque aplatie, de petit axe la
largeur-image de l’objet). On remarque que ce rapport des profondeurs, inverse du rapport des
angles de vision, co¨       e                                  e                      c
                     ıncide ´galement avec le rapport des fr´quences des ondes re¸ues suivant l’effet
            e
Doppler (li´ naturellement au rapport de perception du temps).
                                                                                    e
     La question est alors : quelles sont donc les transformations de cette sph`re par changement
     ee                e                         e
de r´f´rentiel ? La r´ponse sort en fait imm´diatement de la remarque ci-dessus : la variation de
                     e a                                         e
la profondeur est li´e ` celle de la largeur angulaire (infinit´simale). Donc la variation de largeur
                e                                                                     u
angulaire ne d´pend pas de la direction de cette largeur, mais seulement du lieu o` elle se trouve sur
       e                                                                                 e
la sph`re de vision. Ceci montre que c’est une transformation conforme de la sph`re (“conforme”
                 e                                                         e
signifie: qui pr´serve les angles: en effet, elle transforme dans la sph`re de vision un petit disque
en petit disque donc aussi les angles comme secteurs d’un tel disque).
                 e
     Pour une ´tude plus approfondie de ces transformations, voir le texte no3.ps de ce site. Ce
                                                   e
sont les transformations de Moebius de la sph`re (celles qui transforment les cercles en cercles, et
                         ee
qui par la projection st´r´ographique correspondent aux transformations homographiques du plan
complexe).
                  a      e
3.7. Introduction ` la th´orie des spineurs
                                                         e                 a
     (Note: ce paragraphe est beaucoup moins corrig´ que les autres; ` long terme, il pourra ˆtre  e
       e       e     e                               a
chang´ ou d´plac´. Il est pour le moment inutile ` la suite: on peut passer au chapitre 4).
                                    e                                                          e
     Comme nous l’avons signal´, les tenseurs sont d’une importance capitale en physique th´orique.
                   e                              e                     e
Pour aborder s´rieusement la physique math´matique, il faudrait ´tudier d’abord en d´tails la  e
   e                                            e                                  a
th´orie du calcul tensoriel. Mais comme le pr´sent document ne cherche pas ` approfondir les no-
                                                                  c
tions mais se contente de les survoler superficiellement, un aper¸u rapide et superficiel des tenseurs
suffira.
                        e                           ee                               e
     A l’avenir peut-ˆtre ce chapitre sera compl´t´, mais en fait ce n’est pas n´cessaire car toutes
       e
les id´es de cette approche superficielle ici en vue, suffisantes pour la suite, se trouvent dans le
                e
document pr´sent sur ce site : http://spoirier.lautre.net/tenseurs.dvi (extraits de messages des
newsgroups sur les tenseurs).
           e                               e                                                    e
     La th´orie des spineurs est une th´orie indispensable en physique des particules dans la d´fintion
                           e                     e
des spins demi-entiers (´quation de Dirac de l’´lectron par exemple). Nous supposerons ici connues
                             e        e
les notions usuelles d’alg`bre lin´aire.
                                e e                    e                                  e        e
     Dans sa forme la plus g´n´rale, l’objet de la th´orie des spineurs est le suivant: ´tant donn´ un
                                             e                                        e
espace quadratique E (espace vectoriel r´el ou complexe muni d’une forme bilin´aire B sym´trique e
        e e ee                                                                          e a
non d´g´n´r´e), on trouve un espace vectoriel S, dit espace spinoriel associ´ ` E, avec une
                  e
application lin´aire L de E dans l’espace des endomorphismes de S, tels qu’on ait l’identit´         e
L(x)L(y) + L(y)L(x) = −2B(x, y) Id (o` Id est l’application identique sur S).
                                             u
                                           e             e
     Nous n’allons pas ici tenter de r´soudre ce probl`me. Mentionnons simplement le fait qu’une
             e         e e                                               e
solution th´orique g´n´rale (existence avec une certaine forme d’unicit´) est connue, pouvant mˆme e
                                                                    e    a
se construire relativement facilement, sauf que cela laisse un myst`re : ` quoi peut donc bien ressem-
       e e                                                            e
bler g´om´triquement la solution en fin de compte, “une fois effac´s les traits de construction” ?
     Il se trouve que pour un E de petite dimension, on peut raisonnablement la comprendre.
                                          e                   u
En particulier, dans le cas qui int´resse la physique, o` E est l’espace-temps de la Relativit´      e
                               e e                   e     e
restreinte, les structures g´om´triques de ce probl`me r´alisent en quelque sorte une reconstitution
       a                  o             e                                        e
de E ` partir de son cˆne de lumi`re, autrement dit de ”ce qu’on voit” exp´rimentalement en un
           a                    e                                               c
point et ` un instant donn´s de l’epace-temps. Nous en verrons un aper¸u. Malheureusement,
                             e                                    e                         e
nous ne pourrons pas pr´senter ainsi tous les aspects de la th´orie, car la bonne pr´sentation de
                     e                                       a             u
certains aspects n´cessiterait l’usage du calcul tensoriel (` moins bien sˆr de simuler ce dernier par
d’obscures acrobaties).

                                                  24
                                  e                       e e                  e
    Ce qui suit s’appuie sur les r´sultats des sections pr´c´dentes sur les exp´riences visuelles.
                               a
Spineurs d’un espace-temps ` 2+1 dimensions
                             e         e e
     Les transformations d´crites pr´c´demment de ce qu’on voit admettent une formulation ´l´-     ee
                                                                 e
gante en termes de spineurs. Nous verrons cet outil appliqu´ d’abord au cas d’un espace ` 2         a
dimensions spatiales plus le temps.
                ee
     La propri´t´ fondamentale du spin 1/2 est que quand l’espace physique fait un tour complet
          e                                               e                  e     e
sur lui-mˆme, ce spin ne fait qu’un demi-tour. Le mod`le de base de ce ph´nom`ne est celui d’une
                                 e              a
variable complexe dont le carr´ s’identifierait ` un vecteur d’un plan de l’espace physique. Prenons
                                                        e
donc comme espace spinoriel S le plan ”racine carr´e complexe” du plan d’observation ci-dessus,
             e                   e             e                                         e
ou image r´ciproque par l’op´ration de carr´ complexe. Quelle est donc l’image r´ciproque par
       e                                          e
le carr´ complexe d’une ellipse de foyer O ? R´ponse : c’est une ellipse de centre O ! Et le type
                        e       e e                                e
de transformations d´crit pr´c´demment est l’image par le carr´ complexe des transformations
   e          e         e           e
sp´ciales lin´aires (lin´aires de d´terminant 1) de S (vu comme R-espace vectoriel de dimension 2).
                                                                        a
     La mesure du petit axe de l’ellipse de foyer O est proportionnelle ` l’aire de l’ellipse de centre
                                               e      e                           e           e
O correspondante, dont on sait qu’elle est pr´serv´e par les transformations sp´ciales lin´aires.
                                                    e        o          e
     Ainsi, un vecteur du genre temps, vecteur int´rieur au cˆne de lumi`re future, et correspondant
` un r´f´rentiel, donne une ellipse de foyer O dans le plan de vision : c’est celle qui apparaˆ sous
a      ee                                                                                       ıt
                               ee
forme d’un cercle dans ce r´f´rentiel. L’ellipse de centre O correspondante dans le plan spinoriel
                        e          e       e
donne une forme bilin´aire sym´trique d´finie positive (qui est la structure euclidienne qui donnait
` ce plan la structure de plan complexe utilis´e plus haut).
a                                               e
            e e                                                                                 e
     Plus g´n´ralement, un vecteur spatio-temporel u = (t, x, y) s’identifie au tenseur sym´trique
dans le plan spinoriel (´l´ment sym´trique de S ⊗ S) de matrice
                          ee           e

                                             t+x  y
                                              y  t−x

             e e                                            e           e a
     De mani`re ´quivalente, on peut dire que la forme lin´aire associ´e ` u, produit scalaire par u
d’un vecteur v = (t , x , y ), u.v = tt − xx − yy ) s’identifie ` la forme bilin´aire sym´trique dans
                                                               a               e        e
le plan spinoriel, de matrice
                                              t − x −y
                                         A=
                                               −y t + x
       e        a          e
(Elle ´quivaut ` la donn´e de la solution L du probl`me des spineurs ´voqu´ au d´but, en ´tant
                                                         e                  e     e      e         e
l’application qui ` (v,w) associe det(v, L(u)(w))) (On retrouve ainsi le fait que t + x et t − x sont
                  a
                                                              e        e
plus fondamentaux que t et x !) Une transformation sp´ciale lin´aire de matrice P envoie cette
                                        t
             e
forme bilin´aire sur celle de matrice P AP .
     C’est l’expression de la rotation spatio-temporelle (transformation de Lorentz combin´e avece
                                   e e
des rotations spatiales) la plus g´n´rale avec deux dimensions spatiales !
     On v´rifie : det A = t2 − x2 − y 2 (invariant relativiste, carr´ scalaire du vecteur (t, x, y)).
           e                                                        e
                         e          e e ee                         o            e                    o
     Donc la forme bilin´aire est d´g´n´r´e si elle appartient au cˆne de lumi`re; elle est dans le cˆne
         e                                                                        o           e
de lumi`re future si elle est positive. L’application du plan spinoriel dans le cˆne de lumi`re, qu’on
   e     e e e                                        e                                  e
a ´voqu´ pr´c´demment en disant que c’est le carr´ complexe, est finalement le carr´ tensoriel. De
      e e              a                                           e          e
mani`re ´quivalente, ` un spineur s correspond la forme bilin´aire sym´trique correspondant au
carr´ tensoriel de s, d´finie par s2 (v, w) = det(s, v) det(s, w) = t vBw o` t s = (a, b) et
     e                 e                                                   u

                                                  b2 −ab
                                         B=
                                                 −ab a2

(ou son oppos´ si on veut un vecteur du cˆne de lumi`re pass´e). On v´rifie que t sAs est le 2 fois
              e                            o          e         e            e
le produit scalaire des vecteurs d´finis par A et B (o` (t, x, y).(t , x , y ) = tt − xx − yy )
                                  e                  u
                             a
Spineurs de l’espace-temps ` 3+1 dimensions
           e               e                                 e
     D’apr`s ce qu’on a d´crit, les transformations de la sph`re de vision sont les transformations
d’un espace projectif de dimension 1 complexe. L’espace vectoriel de dimension 2 complexe auquel
             e
il est associ´ sera notre espace spinoriel S.

                                                  25
                                e          a        e                 e
    Un vecteur v = (t, x, y, z) ´quivalent ` la donn´e de la forme lin´aire (produit scalaire par v),
de composantes (t, −x, −y, −z), se d´finit alors comme ´tant l’espace des ´l´ments hermitiens de
                                      e                  e                   ee
¯
S ⊗ S (produit tensoriel sur le corps C de l’espace conjugu´ de S par S), ou si on parle en termes
                                                            e
                                  e
duaux, celui des formes sesquilin´aires hermitiennes sur S, de matrice

                                            t−x        −y − iz
                                    A=
                                           −y + iz      t+x

                            e e                             e
(Contrairement au cas pr´c´dent, l’espace S mentionn´ ici n’est pas la solution du probl`me     e
                                                                                    2   2     2
spinoriel dans lequel on d´finit L, qui serait plus compliqu´e) On v´rifie : det A = t − x − y − z 2 .
                          e                                  e     e
                                                                      ¯
La rotation spatio-temporelle la plus g´n´rale est donc de la forme t P AP o` P est dans SL(2, C).
                                         e e                                 u
                           e                                                             e
A quelques acrobaties pr`s, cela redonne dans le cas purement spatial (t = 0) la pr´sentation
                                                                           o          e
quaternionique des rotations. L’application de l’espace spinoriel dans le cˆne de lumi`re s’exprime
par : s ⊗ s(¯, w) = det(s, v) det(s, w) = t vBw o` t s = (a, b) et
      ¯     v                                     u

                                                bb −¯
                                                ¯   ba
                                        B=
                                               −¯b aa
                                                 a ¯

                                           a
On remarque que dans ce passage de s ` B ce n’est pas seulement le signe qui est perdu mais
tout l’argument : multiplier s par un nombre complexe de module 1 ne modifie pas le r´sultat.e
                                    a
On voudrait donc donner un sens ` cet argument. Ce n’est pas possible dans l’absolu, puisqu’une
        e
homoth´tie de S de rapport un nombre complexe de module 1 ne change rien. Mais il est possible de
comparer les arguments de plusieurs vecteurs. Pour mieux voir ce qui se passe, fabriquons de toutes
   e        ee                                e
pi`ces une r´f´rence : c’est l’argument du d´terminant de deux vecteurs dans S (qui n’intervenait
                                                  e                       e
pas ci-dessus puisqu’on avait le produit d’un d´terminant et du conjugu´ d’un autre). Soit donc
un spineur s. On cherche une image visuelle de son argument. Pour cela, prenons un vecteur s
                                  e
tel que det(s, s ) = 1 : ceci le d´finit modulo l’addition avec un multiple complexe de s. Pour le
moment, cela semble ne rien apporter puisque s peut avoir n’importe quelle direction dans S, mais
                  e                                                   e
l’information int´ressante est la variation de s + λs pour un nombre r´el λ positif au voisinage de
λ = 0. Prenons par exemple s = (1, 0) et s = (a, 1). On a alors B(s + λs ) = B(1 + λa, λ) et en
n´gligeant les termes en λ2 :
  e
                                           0        −λ
                                          −λ 1 + λ(a + a)¯
                            ¯
soit 2t = 2x = 1 + λ(a + a), y = λ, z = 0. Comme on veut retenir l’information ind´pendante e
                                                                    1
                                       e
de a, c’est que le vecteur de lumi`re qui est parti de t = x = 2 peut s’allonger ou se raccourcir
                                          e    e       e
comme il veut mais il avance de mani`re d´termin´e dans la direction de y. Finalement, pour s
   e                   a                                                              a       e
fix´, l’application qui ` s associe det(s, s ) signifie une application du plan tangent ` la sph`re que
           o           e
forme le cˆne de lumi`re future, en l’image de s, dans C, conservant la structure euclidienne (elle
                                                e           e
renverse l’orientation si on oriente cette sph`re “de l’ext´rieur”, par le vecteur sortant, ou encore
                   e                 e            o           e        e
si on prend la sph`re de vision d´finie par le cˆne de lumi`re pass´e). Une mesure du module du
 e                        e                                   e            e
r´sultat signifie qu’une fl`che (direction et sens) est marqu´e sur la sph`re de vision, en l’image de
s. Lorsque s tourne d’un angle h, donc est multipli´ par un complexe u = eih , cette fl`che tourne
                                                       e                                  e
de 2h. en effet, s doit tourner de −h pour que det(s, s ) reste ´gal ` un. Puis, le nouveau s + ls
                                                                   e     a
vaut us + λus = u(s + λu2 s ) dont l’image physique a bien tourn´ de 2h. Cela manifeste encore
                                                                       e
              e     e
une fois le ph´nom`ne de spin demi-entier : quand on le tourne d’un angle, son image dans l’espace
physique tourne d’un angle double.
                                    e                                 e          e
     Pour finir, donnons la repr´sentation spinorielle du champ ´lectromagn´tique en un point.
                                                                                            e
D’abord, quelle est donc la forme d’un tel champ en un point ? C’est une forme bilin´aire anti-
     e                                   e           a                              u             e
sym´trique de l’espace vectoriel associ´ (tangent) ` l’espace-temps, de matrice (o` les coordonn´es
      e
sont ´crites dans l’ordre (t, x, y, z) :

                                     0      Ex        Ey    Ez
                                                              
                                   −Ex      0       −Bz    By 
                                    −Ey      Bz       0    −Bx
                                                              
                                    −Ez     −By      Bx     0

                                                  26
                                          e              e
     Comme n’importe quelle forme bilin´raire antisym´trique (comme par exemple le moment
   e                    e                                                 e        e
cin´tique), elle se repr´sente dans l’espace spinoriel par une forme bilin´aire sym´trique : soit
M = E + iB (donc de composantes Mx = Ex + iBx , etc), vecteur de l’espace quadratique C3 de
                 e                                e         e
base orthonorm´e, qui s’incarne par la forme bilin´aire sym´trique de matrice

                                    −M y + iM z         Mx
                                       Mx            M y + iM z

                              e           e                         ee
La transformation du champ ´lectromagn´tique par changement de r´f´rentiel (ou rotation spatio-
                  e                                                     e       e
temporelle) en r´sulte, par l’action naturelle des transformations sp´cial lin´aires de l’espace
spinoriel sur l’espace de ses formes bilin´aires (A → t P AP ). On retrouve l’invariant relativiste
                                          e
du champ par le carr´ scalaire M 2 = E 2 − B 2 + 2i(E.B) aussi ´gal ` l’oppos´ du d´terminant de
                      e                                         e   a        e      e
la matrice.




                                                27
                                       e
                                   4. M´canique classique

                  a     e  e        e
4.1. Introduction ` la g´om´trie diff´rentielle
                           e                                               e e           e
      Pour aborder la m´canique nous aurons besoin de notions de g´om´trie diff´rentielle. Nous
                       e e                             e e                          e e
avons introduit la g´om´trie affine qui est une g´om´trie plus souple que la g´om´trie euclidienne
                                                                 e        e e          e
(avec plus de transformations et moins de structures). De mˆme la g´om´trie diff´rentielle est plus
                  e e
souple que la g´om´trie affine. Il n’y a plus de notion de droite, mais il reste la notion de courbe.
                                                                      e e       e
      Nous allons d’abord introduire les principales notions de g´om´trie diff´rentielle dans le cadre
          e e
de la g´om´trie affine, puis nous nous affranchirons de ce cadre pour retenir ces notions en elles-
   e                                    a                    e
mˆmes. Nous ne chercherons pas ` donner de cela une d´finition rigoureuse axiomatiquement mais
                               e                                      e
l’accent sera mis sur les id´es et notions de base qui sont utilis´es en pratique.
                 ıt                 e e                                                      e
      On connaˆ la notion de d´riv´e d’une application de l’ensemble des nombres r´els dans lui-
   e                 e e                  e e
mˆme, ou plus g´n´ralement, la d´riv´e d’une application d’une droite affine dans une autre;
                           e e                             e                               e
la valeur d’une telle d´riv´e en un point est homog`ne au rapport d’une quantit´ associ´e ` la     e a
        e                          a                                                           e
deuxi`me droite (appartenant ` la droite vectorielle qui lui correspond, ensemble des diff´rences de
        ee                          e        e a         e                   e
deux ´l´ments) sur une quantit´ associ´e ` la premi`re. Pour fixer les id´es, disons qu’on travaillera
                         e                        e e
avec les applications d´rivables et dont la d´riv´e est continue, mais d’autres choix seraient possibles
         ee                            e        e
(de pr´f´rence une condition de r´gularit´ plus forte). Pour simplifier, les applications appartenant
a                 e       e         ee            a                          e
` la classe de r´gularit´ consid´r´e (celle-l` ou une autre) seront qualifi´es de lisses.
         e e
      G´n´ralisons cela aux deux cas suivants.
                                       e e
      – Le cas d’une courbe param´tr´e, application lisse d’une droite affine D dans un espace affine
E. Sa diff´rentielle est une application de D dans l’espace des vecteurs de E divis´s par les quantit´s
            e                                                                        e                 e
        e a                      e                  e
associ´es ` D. Si on se repr´sente D comme ´tant la droite du temps, cette courbe param´tr´e se   e e
               e                                           e                   e
voit comme ´tant le mouvement d’un point, et sa diff´rentielle est la donn´e du vecteur vitesse de
ce point en chaque instant.
      – Le cas d’un champ scalaire, application lisse d’un espace E dans une droite D . (Le nom
                                                                 e      e          ee
de “scalaire” s’emploie aussi comme synonyme de “quantit´”, d´signant un ´l´ment d’une droite
                             e                                              ee
vectorielle ou affine, trait´ comme un nombre, par opposition au cas d’´l´ments d’espaces vectoriels
                                           e                                      e
de dimension plus grande.) Sa diff´rentielle en un point est une forme lin´aire sur l’espace des
vecteurs de E multipli´e par une quantit´ de D . Et sa diff´rentielle (tout court) est l’application
                         e                      e               e
qui ` tout point de E associe la diff´rentielle en ce point.
      a                                   e
                                                                                 e
      En rassemblant ces deux notions, on peut dire que quand un point se d´place dans un espace
                                   e e                                                         ea
muni d’un champ scalaire, la d´riv´e par rapport au temps de la valeur du champ rencontr´ ` chaque
                 e                 e                                                              e a
instant est le r´sultat de la diff´rentielle du champ en la position courante du point, appliqu´e ` son
vecteur vitesse. Par abus de convention on sous-entendra parfois dans la notion d’appartenance
                a                                          e         e e                   ee
d’un vecteur ` un espace vectoriel, le fait que ce peut ˆtre en r´alit´ le produit d’un ´l´ment de cet
espace vectoriel par une quantit´.    e
                                                       e e         e
      Introduisons maintenant les espaces de la g´om´trie diff´rentielle, qu’on appelle des vari´t´s. ee
                            ee
Intuitivement, une vari´t´ de dimension n est un espace qui est approximativement un espace
                                                  e
affine de dimension n au voisinage infinit´simal de chacun de ses points. Par exemple, on a les
            ee                                a                                                 ee
sous-vari´t´s d’un espace affine (c’est-`-dire des parties de cet espace qui sont des vari´t´s): les
surfaces dans l’espace usuel sont les sous-vari´t´s de dimension 2. Dans un espace affine E de
                                                      ee
                                                               e
dimension n muni d’un champ scalaire f , l’ensemble S d’´quation f = 0 est une sous-vari´t´ de      ee
dimension n − 1 ` condition que la diff´rentielle de f ne soit en aucun point de S ´gale ` la forme
                    a                         e                                          e     a
lin´aire nulle sur l’espace des vecteurs de E. Un th´or`me dit que toute vari´t´ de dimension n est
    e                                                    e e                     ee
      e                             ee
repr´sentable comme sous-vari´t´ d’un espace affine de dimension 2n + 1 (ou toute dimension plus
grande mais pas toujours moindre).
                                       ee                               e       e
      A chaque point x d’une vari´t´ S de dimension n est associ´ de mani`re continue un espace
                                          e                            ee
vectoriel Tx S de dimension n appel´ l’espace tangent de la vari´t´ en ce point. Dans le cas d’une
            ee
sous-vari´t´ d’un espace affine, on imagine facilement l’espace tangent en chaque point comme ´tant   e
                                                ıt                                           e
l’espace tangent en ce point qu’on connaˆ comme sous-espace affine de l’espace de d´part, avec le
point de tangence pris comme origine pour en faire un espace vectoriel. C’est d’ailleurs ainsi qu’on
          e                              ee
peut d´finir la notion de sous-vari´t´ de dimension n d’un espace affine: une sous-vari´t´ est uneee

                                                  28
                                                            a
partie qui en chaque point admet un espace tangent, c’est-`-dire un sous-espace affine approximant
            e
la partie pr`s du point.
                         e e             ee                            e
    Mais dans le cas g´n´ral d’une vari´t´, les espaces tangents se d´finissent abstraitement, sans
e                                    e                                              e
ˆtre vus comme inclus dans un mˆme espace affine. C’est ainsi une notion ind´pendante de la
     e                 e            ee                   ee
mani`re dont on repr´sente la vari´t´ comme sous-vari´t´ d’un espace affine.
                          e                                                 e e
    Les notions de diff´rentielle qu’on a vues pour un espace affine se g´n´ralisent au cas d’une
    ee              e                                e                              ee
vari´t´ de la mani`re suivante, en s’aidant de repr´sentations comme sous-vari´t´s d’un espace
                                                      ee                    e
affine. Finalement, dans le cas contraire d’une vari´t´ abstraite, ces op´rations tiennent lieu de
  e
d´finition des espaces tangents.
    Une courbe param´tr´e d’une sous-vari´t´ S de E est une courbe param´tr´e de E qui est inclue
                         e e                ee                                e e
dans S, autrement dit qui est une application c de D dans S. Sa diff´rentielle en tout point t ∈ D
                                                                        e
            a                                           a              e                e
(sa vitesse ` tout instant) est un vecteur appartenant ` Tc(t) S (divis´ par une quantit´ de temps).
Un champ scalaire sur S est la restriction ` S d’un champ scalaire de E. Sa diff´rentielle en chaque
                                           a                                      e
x ∈ S est une forme lin´aire sur Tx S (restriction ` l’espace tangent de la diff´rentielle du champ
                           e                       a                              e
de E auquel il correspond).
    Par exemple, en choisissant un rep`re de E, chaque coordonn´e ´tant un champ scalaire sur
                                         e                            e e
E donne un champ scalaire sur S. La donn´e de ces champs scalaires sur S ´quivaut ` la donn´e
                                             e                                  e        a       e
de cette repr´sentation de S comme sous-vari´t´ de E. Une mani`re facile de construire d’autres
              e                                ee                    e
    e                                   ee                             a                   e
repr´sentations de S comme sous-vari´t´ d’espaces affines consiste ` prendre une repr´sentation
     e                                                               e      a         a
donn´e, donc une liste de champs scalaires modulo un choix de rep`re, et ` ajouter ` cette liste un
                                                       e
ou plusieurs autres champs. Ou autrement dit, consid´rer le graphe de cet autre champ scalaire sur
              ee                         e                       ee                        e
une sous-vari´t´ comme une autre repr´sentation de cette vari´t´. Ceci donne une repr´sentation
                                                                   e
dans un espace affine ayant une dimension de plus que celle de d´part.
              e
4.2. Notion d’´quilibre
                                                                                   e e
    Introduisons une grandeur physique (autrement dit une droite vectorielle) appel´e ´nergie (ses
ee                       e    e
´l´ments sont les quantit´s d’´nergie).
Equilibre d’un point
     Consid´rons un point mat´riel libre de se d´placer dans une vari´t´ E et soumis ` des forces
             e                   e                e                     ee                a
dues ` des causes ext´rieures fixes. Par exemple, E peut ˆtre une surface sur laquelle une bille
       a               e                                    e
                               a                                 e
est libre de rouler, soumise ` la pesanteur et au champ magn´tique d’un aimant fixe cach´ sous   e
                             e                                                               e
la surface. Ici, on ne s’int´ressera pas au mouvement de rotation de la bille sur elle-mˆme, qui
                                                   e                           e              e
pourrait aussi bien glisser, mais seulement au d´placement de son centre, r´duisant l’id´e de la
      a                      e e            e                                     a e
bille ` un point. Et plus pr´cis´ment, on ´tudiera la condition pour qu’elle soit ` l’´quilibre.
                                                                          e                 a
     Chaque force s’exprime sous la forme d’un champ scalaire V , appel´ le potentiel et ` valeurs
                   e
dans la droite des ´nergies (ou une droite affine correspondant, ceci pour exprimer que “le potentiel
         e      a                            e
n’est d´fini qu’` une constante additive pr`s”).
                              e                  e                                      a
     L’effet global d’un syst`me de forces donn´es par des potentiels est identique ` celui d’une
                                   e   a                                e
seule force dont le potentiel est ´gal ` la somme des potentiels des diff´rentes forces.
                           e                          e
     Il y a deux notions d’´quilibre qu’on peut consid´rer.
Equilibre stable. Dans une vari´t´ E munie d’une force de potentiel V , un point d’´quilibre
                                   ee                                              e
stable est un minimum local de V .
                                                                              u e
     En effet, une particule en mouvement ne peut pas passer par des lieux o` l’´nergie potentielle
       e        a e                    e         e
est sup´rieure ` l’´nergie qu’elle poss´dait au d´part. Donc en partant du voisinage d’un minimum
                         e
de potentiel sans autre ´nergie elle ne peut pas en sortir.
                       a                                              ee
     On remarque qu’` moins de se trouver sur un bord de la vari´t´, en un minimum local la
    e                          e e
diff´rentielle s’annule. Plus g´n´ralement:
Equilibre. Un point d’´quilibre de E muni d’une force de potentiel V est un point o` la diff´ren-
                         e                                                               u       e
                                  e                                 e
tielle de V est nulle. Un point d’´quilibre instable est un point d’´quilibre qui n’est pas stable.
                        e                                       e
    La justification n´cessiterait ici que le potentiel soit diff´rentiable deux fois, car pour que la
                                        a                                     e           a e
variation soit trop faible pour fournir ` la particule qui commencerait infinit´simalement ` s’´carter
                     e        e                              e                                   e
de cette position l’´nergie n´cessaire pour achever de s’´loigner nettement en un temps limit´, il

                                                 29
                 e                                               e
est quasiment n´cessaire (et suffisant) que cette variation ne d´passe pas en ordre de grandeur le
    e
carr´ de la distance.
                                                        a
    Par exemple, pour un point sur un relief soumis ` la pesanteur, le fond d’un creux est une
            e                                                                     e
position d’´quilibre stable, tandis qu’un sommet et un col sont des positions d”´quilibre instable.
                   u                                           e
    Dans le cas o` plusieurs forces s’exercent, la condition d’´quilibre en un point est l’annulation
          e                                                e     a                    e
de la diff´rentielle de la somme des potentiels, qui est ´gale ` la somme des diff´rentielles des
                e
potentiels au mˆme point.
Force. Dans une vari´t´ E o` r´side une force de potentiel V , la force qui s’exerce sur une particule
                       ee   u e
situ´e en un point donn´ de E se d´finit comme ´tant moins la diff´rentielle de V en ce point. La
    e                   e          e            e                    e
             e                                             a
condition d’´quilibre d’une particule en un point soumise ` plusieurs forces est que la somme de
ces forces soit nulle.

                   e
Equilibre d’un syst`me
                         e            e                          e         e
    On imagine un syst`me comme ´tant un assemblage de mat´riaux d´formables pouvant ˆtre      e
        a              e                                   e
soumis ` des forces ext´rieures, qu’on peut imaginer comme ´tant des champs ou l’effet de contacts
                  e        e            e a
avec d’autres mat´riaux d´formables li´s ` des supports fixes. (En fait, il se trouve qu’en physique
                                                        e                                 e
fondamentale, les champs se comprennent comme des d´formations de sortes de milieux ´lastiques
                                                              e
dans l’espace-temps qui interagissent par contact avec la mati`re).
                                                                              e
Espace de configuration. On appelle espace de configuration d’un syst`me l’ensemble des ma-
  e                     e          e                     e e
ni`res dont il pourrait ˆtre dispos´ dans l’espace (appel´es ´tats), sans tenir compte de la question
        e
de son ´quilibre.
                            ee                                  e                        e
     C’est souvent une vari´t´ de dimension infinie. Chaque ´tat serait en principe r´alisable, soit
                  ea                   e          e
en tant que clich´ ` un instant donn´ d’un syst`me en mouvement, soit en ajoutant au syst`me       e
                    e             e                                                 e
d’autres forces ext´rieures ajust´es en sorte d’annuler exactement les forces pr´sentes.
                                                   e                   e     a          e
     Cette notion permet de ramener la notion d’´quilibre d’un syst`me ` celle de l’´quilibre d’un
                                    a                          e
point que nous avons introduite, ` savoir un point qui se d´place dans l’espace de configuration.
                                            e                                      a
Les forces s’expriment par des potentiels d´finis sur l’espace de configuration, ` savoir la mesure de
  e         e                   e          e           e                         e
l’´nergie pr´sente pour chaque ´tat du syst`me, et se r´partissent en deux esp`ces: les forces internes
                          e                             e         e    a       e            e
d’une part, les forces ext´rieures d’autre part (dont l’´nergie r´side ` l’ext´rieur du syst`me).
                          e
4.3. Bilans des forces ext´rieures
                                                                                     e
       Nous allons voir maintenant comment on peut faire un bilan des forces ext´rieures qui exprime
                    e           e
une condition n´cessaire d’´quilibre en oubliant les forces internes. L’espace tangent en un point
                                   e                                                          e
de l’espace de configuration repr´sente l’ensemble des petites modifications ou vitesses d’´volution,
       e             e    a            e        e                                   e
de l’´tat du syst`me ` partir d’un ´tat donn´. Les forces sont des formes lin´aires sur cet espace,
                      e                                                         e          e
et la condition d’´quilibre est que leur somme soit nulle. Une condition n´cessaire d’´quilibre est
                                      a                        e                       e
que la somme de leurs restrictions ` un sous-espace donn´ soit nulle. Les forces int´rieures peuvent
         e         e                                  a
alors ˆtre oubli´es si on sait que leurs restrictions ` ce sous-espace sont toujours nulles.
                       ıt            e                      e
       Or, on connaˆ des types d’´volutions d’un syst`me suivant lesquels les forces internes ne
                            a
peuvent pas agir, c’est-`-dire que leur potentiel y demeure constant: ce sont les mouvements qui
       e                      e                           e                                e
ne d´forment pas le syst`me (et n’affectent pas son ´tat interne) parce qu’ils sont d´finis par un
  e               e e
d´placement g´om´trique de l’espace physique (translation ou rotation), comme celui d’un solide
     e
ind´formable. Formalisons cela.
                                 e
       Soit G le groupe des d´placements de l’espace physique, ou encore une de ses sous-vari´t´s   ee
                ee                         e      e                     e
contenant l’´l´ment neutre Id (l’identit´, le d´placement qui ne d´place rien). C’est une vari´t´.  ee
Fixons un ´tat x de l’espace de configuration E. Soit alors l’application diff´rentiable de G dans E
              e                                                                  e
      a         e                   e                                e             a
qui ` tout d´placement associe l’´tat obtenu en appliquant ce d´placement ` x. En la composant
avec un champ de potentiel V sur E, on obtient un champ de potentiel VG d´fini sur G. Lae
diff´rentielle en Id de cette application de G dans E est une application lin´aire de L = TId G vers
     e                                                                          e
Tx E. On dit que L est l’alg`bre de Lie de G si G est un groupe. La compos´e de cette application
                                e                                                 e
    e                                    e
lin´aire par la force (comme forme lin´aire en x) co¨   ıncide avec la force de potentiel VG en Id.
                                                e             e          e
       Ainsi, on pose alors comme condition n´cessaire d’´quilibre, l’´quilibre de Id dans G soumis
aux forces de potentiels VG .

                                                  30
                                                                                      a
     L’argument plus haut se traduit par le fait que le potentiel sur G correspondant ` toute force
                                         e
interne est une constante, et donc sa diff´rentielle en Id est nulle.
                                                    e              e a          e
Torseur d’une force. Le torseur d’une force ext´rieure appliqu´e ` un syst`me dans un ´tat      e
     e                  e             e                             e               e e
donn´, est la forme lin´aire sur l’alg`bre de Lie du groupe G des d´placements g´om´triques de
                                                                      e           e
l’espace physique, construite comme force de potentiel VG en Id (oppos´e de la diff´rentielle de VG )
  e
d´fini ci-dessus.
                             e             e                             e
      Ainsi, la condition n´cessaire d’´quilibre du bilan des forces ext´rieures est que la somme des
torseurs de ces forces soit nulle.
                 e e                                                                      a
      On peut g´n´raliser cette notion au cas du torseur d’un lien rigide, qui consiste ` interdire tout
               a                        e
mouvement ` une partie du syst`me (un bord, un point, un axe. . . ) qu’on appellera le support
                         e                   e
de ce lien. Le probl`me est que les d´placements qui permettaient de calculer le torseur sont ici
interdits, et que cette force ne s’exprime pas par un potentiel. Alors, on peut quand mˆme la       e
                 e                        a                                        e        a e
calculer d’apr`s les forces internes, ` deux conditions. D’abord, que le syst`me soit ` l’´quilibre.
Ensuite, qu’au voisinage du support il n’y ait pas d’autres liens rigides qui contraignent le syst`me, e
                               e                                e                     e
et que les autres forces ext´rieures qui s’y exercent soient n´gligeables. En effet, l’´quilibre implique
                             e        e                                 a
que la force du lien est ´quilibr´e par les forces internes voisines, ` condition qu’elle ne soit pas
                           e                           e
directement compens´e par d’autres forces ext´rieures qui ne passeraient pas par l’int´rieur du  e
     e
syst`me.
                                                                                            e
      Voyons donc comment reconstituer le torseur de la force du lien rigide sur le syst`me, en sup-
                    e                         e
posant connue l’´nergie interne du syst`me en toute circonstance, et appliquons cette connaissance
         u                                      e                      a        e            e
au cas o` le support du lien subirait un d´placement, contrairement ` ce qui ´tait suppos´ au d´part.e
Remarquons que cette connaissance est en fait comprise dans celle des effets de mouvements con-
         a            e                            e                                     e
formes ` l’hypoth`se, puisqu’il s’agit de l’´nergie interne qui est invariante par d´placements, et
                      e                                               e              e
donc l’effet d’un d´placement du support seul avec son voisinage ´quivaut au d´placement inverse
                   e                    a
du reste du syst`me par rapport ` ce support.
                                          e                      e
      Regardons donc la variation d’´nergie interne du syst`me lorsque seul le voisinage imm´diat     e
                                        e                                                e      e
du support suit ce mouvement, r´alisant une transition lisse avec les parties plus ´loign´es (celles
                                    e
soumises aux autres forces ext´rieures) qui ne suivent pas. Le torseur force du lien rigide sur le
     e                  e                         e                         e                 e
syst`me, donc, se d´duit des variations d’´nergie interne du voisinage r´sultant d’un d´placement
                                                                                 e
du support, par le fait que le support doit se trouver dans sa position d’´quilibre entre la force
    e              e                               e                                      e
ext´rieure donn´e par le lien et la force int´rieure du voisinage du lien dans le syst`me: la somme
                                    e                    e                             e
de ces deux torseurs de forces ´tant nulle (appliqu´es au support), elles doivent ˆtre oppos´es.   e
                                 ıt                            e
      Remarquons qu’apparaˆ ainsi le principe d’action-r´action entre deux objets distants inter-
                           e                 e              e             e
agissant par l’interm´diaire d’un syst`me (pouvant ˆtre un milieu ´lastique ou un champ), ces
        e                                            e                                       e
objets ´tant vus comme deux parties du syst`me: cette interaction s’exprime par la mˆme ´nergie    e
               e                                                             a
interne qui d´pend des mouvements de ces deux objets l’un par rapport ` l’autre. Le torseur force
                               a                  e                 e                    a
que A exerce sur B se lit ` la variation d’´nergie quand B se d´place par rapport ` A, et celui de
                                        a                    e                a
la force que B exerce sur A se lit ` celle quand A se d´place par rapport ` B. La somme des deux
             e                                             e     e
est nulle, l’´nergie interne ne variant pas quand le mˆme d´placement s’exerce sur le tout.
      On a aussi:
   e e                    e    a e
Th´or`me. Dans un syst`me ` l’´quilibre, Le torseur des forces traversant une hypersurface S
(surface de dimension n − 1 dans un espace de dimension n) ne d´pend que du bord de S.
                                                               e
                                                            e             e
     En effet, soient deux surfaces disjointes ayant le mˆme bord. V´rifions que le torseur des
                             e                                                      e
forces les traversant sont ´gaux (le cas de deux surfaces non disjointes s’en d´duit en prenant
                                  e            u
une succession de surfaces de mˆme bord o` deux surfaces successives sont disjointes). Ces deux
surfaces enferment un volume, et on peut alors faire le bilan des forces entrant dans ce volume.
                                                                                          e
Le torseur des forces entrant dans ce volume vaut celui des forces entrant par la premi`re surface,
                                             e          e           e                   e
moins celui des forces sortant par la deuxi`me. Le r´sultat vaut z´ro puisqu’il y a ´quilibre, donc
                                             e
les forces traversant les deux surfaces sont ´gales. En toute rigueur, pour que ces notions aient un
                                                                             e        e
sens il faudrait que le voisinage de ce bord soit vide afin de pouvoir consid´rer la d´formation de la
           e                   e                                         a
partie int´rieure quand on d´place les deux surfaces l’une par rapport ` l’autre, mais on admettra
          e                    e    a                                      e    e
que les r´sultats sont bien d´finis ` la limite quand on fait tendre vers z´ro l’´paisseur de ce vide.

                                                  31
                                                                                e
Remarque. La mesure de cette force traversant une hypersurface, qui se d´duit des variations
   e                                   e
d’´nergie interne de la partie du syst`me contenu dans un volume dont cette hypersurface est une
                               e
partie du bord, quand on la d´place par rapport au reste du bord, ne se retrouve pas inscrite dans
                                                                e           e
le potentiel sur l’espace de configuration du plus grand syst`me non bord´ par elle. En effet, pour
                           e                                             a
l’y retrouver il faudrait d´placer les deux surfaces l’une par rapport ` l’autre du point de vue de
                        e               e
l’espace du volume int´rieur (pour d´former ce volume) sans affecter leurs dispositions du point
                        e                                       e                 e e e
de vue de l’espace ext´rieur, ce qui n’est possible qu’en th´orie de la relativit´ g´n´rale. Ce qui
                                               e e e                                              e
explique d’ailleurs pourquoi c’est la relativit´ g´n´rale qui exprime un champ (le champ de gravit´)
                                                                              e            e
comme naturellement induit par la disposition de la somme des forces mat´rielles elles-mˆmes.
                                 e
     Abordons maintenant les d´tails de la forme du torseur force. Comme le groupe des rotations
              e       e
est compliqu´, on d´compose en pratique le torseur d’une force en les deux notions suvantes,
                               e     a                                                 e
restrictions de cette forme lin´aire ` deux sous-espaces vectoriels de L qui sont suppl´mentaires:
   e                                e                          e              e a
R´sultante d’une force. La r´sulante d’une force ext´rieure appliqu´e ` un syst`me est la   e
          e                                                                           e
forme lin´aire sur l’espace des vecteurs de l’espace physique construite de la mˆme mani`re par e
                                                  a      e
l’identification naturelle de cet espace vectoriel ` l’alg`bre de Lie du groupe des translations (espace
des vitesses de translation).
                                                                           e
    Pour le dire intuitivement, ceci assemble par translation dans le mˆme espace vectoriel des
                                               e                         e
vecteurs de l’espace physique, les forces exerc´es en tous points du syst`me pour en faire le bilan.
                                        a               e                  e
Moment d’une force par rapport ` un point. Mˆme construction appliqu´e au groupe des
                                   e
rotations autour de ce point (les d´placements qui laissent fixe ce point).
                                e                                  e                 e
     En effet, une vitesse de d´placement solide quelconque se d´compose de mani`re unique comme
                                      e      a                             e
somme de la vitesse de translation ´gale ` la vitesse d’un point par ce d´placement, et de la vitesse
                                    e                    e
de rotation autour de ce point d´finie par la partie lin´aire de ce mouvement.
                                                            ıtre
     Ces constructions semblent faire uniquement apparaˆ les forces comme des formes lin´aires,  e
` l’encontre de l’usage courant de repr´senter les forces par des vecteurs. Bien sˆr, les notions de
a                                         e                                           u
                         e
vecteur et de forme lin´aire se correspondent rigoureusement par le produit scalaire. Ce qui les
                                                   e                             a
distingue c’est intuitivement la direction qu’ils d´signent, orthogonale l’une ` l’autre: dans l’espace
                                           e
euclidien de dimension 3, un vecteur d´signe une direction de droite tandis que la forme lin´aire  e
                   e                                              e
correspondante d´signe celle de son plan orthogonal. En m´canique classique, le vecteur force
       ıt                     e                  ee                                 a
apparaˆ sous la forme exp´rimentale de l’acc´l´ration d’une particule soumise ` cette force.
                                                                                        e e
     La question qui se pose alors est: la direction d’un vecteur force joue-t-elle g´om´triquement
     o                     e                e                                               e e
un rˆle dans la notion d’´quilibre ? La r´ponse est oui: il se trouve que dans la forme g´om´trique
                             a
des torseurs par rapport ` l’espace physique, la direction importante est celle du vecteur de la
 e                                  e                            e
r´sultante et non de la forme lin´aire. Cela ne doit pas nous ´tonner, puisque la notion de torseur
         e                        e                    e          e e
est fond´e sur le groupe des d´placements, qui repr´sente la g´om´trie euclidienne de l’espace.
                                e                         e e                             e
     Nous allons maintenant ´tudier en particulier la g´om´trie des torseurs et leur ´quilibre dans
                                                      u                       ıt.
le cas du plan, qui est la plus petite dimension o` cette notion apparaˆ Nous ne l’´tudieronse
                                                                        e
pas en dimension 3 comme voudrait l’usage, puisque ces efforts suppl´mentaires dans cet autre cas
                            e                                                         e e
particulier plus compliqu´ cacheraient le fait que c’est finalement une notion g´n´rale qui serait
                                               a                             e
traitable plus simplement en tant que telle ` condition d’introduire au pr´alable le calcul tensoriel,
                                        e
ce que nous ne ferons pas dans l’imm´diat.
      e  e
4.4. G´om´trie des forces dans le plan
      e
    D´crivons d’abord la forme des torseurs dans le plan.
                             e                                                           a
    Un torseur peut se repr´senter sous forme du champ des moments, application qui ` tout point
                                                    a                 a
du plan associe le moment du torseur par rapport ` ce point. C’est-`-dire qu’on restreint le torseur
                       e             e                            e             a      e
en tant que forme lin´aire sur l’alg`bre de Lie du groupe des d´placements, ` l’alg`bre de Lie du
groupe des rotations autour de chaque point. Ce faisant, on ne perd aucune information, et ceci est
            e e          a                                                  e
valable en g´n´ral au-del` du plan en toute dimension, car les vitesses de d´placements quelconques
s’obtiennent en ajoutant des vitesses de rotations: d’abord comme on a dit, une rotation avec une
                                                                                                 e
translation, puis une translation s’obtient en ajoutant deux vitesses de rotations de parties lin´aires
      e                        e
oppos´es mais de centres diff´rents.

                                                  32
    Dans le plan, le moment en un point est simplement un scalaire, parce que le groupe des
rotations autour d’un point est de dimension 1. Ces rotations se mesurent par leur vitesse angulaire,
a
` condition de choisir une orientation du plan (un sens de rotation). Donc, le champ des moments
                                   a
d’un torseur est l’application qui ` tout point associe la puissance fournie par la force lors de la
                             a                                          e                 e
rotation de centre ce point ` la vitesse angulaire d’un radian par unit´ de temps (le r´sultat est
       e a       e
homog`ne ` une ´nergie).
    Quelle est alors la forme du champ des moments d’un torseur ?
                                                  e                   e                 e
Torseurs du plan. Une orientation du plan ´tant choisie, l’alg`bre de Lie des d´placements
                   a                           ee
du plan s’identifie ` l’espace des points pond´r´s du plan; le torseur d’une force dans le plan se
    e
repr´sente par une forme affine (application affine du plan dans une droite vectorielle, ici l’ensemble
             e  e                           e             e              e
des quantit´s d’´nergie), dont la partie lin´aire est la r´sultante tourn´e d’un angle droit dans le
sens direct.
                e       e       e
    Ces deux ´nonc´s sont ´quivalents, puisque l’espace des formes affines et celui des points
     ee
pond´r´s sont le dual l’un de l’autre.
                     e                                                        c
    On pourrait d´montrer cela abstraitement, mais pour donner un aper¸u plus concret de la
                                                                                e
situation nous allons la regarder sur l’exemple fondamental d’une force exerc´e en un point. Soit
                       e                 e                              e                a
donc une force donn´e par une forme lin´aire f de l’espace physique, n’´tant sensible qu’` la vitesse
                e             e            e        e            e     a
d’un point mat´riel M donn´ dans le syst`me. Sa r´sultante est ´gale ` f . Calculons le moment de
                           a
cette force par rapport ` tout point O. Soit r la rotation vectorielle d’un angle droit dans le sens
                                                                              e
direct suivant l’orientation choisie du plan. La rotation d’un radian par unit´ de temps autour de
                                                                 −
                                                                −→
                             ıne
O dans le sens direct entraˆ le point M suivant la vitesse r(OM ), donc la puissance fournie par
                                                                    −
                                                                   −→
          e           e                             a
f au syst`me, qui d´finit son moment par rapport ` O, vaut f (r(OM )), soit en appliquant encore
                     −→−
                                               e
r sur le tout, r(f )(M O). On trouve ainsi le r´sultat: le champ des moments est l’application qui
                           −
                          −→
` tout O associe r(f )(M O). C’est donc la forme affine s’annulant en M et de partie lin´aire r(f ),
a                                                                                        e
            e                  e
qui est la r´sultante f tourn´e d’un angle droit.
                                                                                      a
    D’autre part il est naturel que l’ensemble des vitesses de rotations s’identifie ` l’espace des
             ee              u                            ee
points pond´r´s du plan, o` la position d’un point pond´r´ correspond au centre de la rotation et
                         a
sa masse correspond ` la vitesse angulaire.
                        e                                                           a
    Nous allons compl´ter cette description par celle de la transmission des forces ` travers les
    e
syst`mes, sachant que les forces se transmettent uniquement de proche en proche, et qu’en tout
                                                    a
point le torseur de la force qui est transmise par l` s’annule en ce point. Voici:
    e e                                       e                                e
Th´or`me. Toute disposition des forces en ´quilibre dans le plan peut se d´crire au moyen d’un
                    e    a              e                             e      e
champ scalaire f (d´fini ` l’addition pr`s par une forme affine) d’apr`s la r`gle suivante: quels que
                                                                               a
soient deux points M et N du plan, le torseur de la force traversant de droite ` gauche toute courbe
reliant M ` N se repr´sente par la diff´rence T (N ) − T (M ) des formes affines dont les graphes sont
           a          e               e
les plans tangents au graphe de f aux points M et N .
          e e               e
     Ce th´or`me n’a pas d’´quivalent pour des forces en dimension plus grande.
            ea      a              e e          a e
     On a d´j` vu ` la section pr´c´dente qu’` l’´quilibre, le torseur d’une force traversant une
                                             e                 e    e
courbe (cas particulier d’hypersurface) ne d´pend que des extr´mit´s de la courbe.
     Fixons une origine O dans le plan. Pour tout point M , soit T (M ) le torseur de la force
                      a                                 a                     e
traversant de droite ` gauche toute courbe reliant O ` M . Alors il est imm´diat que pour tous
points M et N , le torseur de la force traversant toute courbe reliant M ` N vaut T (N ) − T (M ).
                                                                         a
                                                 a                          a
Il suffit en effet de prolonger une courbe de O ` M par une courbe de M ` N pour obtenir une
             a
courbe de O ` N .
     Posons maintenant pour tout M , f (M ) = T (M )(M ) (le moment en M de T (M )). Il ne reste
    a e
qu’` v´rifier que le graphe de T (M ) est le plan tangent en M au graphe de f .
     Calculons la valeur de f en un point N voisin de M :

                             f (N ) = (T (N ) − T (M ))(N ) + T (M )(N ).

Or T (N ) − T (M ) est le torseur des forces traversant une courbe reliant M ` N . Non seulement ce
                                                                             a
                                  a             e                                 u
torseur est petit correspondant ` la proximit´ des deux points, mais la droite o` il s’annule passe

                                                 33
                                            u
par le voisinage commun de ces points, d’o` le fait que sa valeur en N est un infiniment petit du
                                                   a                a
second ordre. En effet, son moment par rapport ` N correspond ` l’effet des rotations de centre
N qui se traduisent par une faible vitesse sur la petite courbe reliant ces points directement dans
leur voisinage.
                                                                                               e
     Ainsi, T (M )(N ) approxime f (N ) au premier ordre au voisinage de M , ce qu’il fallait d´mon-
trer.
      e
4.5. M´canique relativiste, introduction
                                 e                   e
      Abordons maintenant l’´tude de la m´canique relativiste. En un certain sens nous en avons
  ea                        e             e                                e
d´j` tout dit: c’est la th´orie de l’´quilibre que nous venons d’´tudier, en employant dans le rˆle              o
                                a                                   e
d’espace physique l’espace ` 4 dimensions de la relativit´ restreinte. On remplace “syst`me” par        e
    e          e                                                     a e                 e
“sc´nario”, “´nergie” par “action”, et comme tout est ` l’´quilibre, la d´finition de l’´quilibre         e
                         e                 e               e e                       e
(annulation de la diff´rentielle de l’´nergie) est ´rig´e en principe, nomm´ le principe de moindre
action.
      Mais en fait, il reste plusieurs probl`mes. e
                e              e        a         e                     e e
      Un probl`me est de d´crire, ` l’int´rieur de ce cadre g´n´ral, quelles sont en particulier les
       ee      e
propri´t´s m´caniques des objets physiques qui se rencontrent le plus couramment en pratique,
a                          ee                                                  e              e
` savoir les particules ´l´mentaires ou non. Par mesure de simplicit´ on ne d´crira pas d’autres
                                                                            ee
choses comme les champs, en sorte qu’on ne verra que la notion ´l´mentaire de particule sans rien
   e                          e e                    e         e
pr´ciser de ce qui fait en r´alit´ la diversit´ des esp`ces de particules existantes.
                             a       e                               ee
      Or, comme il s’agit l` de d´crire au mieux les propri´t´s des objets physiques en eux-mˆmes              e
                                                e                                          e
sans s’occuper de leurs apparences exp´rimentales, le langage le mieux adapt´ pour l’intuition est
                                     e                   e       a                  e
le langage que nous avons appel´ le langage th´orique, ` savoir celui de l’´quilibre avec son ´nergie      e
                                      e
potentielle, et non celui de la m´canique relativiste. Il n’en reste pas moins que si ce langage est
       e                                                       e
adapt´, cela ne signifie pas que les choses soient r´ellement telles qu’elles semblent quand on les
  e
d´crit dans ce langage. Cela signifie qu’il y a une correspondance entre les concepts de la r´alit´            e e
a e                                                                e                            e
` d´crire et ceux qui nous sont familiers par notre exp´rience des situations d’´quilibre dans la
                                                                                  e
vie de tous les jours, et que nous choisissons d’utiliser cette familiarit´ pour exprimer ais´ment           e
             a e        a
les choses ` d´crire ` travers cette correspondance. Or, tout irait bien dans cette affaire s’il n’y
                                    e
avait qu’une seule bonne mani`re de faire cette traduction, par laquelle les description intuitives
            e                e               e                                                    e
puissent s’´laborer sans h´sitation. H´las, ce n’est pas le cas car il y a deux possibilit´s. Comment
                                                             e                    u
est-ce possible ? Entre deux traductions, la diff´rence consiste bien sˆr en une retraduction de
        e                         e                          e        e
la repr´sentation dans elle-mˆme. Ici, dans la th´orie de l’´quilibre c’est le signe de l’´nergie quie
s’inverse.
                             e e          e                       e                               e
      En effet, la notion g´n´rale d’´quilibre est conserv´e quand tous les signes des ´nergies sont
e                   e                        e                                        e
´galement invers´s. Seule la notion d’´quilibre stable est perdue et remplac´e par celle de l’´quilibre  e
                              e
le plus instable, celui de l’´quilibre sur les sommets de potentiels, ce qui, il faut le dire, constitue
       e          e              e        e                                e
malgr´ son extrˆme simplicit´ math´matique une gymnastique tr`s inhabituelle pour notre intuition
                 e                u                                 e
courante de l’´quilibre. D’o` la question ridicule en th´orie mais grave en pratique pour nous
                                      e
pauvres humains devant savoir g´rer au mieux les ressources de notre imagination: parmi ces deux
traductions possibles, y en a-t-il une qui soit meilleure que l’autre, et suivant quels crit`res ?    e
                                              e                                 e
      Dans la section suivante, nous d´velopperons une description th´orique qualitative des pro-
    ee     e
pri´t´s m´caniques des particules en termes d’une traduction choisie suivant le fait qu’elle induit
                    e                              e                              e
la plus grande fr´quence de situations d’´quilibre stable, en sorte de pr´server le confort de notre
                                                       e     e                         e
intuition. Ce confort sera d’autant mieux pr´serv´ que la description utilis´e se fera encore en ter-
              e e                                            e                         e
mes de la g´om´trie euclidienne de l’espace, en d´pit du fait que l’espace r´el est pseudo-euclidien
                                                                             e              e
et que pour cette raison il n’existe aucune correspondance compl`tement coh´rente et rigoureuse
                                   e e                      e
entre cette description et la r´alit´. On peut mˆme aller plus loin en disant que ce probl`me du           e
                    e e                          e                                   e
changement de g´om´trie relativise la d´finition d’un choix du signe de l’´nergie dans les descrip-
                                         a
tions, car elle consiste justement ` faire planer dans l’air un changement de signe qui remet en
                                                                         e                      e
question les relations habituelles entre les signes des quantit´s en jeu dans les ´tats d’´quilibre,    e
                                                     e       u           e
et leur rapport avec la notion de stabilit´. D’o` la difficult´ pour l’intuition ` appr´hender la a     e
     e                                  e                  e e
coh´rence d’une description donn´e lorsque la g´om´trie pseudo-euclidienne est prise en compte.
                                                                               e
      Puis, nous ferons quelques remarques sur la notion de stabilit´, montrant qu’` travers la     a

                                                       34
                          e           e                       e
correspondance entre th´orie et exp´rience elle se comporte ´trangement, en sorte qu’elle ne devrait
  e         e                   ee
mˆme pas ˆtre prise comme r´f´rence et que le “principe de moindre action” porte mal son nom.
                  e                                  e e             e                         e
    Enfin, nous ´tablirons rigoureusement les lois g´n´rales de la m´canique relativiste exprim´es en
                                e                                              e e          e
termes de leur formulation exp´rimentale usuelle, comme traductions des lois g´n´rales de l’´quilibre
  e e            e                e a                                                     e
pr´c´demment ´tablies appliqu´es ` l’espace pseudo-euclidien suivant une certaine repr´sentation
  e                     e                              e                                        e
th´orique (dont la coh´rence vient du fait qu’elle ne r´utilise sans examen que ce qu’on a pu d´finir
                    e      e         e e
sans utiliser les sp´cificit´s de la g´om´trie euclidienne).
4.6. Description des particules
                                                             e                   ee    e
     Nous allons ici introduire une description th´orique des propri´t´s m´caniques des particules
                                            e
comme dans un espace eulicien, d´duite par traduction de leur comportement exp´rimental usuel      e
sans tenir compte des questions d’accords de signe ou autres coefficients de proportionnalit´ li´s `      e e a
                        e
la vitesse de la lumi`re.
                                               e                                       e
     Qu’est-ce qu’une particule ? Exp´rimentalement, c’est un point anim´ d’une vitesse rectiligne
                                         a
uniforme quand il n’est soumis ` aucune force; sa vitesse varie uniquement quand il est soumis `            a
des forces de somme non nulle (ni avant, ni apr`s).       e
                 e                                                                              e
     Traduit th´oriquement, cela donne une ligne qui est droite si aucune force ext´rieure ne s’exerce
                              e                  a u                               e
dessus, et qui est incurv´e uniquement l` o` s’exercent des forces ext´rieures de somme non nulle.
On trouve facilement dans la vie courante deux sortes d’ojets se comportant ainsi: les ficelles et les
e                                      e             e           a e                        e
´lastiques. Ces deux objets pr´sentent une r´sistance ` l’´longation. Celle de l’´lastique est variable
                                                                                        e
tandis que celle de la ficelle est totale, pouvant se voir comme la limite d’un ´lastique dont la raideur
                                               e                    e          a
tend vers l’infini. Par contre ils ne pr´sentent aucune r´sistance ` la courbure contrairement au fil
                                  e                         a
de fer. Comme une telle r´sistance permettrait ` la courbure de se prolonger en dehors du strict
                                         e                          a                     e
lieu d’application des forces ext´rieures contrairement ` ce qu’indique l’exp´rience des particules,
                                           e
elle ne sera pas admise et le mod`le des fils de fer sera donc exclu.
                                          a e
     La seule question qui reste ` pr´ciser dans cette description est donc celle de la raideur de
  e                           e            a e
l’´lastique, qui est sa r´sistance ` l’´longation. Cette question se formule en termes du champ
                                                       e                                  e
de potentiel sur l’espace de configuration: l’´nergie de chaque partie d’un ´lastique s’exprime en
                                                               e
fonction de sa longueur. La force de tension de l’´lastique en chaque lieu est alors la d´riv´e de     e e
  e                       a                                       e
l’´nergie par rapport ` la longueur. Dans le cas d’une r´sistance infinie (un fil), la relation s’exprime
                                           e
en disant que la longueur est ind´pendante de la tension. Alors, qu’en est-il pour une particule ?
                               a                               e                              e
Que dire de sa tension, ` quoi correspond-elle exp´rimentalement ? Pour un ´lastique de tension
      e                          e                                                        e
donn´e faiblement incurv´ en un lieu par une force, la courbure (ou la diff´rence de direction de
                                                                                 a
part et d’autre du lieu d’application de la force) est proportionnelle ` cette force, ce qui correspond
           e                    a               ee                          a               e
bien exp´rimentalement ` l’effet d’acc´l´ration proportionnel ` la force exerc´e. Ainsi s’accordent
                e                    e                                e
les notions th´orique et exp´rimentale de force comme ´tant proportionnelles. Plus pr´cis´ment,       e e
             e                               a         e                e
la force exp´rimentale correspond ` la densit´ de force th´orique par rapport au temps.
                           e                                 e              e               e
     Ensuite, pour un ´lastique de courbure donn´e, la force n´cessaire pour ´quilibrer cette cour-
                               a                    e                     e
bure est proportionnelle ` sa tension, de mˆme que la force n´cessaire pour donner ` une particule a
         ee                 e                           `
une acc´l´ration donn´e est proportionnelle a sa masse. Ainsi voit-on que la tension th´orique          e
                        e                                 a
d’une particule repr´sente (est proportionnelle `) sa masse exp´rimentale.   e
                                   e
     Or, que nous dit l’exp´rience sur les masses des particules et leurs variation ? Elle nous dit
                                    e                  ee
que la masse de chaque esp`ce de particule ´l´mentaire est une constante universelle. On a donc
         a     e                                         e
affaire ` un ´lastique dont la tension est ind´pendante de sa longueur ! Ainsi son ´nergie est        e
                   a
proportionnelle ` sa longueur.
                                         e     e
     Connaissons-nous un tel ph´nom`ne dans la vie courante ? S’il n’est pas facile de trouver une
                                                               e e                   e
substance visqueuse qui se comporte ainsi assez pr´cis´ment quand on l’´tire dans une dimension,
              ıt      e
on en connaˆ un ´quivalent en dimension 2: la surface de l’eau ou d’une bulle de savon v´hicule         e
aussi une tension superficielle constante, qui est cette fois une tension par unit´ de longueur due
                         a                e               e
bord, et correspond ` une densit´ surfacique d’´nergie constante. En fait, comme on le verra plus
                     e                               e                                    e
loin, cette densit´ surfacique constante d’´nergie dans sa description exp´rimentale correspond
   e              a                                        e        e     e
th´oriquement ` la composante temporelle du mˆme ph´nom`ne de surface tendue en dimension 3,
                                            e
dans lequel cette tension ne privil´gie aucune des directions de son extension dans l’espace-temps
                                                   e
pseudo-euclidien. En effet, cette uniformit´ s’exprime par le fait qu’il n’y a pas de notion de vitesse

                                                     35
                                                                              e
d’une partie ou d’un bord coulissant dans la surface, qui ait des effets m´caniques mesurables dans
la surface. Et donc, que les contractions et dilatations n’ont pas d’effet sur la tension.
            e       e    e
     Le mˆme ph´nom`ne existe aussi en dimension 4, sauf qu’en l’occurence celui qu’on observe
           e                                                  e
semble s’´tendre universellement sans avoir aucune fronti`re sur laquelle sa tension puisse s’exercer:
c’est la constante cosmologique.
                                   ee                               e                           e
     On peut expliquer ces propri´t´s des particules de la mani`re suivante: Prenons un tel ´lastique
                         e a          e    e         e
(une particule) attach´ ` ses extr´mit´s (sa cr´ation et sa fin), saisissons-en un de ses points
 e e                                               e                e        e e
(´v`nements) et tirons-le dans la direction de l’´lastique. Le r´sultat pr´c´dent s’exprime ici par le
                                               e
fait que cet acte de tirer ainsi un point de l’´lastique dans le sens de la longueur n’implique aucune
                  e                                                       e                       e
transmission d’´nergie par celui qui tire. Seule la partie avant de l’´lastique transmet son ´nergie
a                e
` la partie arri`re.
                       e              ıt
     Finalement, ce r´sultat apparaˆ naturel: car en saisissant un point et en le tirant, qu’avons-
                                                         e e
nous fait finalement ? En quoi le fait de saisir tel ´v`nement et de l’amener vers tel autre de la
   e                        e                                              e      e
mˆme ligne d’univers diff`rerait-il du fait de saisir cet autre point d`s le d´part ? Car il s’agit l` a
         e
de la mˆme particule !
          e                                                                             e
     Un ´lastique habituel est fait d’un nombre fini d’atomes, avec des nombres pr´cis d’entre eux
                                                                             u
de part et d’autre du point qu’on saisira, en sorte que le choix du lieu o` le saisit a une implication
                 e
physique sur l’´lastique, qui intervient lors de l’allongement que peuvent ensuite subir les parties
      e                      oe
de l’´lastique de chaque cˆt´ de ce point. Mais il ne se passe rien de tel dans une particule: la
         e e                                           a     e
forme g´om´trique de chacune de ses parties suffit ` la d´crire physiquement en toute circonstance.
               e           e       e         e      e                         e
     On peut ´galement r´interpr´ter ce ph´nom`ne en termes de rugosit´: pour que saisir un point
     e                e               e           e                                               e
de l’´lastique et le d´placer puisse r´ellement d´placer quelque chose dedans pour modifier l’´tat de
                                                                                e
la particule et donc son potentiel, il faudrait qu’il y ait quelque chose d’irr´gulier dans sa longueur,
          e
que ce d´placement puisse affecter. Or, de cela il n’y a rien, puisque la particule est parfaitement
lisse.
             u                                    e
     Bien sˆr, dans une “grosse particule” form´e d’un grand nombre d’atomes, comme par exemple
un grain de sable, l’agitation thermique des atomes constitue dans la dimension temporelle une
        e                                                       e
rugosit´ sur l’appui de laquelle on peut tirer. La force th´orique qui prend alors appui sur cette
        e
rugosit´ pour tirer dans la dimension temporelle, et entraˆ       ıner une variation de tension (masse)
                              e                          e
entre les deux parties (pass´ et futur), s’appelle exp´rimentalement la transmission d’une quantit´    e
de chaleur vers ce grain.

Le spin
                                  e        ee e
     Citons pour finir la derni`re propri´t´ m´canique des particules, qui est leur spin. Mais en
                                                          a              ee e
fait, il n’est pas exact que ce soit encore vraiment l` une propri´t´ m´canique dont on puisse
                                               e                             e
rendre compte suivant l’expression de la m´canique classique (ou de l’´quilibre) que nous avons
         e        a e                                                      ee
employ´e jusqu’` pr´sent. En effet, le spin est par nature une propri´t´ quantique des particules,
               e                 e            e
qui met en d´faut certaines r`gles de la m´canique classique. Une attitude sage serait de passer
                                e    e e                e
simplement sous silence ce ph´nom`ne ´trange en le n´gligeant, ce que nous aurions le droit de faire,
         a e                e                                       e     e
puisqu’` l’´chelle de la m´canique classique qui est celle des ph´nom`nes que nous avons d´crit ete
 u                         e e       e           `
o` les approximations g´n´rales n´cessaires a la pertinence de cette description sont valables, le
           e           e                 e                        e
spin est ´galement n´gligeable. Malgr´ cela, nous allons pr´senter ici le spin dans les termes de
      e                                                 e                         e
la m´canique classique, et ce faisant nous allons pr´ciser en quoi cette m´canique classique par
                                  e   e
laquelle nous exprimons ce ph´nom`ne est mise en d´faut.e
                         e                     e                a                       u
     Voici: le spin repr´sente la torsion de l’´lastique, c’est-`-dire, dans le cas o` il suit une droite
                      e                               e      e                a
(la particule est isol´e), le moment de la force v´hicul´e par rapport ` cette droite elle-mˆme.    e
       e                            e     e                                   a
L’exp´rience quotidienne de ce ph´nom`ne est facile: on pend un objet ` un fil que l’on tient par
                                                          a                                       e
le haut, on roule le fil dans la main et l’objet se met ` tourner. L’explication de cette exp´rience
                                                                                e
courante est facile: le nombre de tours que l’on a fait subir au fil sur lui-mˆme se trouve enregistr´   e
             e                                  e                           a       e
dans les d´tails de la disposition de la mati`re que constitue le fil, et ` cet ´tat de torsion du fil
             e          e     e                     e
ainsi affect´ est associ´ une ´nergie, de laquelle d´rive le moment de la force qui fera tourner l’objet
suspendu.
                                                                                      a
     Seulement, dans le cas du spin d’une particule, cette explication tombe ` l’eau: son ´tat en e
          e        a e                                                            e
tant qu’´lastique ` l’´quilibre dans l’espace pseudo-euclidien n’est pas affect´ par le mouvement de

                                                   36
                           a                  e  e                                   e
torsion qu’on inculque ` une de ses extr´mit´s; pourtant, une puissance est r´ellement transmise
                                            e
dans ce mouvement. Au fait, peut-on r´ellement tenir et rouler ainsi la particule sur elle-mˆme ?   e
                                                     e
En un sens non, puisqu’il n’y a pas de rugosit´ dans la largeur de la particule, sur laquelle ce
                                                                                   e      e
mouvement pourrait s’exercer. Mais d’autre part, le moment de la force v´hicul´e est bien r´el.       e
En quoi peut-il alors consister ?
               e                          e
      Ce mod`le a cette part d’incoh´rence, qu’on peut “fournir une puissance au syst`me” par  e
                                                       e            e
un mouvement de son bord qui ne modifie pas l’´tat du syst`me. Cela peut se comprendre par
                      e              e          ee
le fait que cet exp´rience doit ˆtre interpr´t´e autrement, en disant que qu’il faut inclure dans
  e             e                        a                                     e              e
l’´tat du syst`me celui de son bord, ` savoir ici, dans quelle direction lat´rale est orient´e la main
             e                           e   e
qui tient l’´lastique en chaque extr´mit´. Cette main ne peut alors changer sa direction qu’en
                                       e                    u             e
tournant et fournissant donc une ´nergie, dans le cas o` cette prise d´finit la terminaison physique
                      e                                             a
de l’extension de l’´lastique. Si on fait faire un tour complet ` cette direction autour de l’axe de
  e                                e             e          e
l’´lastique, alors on lui a donn´ ou pris une ´nergie pr´cise correspondant au spin, en revenant `      a
  e                       a                                        e
l’´tat initial. Et c’est l` que l’insuffisance de ce mode de repr´sentation apparaˆ     ıt.
                             e                                            e              e        e
      Mais si au contraire l’´lastique se prolonge plus loin, on ne peut d´finir la mani`re dont l’´nergie
     e                     oe                                                               e
se r´partit de chaque cˆt´ d’une surface de coupe qu’en choisissant une direction lat´rale ` cettea
                                                                                   e    e
coupe. Si on coupe suivant cette direction, cela donne donne aux deux extr´mit´s issues de cette
                 e
coupe cette mˆme direction de prise.

         e             e
Stabilit´ et instabilit´, exemples
                                                           e      e                   e
      Nous allons aborder la question de la stabilit´ de l’´quilibre au sens th´orique en m´canique  e
                                                  e      e             e
relativiste, et son rapport avec la stabilit´ de l’´quilibre exp´rimental pour le cas d’un syst`me          e
   e                                                                             e
n’´voluant pas au cours du temps. La question est: y a-t-il des sc´narios qui constituent des
minima ou maxima d’action, et lesquels ? On verra en fait qu’en sortant de l’exemple restrictif
                                                                                          e
des particules il n’y en a pas, d’autant plus que cette action qui est minimis´e dans le cas des
                         a         e        e                                     u
particules correspond ` l’oppos´e de l’´nergie potentielle. (Ceci a bien sˆr l’avantage que la “force”
                         e                 e                                        e               e
issue d’une action se d´finit par la diff´rentielle de l’action et non son oppos´.) Comme les ´quilibres
     e                                e                                                       e
exp´rimentaux minimisent cette ´nergie, ils maximisent l’action par rapport aux sc´narios voisins
         e                                                                              e
de fixit´ par rapport au temps. Ceci ruine tout espoir de voir l’action minimis´e ou maximis´e en          e
  e e                              e e
g´n´ral (et le changement de g´om´trie n’y change rien).
                                        e                                    e
      [Quelques exemples sont donn´s ici; d’autres exemples compl´mentaires de ceux-ci pourront
e           e a
ˆtre ajout´s ` l’avenir]
                                 e                                                        e
      On pourrait imaginer un ´lastique (une particule) tendu au fond d’une vall´e de potentiel (on
                                   e                               e
suppose qu’il est lourd et ne d´colle pas). Ce serait un ´tat stable d’un point de vue th´orique,     e
                           e                                                              e   e
mais que donne-t-il exp´rimentalement ? Pour le voir, il faut attacher ses extr´mit´s ailleurs que
   e e                          e                                    e
pr´cis´ment au fond de la val´e. Alors, en parcourant la vall´e, que voit-on ? Qu’il reste quasiment
                a                 e           e
au fond sauf ` la fin (et de mˆme au d´but sym´triquement) o` il s’´carte de mani`re acc´l´r´e.
                                                         e               u      e               e       ee e
                  e                      e
C’est donc, exp´rimentalement, un ´quilibre instable.
                                                       e
      Veut-on faire le contraire et demander un ´quilibre stable d’un point de vue exp´rimental ? e
       e                                               e
Le sc´nario de la particule restant fixe et les sc´narios de la particule oscillant suivant n’importe
                                         e                   e                          e
quelle amplitude autour du point d’´quilibre stable ´tant tous permis par la m´canique relativiste,
                                            e        a                            e e
on peut transiter continument d’un sc´nario ` l’autre en fixant les extr´mit´s (la particule partant
                                 e
et finissant en sa position d’´quilibre). Alors l’action ne saurait varier puisque sa variation est
                           a         e
nulle au premier ordre ` toute ´tape de ce changement. C’est donc que la variation de l’action
      a e                    a                  e                e              e
due ` l’´cart par rapport ` la position d’´quilibre d’apr`s la force ext´rieure compense celle due `          a
                                                  e
l’oscillation (action interne). Le rapport pr´cis de compensation entre les deux est ce qui d´terminee
     e                                                  e                  e            e
la p´riode de l’oscillation: une variation plus serr´e du potentiel n´cessite pour ˆtre compens´e une   e
                      e
oscillation plus serr´e (rapide).
                                               e                       e      a                    e
      Donc, si on veut que le potentiel ext´rieur ressemble en th´orie ` son apparence exp´rimentale
                                    e
afin que les notions de stabilit´ se correspondent, il faut changer le signe par rapport ` ce que     a
               e           a e                     e     e
nous avons d´crit jusqu’` pr´sent et consid´rer l’´lastique tendu (la particule) comme un syst`me           e
                                         e                     e                            e e
instable, comme si on comprimait l’´lastique et qu’il r´siste du fait qu’il n’a pas d´cid´ de quel cˆt´      oe
il allait se plier. En fait, le point important ici n’est pas le signe de la tension mais l’instabilit´       e
                                            e            e                              ee
fondamentale de la particule comme ´lastique th´orique en prenant comme r´f´rence de stabilit´                e

                                                      37
                          e
celle du point de vue exp´rimental.
                                                           e
     C’est pourquoi, le “principe de moindre action” repr´sentant la minimisation de l’action des
  e                           e        ee                     a                       e a e
sc´narios d’une particule isol´e, il a ´t´ convenu de donner ` l’action le signe oppos´ ` l’´nergie
            e                     e          e           a e
au sens exp´rimental (le sens exp´rimental ´tant le seul ` d´terminer une correspondance entre les
                                       e                              u
deux tandis que la correspondance th´orique est au libre choix des goˆts et des couleurs).
      e
4.7. M´canique relativiste, formulation
                                                         e
     Etablissons enfin les lois fondamentales de la m´canique relativiste comme traductions exp´-         e
                            e
rimentales des lois de l’´quilibre.
                            e                            ee               ee
     Le point de vue exp´rimental part du choix d’un r´f´rentiel. Un r´f´rentiel s’exprime de mani`re  e
e                                                                            e                e
´quivalente par sa direction temporelle, ou par son vecteur temps not´ t (objet trait´ comme un
                                                              e
vecteur mais qu’il faut en fait multiplier par une quantit´ de temps pour obtenir un vrai vecteur
  e e                                           a
g´om´trique), ou son espace S orthogonal ` t (des vecteurs de l’espace usuel), ou la coordonn´e de   e
                 e                                                                        e
temps T (de mˆme direction que t au sens du produit scalaire), qui est une forme lin´aire multipli´e    e
                   e                              e                                         e
par une quantit´ de temps, autrement dit d´finie par les relations: (T (t) = 1 et une ´quation de S
est T (M ) = 0).
                                                                                        e
     Voici les conventions. On a un champ d’action sur l’espace de configuration th´orique. Choisis-
             e           e                                                       e               e
sons de repr´senter th´oriquement le principe de moindre action en termes d’´quilibre, en d´finissant
  e          e                e             e
l’´nergie th´orique comme ´tant l’oppos´e de l’action (ce qui dans notre approche constitue en fait
    e                      a              e                             e          e     a       e
la d´finition de l’action ` partir de l’exp´rience), et donc la force th´orique est ´gale ` la diff´rentielle
                       e                      e                   e                    a
de l’action. Nous d´finirons la force exp´rimentale comme ´tant la restriction ` S de la densit´           e
            e                                                          e
de force th´orique par rapport au temps. En effet, nous allons d´montrer que cela redonne toutes
           ee        e                                                       e
les propri´t´s exp´rimentales usuelles de la force, et ceci nous sert de d´finition des conventions de
          e                               e         e
signes th´oriques en fonction des donn´es exp´rimentales. (Ce choix de faire correspondre ainsi les
         e                 e
forces th´orique et exp´rimentale sans changement de signe semble en effet le choix de convention
le plus naturel).
Lois de conservation
                                                             e
     Nous allons obtenir les lois de conservation de la m´canique relativiste comme traduction
    e                                   e                          e      e        e           e
exp´rimentale des bilans des forces ext´rieures que nous avons pr´sent´s en m´canique de l’´quilibre,
                      ee                e             e        e               e
avec un choix de r´f´rentiel. Consid´rons un syst`me en ´volution (sc´nario). Chaque instant
 ee                           e           e
(´l´ment de la droite d’arriv´e de T ) d´finit un sous-espace de dimension 3 qui divise le sc´narioe
                     e                                                                e
en une partie pass´e et une partie future. Alors, l’objet qui “se conserve” se d´finit comme ´tant  e
                e                                 e                                e
le torseur (r´sultante et moment) des forces th´oriques que la partie pass´e exerce sur la partie
future.
                       e           e       e        e    e                              e     e
     En effet, consid´rons le syst`me th´orique d´limit´ par les deux faces parall`les d’´quations
                                              e                     e
T (M ) = t1 et T (M ) = t2 (avec t1 < t2 fix´s) et des parois lat´rales. L’annulation de la somme
                    e a         e       ee
des forces appliqu´es ` ce syst`me se r´´crit en disant que ce qui sort par t2 moins ce qui entre par
       e      a                                          e                                     e
t1 est ´gal ` la somme de ce qui entre par les parois lat´rales ou qui s’applique dans l’int´rieur du
    e                                 e                            e          e
syst`me. C’est donc la variation exp´rimentale de l’objet associ´ au syst`me entre les instant t1 et
            e                  e                         e            e
t2 qui est ´gale au torseur th´orique des forces appliqu´es au syst`me entre ces instants. Donc, la
  e e                                           e     e    a            e
d´riv´e par rapport au temps de cette quantit´ est ´gale ` la densit´ temporelle de l’exercice de ce
                                      e                                                        e
torseur. En particulier, cette quantit´ se conserve au cours du temps dans le cas d’un syst`me isol´   e
                a                                                                                e
(non soumis ` des forces autres que les forces internes apparaissant dans les coupes du syst`me en
t1 et t2 ).
            e      a e                 e                                             e
     Enum´rons ` pr´sent ces quantit´s qui se conservent dans le cas d’un syst`me isol´:    e
            e            e           e              e
     - La r´sultante th´orique f se d´compose exp´rimentalement en sa partie spatiale (restriction
      a           e        e                                     e
de f ` S) appel´e quantit´ de mouvement ou impulsion et not´e p, et sa partie temporelle appel´e     e
´nergie, d´finie par E = −f (t). La conversion de ce f = p − ET en vecteur par le produit scalaire
e           e
                                                                  E
en unit´ d’espace d´finit le quadrivecteur ´nergie-impulsion p+ c2 t. Sa norme en mesure temporelle
        e            e                      e
s’appelle sa masse
                                  a                                                       e
     - Le moment (par rapport ` une origine arbitraire de l’espace-temps), qui se d´compose en
                                                                            e                 e
deux parties: d’une part, sa restriction aux rotations spatiales appel´e le moment cin´tique qui
                                                                                 e
correspond aux rotations spatiales (celles de S), et d’autre part ce qui repr´sente le centre d’inertie
         e
du syst`me (voir plus bas).

                                                    38
                         a e                                            e
    Il ne reste plus qu’` v´rifier que tout cela redonne l’expression exp´rimentale usuelle des lois
        e
de la m´canique (classique ou relativiste).
      ea               e                e            e
    D´j`, on tire imm´diatement des d´finitions et r´sultats ci-dessus la
                                                       e e
Relation fondamentale de la dynamique. La d´riv´e par rapport au temps de l’impulsion
         e       e     a     e                       e               e          e
d’un syst`me est ´gale ` la r´sultante des forces ext´rieures appliqu´es au syst`me en cet instant.
               e           e                    e                       e                e
    La difficult´ dans la v´rification de ce r´sultat est de montrer l’´quivalence des d´finitions
   e                              e                     a        e
exp´rimentales des termes employ´s (force et impulsion) ` leurs d´finitions usuelles. Comme d’autre
                                                                                        e
part on admet la relation fondamentale de la dynamique comme principe physique, le r´sultat ci-
                                                 e                       e
dessus est en fait la confirmation de notre d´finition de la force exp´rimentale comme densit´     e
                      e                   a
temporelle de force th´orique, restreinte ` l’espace.
                                 e           a e           e
    Relions d’abord la force exp´rimentale ` l’´nergie exp´rimentale:
   e e                                          e     e             e
Th´or`me de la puissance. La puissance m´canique exp´rimentale exerc´e par une force f sur
       e   e        a                  e     a
un syst`me ´voluant ` la vitesse v est ´gale ` f (v).
                          e                e                 e
      Ici, la puissance d´signe la densit´ temporelle (ou d´bit) d’energie transmise par cette force;
    e                                                          e                         e
“m´canique” signifie que toute transmission d’une quantit´ de chaleur est retranch´e de ce bilan;
                             a                              e         e                e
v est un vecteur tangent ` l’espace de configuration des ´tats exp´rimentaux; ces ´tats sont d´finise
   e                       e                                e
th´oriquement comme ´tant les coupes possibles de sc´narios par un espace fixe S1 d’´quation    e
T (M ) = constante.
                                  e
      Le vecteur tangent v repr´sente la vitesse de variation des coupes successives suivant le temps
             e                                              a
T , ramen´es abstraitement par translation temporelle ` l’espace S1 . Mais nous allons l’utiliser
                             a                       e
comme vecteur tangent ` l’espace de tous les sc´narios par un prolongement arbitraire, dont on
                                                  e
demande seulement que dans ce mouvement th´orique, la coupe par S1 demeure contenue dans S1
et y co¨                                 e
         ıncide avec le mouvement exp´rimental de vitesse v invoqu´.   e
                     e                   e                               e                           e
      La force f repr´sente la force exp´rimentale; notons f la force th´orique correspondante exerc´e
                                                                  e
entre deux instants infiniment proches l’un de l’autre, divis´e par l’intervalle entre ces instants.
               e                                                             e
(Ceci compl`te donc f par les composantes temporelles de cette force th´orique, qui l’accompagnent
naturellement.)
                                                                         e           e      e
      Quelle est donc la puissance transmise par cette force au syst`me ? D’apr`s la d´finition de
l’´nergie exp´rimentale donn´e plus haut, cette puissance vaut −f (t) o` t repr´sente le mouvement
  e             e               e                                            u    e
   e                                                            e                 a
th´orique de translation dans la direction du temps, du pass´ vers le futur (et ` la vitesse du temps
                                 e     e                                   e
qui passe). Pour montrer l’´galit´ voulue, remarquons que la diff´rence entre ces termes vaut
                           e                                              e              e
f (t + v). Or t + v repr´sente un mouvement de coulissement du sc´nario sur lui-mˆme, auquel la
                 e                                      e                                e
force f doit ˆtre insensible si elle ne comporte pas d’´change thermique avec le syst`me. Bien sˆr, u
                                  e                  a           e
dans le cas contraire cette diff´rence correspond ` la quantit´ de chaleur transmise.
                        e                            e                         e          e
      Ainsi est retrouv´e la relation entre force et ´nergie constituant la th´orie de l’´quilibre dans
             e                       e
le cas exp´rimental, comme cons´quence du principe de moindre action.
Exemple de calcul concret
                                                  e     e
    Soit une particule de masse m immobile au d´part ´clatant en deux particules de masses m1
                       e
et m2 . Calculer leurs ´nergies E1 , E2 .
                                                     e
    Solution : soient p, p1 et p2 les quadrivecteurs ´nergie-impulsion des particules respectives.
                                                                e     e      e      e
Leur conservation s’exprime par p = p1 + p2 . La particule de d´part ´tant d´clar´e immobile, p
est dans la direction du vecteur temps; la composante temporelle de p1 ´tant E2 , on a le calcul
                                                                         e      c
                                                                                  1


suivant avec le produit scalaire en mesure temporelle :

                                                                      E1
                             m2 = p2 = (p − p1 )2 = m2 + m2 − 2m
                              2    2                      1
                                                                      c2
                                              c2
                                   =⇒ E1 =       (m2 + m2 − m2 )
                                                        1    2
                                              2m

Centre d’inertie
                  e                                  e
    Nous allons d´finir le centre d’inertie d’un syst`me en termes de la mesure du moment du
    e                       e                                                                  e
syst`me sur les rotations th´oriques d’axes de directions spatiales (axes de dimension 2 parall`les

                                                  39
a                                                                        e
` S). Notons que ces rotations ne forment pas un groupe (la compos´e de deux telles rotations
n’est pas une telle rotation). Mais rappelons que ce sont seulement les vitesses de rotation qui nous
importent.
                                           e e                                       c
     D’abord, donnons une description g´om´trique de ces rotations, en commen¸ant par les rota-
tions vectorielles (ou autrement dit, dont l’axe plan passe par un point origine fix´). e
     Voici: une rotation qui d´place le vecteur temps t suivant une vitesse w ∈ S, d´place tout
                                   e                                                      e
                            w·v
v ∈ S suivant la vitesse c2 t.
                     e                                                         e
     Ensuite, consid´rons l’ensemble des rotations d’axe contenu dans un mˆme espace de simul-
    e e                                               e      e e                  e
tan´it´ S(t) (espace euclidien de direction S form´ des ´v`nements d’une mˆme date t dans le
 ee                               ee
r´f´rentiel choisi). La propri´t´ commune de toutes ces rotations est le fait que la vitesse de tout
                         e       a                  e
point de S(t) est colin´aire ` t. Or il suffit de d´crire le mouvement de tout point de S(t) car le
                             e                                       e
reste de la rotation s’en d´duit (comme le mouvement d’un plan d´termine celui des solides pos´s   e
                           e                                                       e
dessus). Ainsi, on repr´sentera une telle rotation par l’application affine w d´finie sur S(t) qui
d´finit la vitesse de tout point N ∈ S(t) par l’expression − w(N ) t.
  e                                                             c2
                               e      e e                                                     e
     Nous venons ainsi de d´crire g´om´triquement un certain sous-espace vectoriel de l’alg`bre de
                      e                e          e
Lie du groupe des d´placements th´oriques. D´crivons maintenant la forme de la restriction d’un
         a                                              e
torseur ` ce sous-espace, autrement dit une forme lin´aire sur ce sous-espace.
                                            e
     A quoi ressemble donc une forme lin´aire sur l’espace des formes affines sur l’espace euclidien
                                  ee
S(t) ? C’est un point pond´r´ de S(t), autrement dit, ou bien un vecteur auquel s’applique la
           e                                     ee                    e                         e
partie lin´aire de w, ou bien un point G pond´r´ par une masse m, d´signant l’application lin´aire
     a
qui ` tout w associe mw(G). Attention: ce que nous appelons ici et plus bas la masse ne doit
     e                                                               e   e e
pas ˆtre confondu avec la notion de masse que nous avons invoqu´e pr´c´demment en parlant de
                                            e                 e                   e
la masse d’une particule, et qui est la d´finition commun´ment admise en m´canique relativiste
       e                                                  e               e
(elle d´signe ordinairement la norme du vecteur de la r´sultante conserv´e, tandis que ce que nous
appelons provisoirement ici la masse est sa composante temporelle.
                                              ee
     Calculons la masse m de ce point pond´r´: elle s’obtient en appliquant cette expression au cas
                                   e     a                                       e
de la forme affine constante w ´gale ` 1. Ceci correspond au mouvement qui d´place tout point de
S(t) suivant le mˆme vecteur −1 t. C’est donc le mouvement de translation de vitesse −1 t.
                   e               c2                                                     c2
                       e        e               e           e
     Or, nous avons d´fini l’´nergie E du syst`me comme ´tant moins la composante temporelle de
    e                                          e                            e
la r´sultante, autrement dit la puissance th´orique transmise par le pass´ sur le futur lors d’une
translation th´orique de vitesse −t.
               e
         u
     D’o` finalement
                                               E = mc2 .

             u                                 e                                     e
Mais bien sˆr pour l’obtenir, nous avons trich´ en ajustant le coefficient dans la d´finition de w
        e                 e                                      a
qui se r´percute sur la d´finition de m. Il ne nous reste plus qu’` justifier ce coefficient par le fait
          e               ee
qu’il en r´sulte la propri´t´ suivante:
                                                ee             e
Mouvement du centre d’inertie. Dans un r´f´rentiel donn´, la vitesse de variation au cours
                        ee                         e        e    e
du temps du centre pond´r´ d’inertie mG d’un syst`me isol´ est ´gale au vecteur impulsion p du
    e                  a             e
syst`me (correspondant ` la forme lin´aire impulsion, par le produit scalaire spatial usuel).
                             e                    e
    Nous allons donner deux d´monstrations de ce r´sultat, l’une simple et intuitive, l’autre com-
  e
pl`te et rigoureuse.
  e
D´monstration 1.
                               e      e                                                  a
     Reprenons la remarque d´montr´e dans le cas du plan que le moment par rapport ` un point
                                                                                e
s’exprime par une forme affine dont la direction est celle du vecteur force. L’´volution du centre
                                                      e                       e
d’inertie constitue une droite de l’espace-temps dirig´e par le quadrivecteur ´nergie-impulsion p +
E
c                     e                        ıt     e
 2 t. Une droite dirig´e par ce vecteur apparaˆ exp´rimentalement comme un point anim´ de la e
         p                               2
                        e
vitesse m si ce m est d´fini par E = mc .
  e
D´monstration 2.
                    e                 e
    On reprend une d´monstration compl`te partant de la construction des torseurs en termes de
rotations.

                                                 40
            e                 e     e                      ee
     Pour v´rifier la relation ´nonc´e entre centres pond´r´s d’inertie, fixons une forme affine w sur
                          ee                        ea                            u
l’espace euclidien S du r´f´rentiel, qui est identifi´ ` chacun des espaces S(t), o` la correspondance
                        e
entre tous les S(t) se d´finit par la translation temporelle dans la direction de t. Quelle est alors la
                                                       e
relation entre mw(G(t)) et mw(G(t )) ? C’est le mˆme torseur µ qui s’applique aux deux vitesses
                            e               e                 e
de rotations r(t) et r(t ) d´finies par le mˆme w sur les diff´rents espaces S(t) et S(t ). On a donc:

                   mw(G(t )) − mw(G(t)) = µ(r(t )) − µ(r(t)) = µ(r(t ) − r(t)).

                                       e          e                                           e
     Ensuite, le mouvement r(t )−r(t) ´tant la diff´rence de deux mouvements de rotation de mˆme
          e
partie lin´aire, est un mouvement de translation. Calculons le vecteur vitesse de ce mouvement.
       c                                                        e e            a
Une fa¸on de le faire est de remarquer qu’on passe de l’objet g´om´trique r(t) ` l’objet r(t ) par
la translation τ de vecteur (t − t)t. Donc, pour tout point M ,

         (r(t ) − r(t))(M ) = τ (r(t))(M ) − r(t)(M ) = r(t)(τ −1 (M ) − M ) = (t − t )r(t)(t).

                                   e            e
    Enfin, la valeur de r(t)(t) se d´duit de la d´finition du rapport entre w et r(t) et de la description
donn´e plus haut de ces rotations: r(t)(t) = −w o` w est le vecteur repr´sentant la partie lin´aire
    e                                                u                      e                      e
de w.
    Donc,

     mw(G(t )) − mw(G(t)) = µ((t − t )r(t)(t)) = (t − t)µ(w) = (t − t)p(w) = (t − t)w(p).

     e
Ceci ´tant valable pour tout w, on conclut:

                                     mG(t ) − mG(t) = (t − t)p.

4.8. L’espace des phases
           e                                           e                         e
     La m´canique classique que nous avons expos´ se traduit en une loi d’´volution, par laquelle
  e               e    a                e e                e    a
l’´tat d’un syst`me ` un instant donn´ d´termine son ´tat ` venir. Voyons les notions de base qui
interviennent dans cette question.
        e
     L’´tat d’une particule classique consiste en sa position et sa vitesse, ou encore sa position et son
                    e e                      e                       e                       e
impulsion. Plus g´n´ralement pour un syst`me quelconque, son ´tat en un instant se d´finit par la
              e                                                                                  e
coupe du sc´nario par cet instant dans l’espace-temps, et l’ensemble de toutes les forces th´oriques
                              e      e a                                                   e
(les impulsions) qui sont v´hicul´es ` travers cette coupe. En effet, pour un syst`me donn´ `          e a
  e                                               e                     e          e      a
l’´quilibre, je peux le couper sans perturber l’´quilibre de la moiti´ qui m’int´resse ` condition de
maintenir en place toute la disposition de ce qui se trouve sur cette coupe et d’y exercer pour cela
                     e                     e        a e                           e
toutes les forces n´cessaires. Si je m’int´resse ` l’´volution que cette moiti´ aurait si le syst`me e
e                      ee      e                            e    e                 c
´voluait sans avoir ´t´ coup´, je peux reproduire la mˆme ´volution en exer¸ant sur la coupe les
   e                                            e      e a                              e
mˆmes mouvements et forces qui seraient v´hicul´es ` travers ce plan si le syst`me n’´tait pas  e
      e                          a
coup´. En effet, il n’y a pas ` prendre en compte de mouvements de cette coupe qui sortent de
                                                                          e              e
son plan, puisque tout est fait de particules qui, comme nous avons d´crit, peuvent ˆtre prolong´es   e
                                                                   e         e
par la simple traction de leur bord suivant leur long, sans en ˆtre affect´es. Ainsi tout mouvement
                                  e                  e
qui sortirait de ce plan est repr´sentable de mani`re unique par un mouvement demeurant dedans.
           e                                     e                                               e
Pour la mˆme raison, il n’est pas besoin de pr´ciser la composante temporelle des forces th´oriques
     e
(les ´nergies) mais seulement celles qui agissent suivant la direction du plan de coupe (impulsions),
                                        e        e            e
car cette composante temporelle est d´termin´e de mani`re unique par ces conditions.
                                             e            ee           e             e
     On appelle espace des phases d’un syst`me la vari´t´ constitu´e de tous les ´tats qu’il pourrait
       a                  e u                 e                                e
avoir ` un instant donn´, o` la notion de l’´tat d’une coupe est constitu´e de sa forme et celle des
forces qui la traversent (impulsions).
                      e   a
     Nous l’avons d´fini ` l’aide d’une coupe, mais l’usage que nous en ferons pourrait s’appliquer
a            e                     e e
` des mani`res beaucoup plus g´n´rales de maintenir le bord d’un syst`me.    e
                                                e        e                e
     L’important, donc, est qu’on a un syst`me en ´quilibre (un sc´nario) pouvant ˆtre soumise
a                                                                                    oe
` des potentiels quelconques, et qu’il y a deux acteurs qui, chacun de son cˆt´, maintient une
                e                                e c
partie du syst`me, et peut agir dessus en la d´pla¸ant et en modifiant la force qu’il exerce dessus.

                                                   41
Ces deux parties sont disjointes l’une de l’autre, en sorte que les acteurs interagissent uniquement
             e                e                                    e
par l’interm´diaire du syst`me: les actions de l’un sur le syst`me sont ressenties par l’autre et
inversement. Si l’un choisit par exemple de maintenir fixe sa partie, l’autre pourra bouger la sienne
                      a                          e                                 e           e
et affectera la force ` laquelle le premier doit r´sister pour maintenir cette fixit´. Ou s’il d´cide de
                                                             e        e
laisser sa partie suivre le mouvement suivant une certaine ´lasticit´, les actions de l’autre la feront
bouger.
       e                                      e                     e      e
     D´finissons l’espace des phases comme ´tant l’ensemble des ´tats d’´quilibre possibles pour le
     e                                      e                                    e           e
syst`me dont on oublie les voisinages imm´diats des deux acteurs, et dont la r´alisation d´pend du
                                              e          a        e                    e
bon vouloir conjoint de ceux-ci. (On ne s’int´resse pas ` la mani`re dont chacun se d´brouile de son
 oe              e                                       a                                         e
cˆt´ pour faire ´voluer sa prise en sorte de s’accorder ` chaque instant avec la position du syst`me
                                                                        e
dans l’espace des phases). Et subjectivement, chaque acteur se repr´sente l’espace des phases en
  e             e       e               e
d´crivant tout ´tat d’´quilibre du syst`me en dehors de lui sous la forme de ce qu’il peut ressentir
         oe                 e                        e
de son cˆt´ lorsque le syst`me se trouve dans cet ´tat.
   e e                                             e                      a
Th´or`me. Les structures symplectiques attribu´es par chaque acteur ` l’espace des phases sont
     e         e                    o     e                       e
oppos´es (donc ´gales si l’un a le rˆle d’´metteur et l’autre de r´cepteur).
                                       a                  e                   a                   e
     Une structure symplectique est (` peu de chose pr`s) une application qui ` toute courbe ferm´e
                                                      e
munie d’un sens de parcours, associe une quantit´ d’action (que nous traduisons par le terme
   e                             e                     e     e                           e
d’´nergie dans notre langage th´orique), d’une mani`re lin´aire (condition que nous ne d´taillerons
                                   e                                             e
pas; disons seulement que la mˆme courbe parcourue dans deux sens oppos´s doit donner des
 e               e                         e
r´sultats oppos´s). A toute courbe ferm´e de l’espace des phases, donc, chaque acteur associe le
                                         e              e          e
travail total qu’il doit fournir au syst`me lorsque l’´tat du syst`me effectue le parcours de cette
                                   e     a                           e e       e       e
courbe (infiniment lentement: l’´tat ` chaque instant est suppos´ ˆtre un ´tat d’´quilibre), en
                                     a       e      e                              e
supposant que cet acteur reprend ` l’arriv´e la mˆme disposition qu’il avait au d´part (ce qui est
                          e                                        a                 e   e
possible puisque le syst`me parcourant une boucle se retrouve ` la fin dans le mˆme ´tat qu’au
  e                            a                                  e    e
d´part et donc il ne tient qu’` l’acteur de se remettre dans le mˆme ´tat).
                                                     e             e              ee
     Ces deux structures symplectiques sont oppos´es car le syst`me est suppos´ ˆtre uniquement
                                                            a
soumis aux actions libres des deux acteurs d’une part, ` des forces issues de potentiels d’autre
                      e            a                            e
part. Quand le syst`me revient ` sa configuration initiale apr`s avoir fait un tour, donc, le total
     e                         e                                 a
des ´nergies fournies au syst`me par toutes les forces est nul ` l’exception du travail fourni par
                                                  e                          c
les deux acteurs. Au bilan, le travail total donn´ par l’un est donc celui re¸u par l’autre, ce qu’il
         e
fallait d´montrer.
               e
     De cela d´coule le
    e e                                                              e
Th´or`me de Liouville. Le mouvement de l’espace des phases dans lui-mˆme qui exprime la loi
  e                  e                        e
d’´volution d’un syst`me au cours du temps, pr´serve le volume.
                                           e
    Comme nous venons de voir qu’il pr´serve la structure symplectique, il suffit de donner une
  e                                                                e
d´finition de la mesure du volume dans l’espace des phases qui d´pend uniquement de cette struc-
                                                                   e                  e
ture symplectique. Note: la notion de volume n’a un sens math´matiquement coh´rent que dans
         ee
des vari´t´s de dimension finie. Nous supposons donc que l’espace des phases est de dimension
                                                e
finie, ce qui est le cas en pratique pour un syst`me de particules (il y a 6 dimensions par particule),
mais non pour le cas d’un champ.
                                                                                 e
    Dans le cas d’un espace des phases de dimension 2, l’aire d’une surface se d´finit par la quantit´e
                e a                  e                                      e         e
d’action associ´e ` la courbe fronti`re de cette surface, une orientation ´tant donn´e. Dans le cas
 e e                               e                         e
g´n´ral (en dimension finie), la d´finition est plus compliqu´e mais elle existe; elle consiste en une
simple expression tensorielle dont nous admettons ici l’existence.




                                                  42
                                     e
                                 5. M´canique statistique
                       e
5.1. Fondements de la m´canique statistique.
                        e                             e                             e
      Il y a deux mani`res possibles de fonder la m´canique statistique: sur la m´canique classique
                        e                                              e e
d’une part, sur la m´canique quantique d’autre part. Comme la r´alit´ est quantique et que la
   e                                                                                  e
m´canique classique en est une approximation ayant un large domaine de validit´ pratique, ainsi
       e                                                e
la m´canique statistique n’est pas exactement la mˆme suivant qu’on la fonde de l’une ou l’autre
        e                   e          e                           e        e e           e e
mani`re, et c’est celle fond´e sur la m´canique quantique qui d´crit plus pr´cis´ment la r´alit´. Cela
          e                   a     e                                            e
n’empˆche pas de chercher ` la d´crire et l’expliquer dans les termes de la m´canique classique, ce
qui est une approche valable dans nombre de situations pratiques.
                      a    a
      Contrairement ` ce ` quoi on pourrait s’attendre a priori, son fondement sur la physique
                                  e        e                                 e
classique comporte des difficult´s math´matiques, notamment des probl`mes de divergence, qui
n’existent pas avec la physique quantique. Ainsi peut-on dire que sous certains aspects, le fonde-
                                                e                              e      e
ment sur la physique quantique est plus ais´ pour arriver quasiment aux mˆmes r´sulats. Comme
                       a    e e
il correspond mieux ` la r´alit´, il est plus satisfaisant.
                                             e              e                                e
      De quoi s’agit-il ? Nous avons montr´ que la loi d’´volution au cours du temps en m´canique
classique s’exprime par une transformation de l’espace des phases E qui pr´serve son volume
                                                                                   e
     e e
(th´or`me de Liouville).
      Le passage ` la physique statistique consiste ` dire qu’on ne connaˆ plus l’´tat x ∈ E du
                    a                                   a                    ıt         e
      e                                              e           e
syst`me dans l’espace des phases, mais que cet ´tat est al´atoire suivant une loi de probabilit´     e
          e       e      e e                        e                                 e
bien d´termin´e appel´e l’´tat statistique du syst`me, qui s’exprime par une densit´ de probabilit´:e
                             e              e                   e                   e
on peut imaginer la densit´ de probabilit´ comme la densit´ d’une substance pr´sente en quantit´     e
          e     a                   e         e
totale ´gale ` 1, comme une cuill`re de caf´ dans la marmite de l’espace des phases. La densit´ dee
              e                                               e      e
probabilit´ en chaque point est le rapport de la probabilit´ de pr´sence dans un petit voisinage de
ce point sur le volume de ce voisinage.
            a          e
      De l` on peut d´finir l’entropie comme une mesure de la dilution de cette probabilit´: e

                                           S=−         p ln p
                                                   E


moyenne par rapport aux possibilit´s ´l´mentaires de se retrouver en les diff´rents lieux de E (donc
                                     e ee                                     e
int´grale suivant p fois l’´l´ment de volume) de la mesure − ln p de cette dilution.
   e                       ee
                    e                              e
     Un des probl`mes que cela pose est le probl`me de la divergence, notamment du fait que dans
le cas d’un champ classique l’espace des phases est de dimension infinie et donc cela pose des
      e     a              ee                          e                 e
probl`mes ` la notion d’´l´ment de volume. Concr`tement, si on se d´tourne de la simple manie
                                   e                                     e
de pinaillage d’analyse des math´maticiens pour adopter les grandes d´marches d’approximations
   e
ch`res aux physiciens, il n’en reste pas moins que les divergences en question devraient se retrou-
          e                       e            e                          e
ver concr`tement dans les cons´quences exp´rimentales de ces hypoth`ses, ce qu’on a appel´ la   e
                                          e
“catastrophe ultraviolette”: en consid´rant l’espace des phases de dimension infinie du champ
e             e                                                              e
´lectromagn´tique, le rayonnement thermique du corps noir d’une temp´rature donn´e devrait e
                     e                               a
avoir une intensit´ tendant vers l’infini au fur et ` mesure qu’on inclut dans le calcul ces dimen-
                             e                       e e
sions correspondant aux fr´quences de plus en plus ´lev´es, qui sont autant de voies de rayonnement
      e
suppl´mentaires.
                       e               e
     Un autre inconv´nient de cette pr´sentation est qu’elle semblerait indiquer une conservation et
                                                         e c
non une augmentation de l’entropie, le mouvement d´pla¸ant les concentrations de probabilit´ et e
                               e            e                                        e        e
ne les diluant pas. Ceci peut ˆtre surmont´ sous forme de l’approximation d’un m´lange (r´sultat
                   u                                           e
de mouvement o` la concentration demeure mais est dispers´e un peu partout) par une dilution,
                                               e          a                                 e e
du fait qu’il est pratiquement impossible de r´effectuer ` l’inverse ce mouvement assez pr´cis´ment
                       e         e           c
pour effectivement d´faire le m´lange de fa¸on constatable en pratique.
                  e
     Un autre d´faut encore de l’approche par la physique classique est qu’elle n’admet pas la
          e                                               e
possibilit´ d’une variation du nombre de particules pr´sentes. En effet, la dimension de l’espace
                                         e                   e
vaut six fois le nombre de particules pr´sentes, donc une cr´ation ou une annihilation de particules
                                                 e
devrait s’exprimer par une transformation pr´servant le volume d’un espace de phases vers un
                          e                     ıt                                     a
autre de dimension diff´rente, ce qui apparaˆ quelque peu absurde. En effet, si ` la limite on

                                                 43
                     e          e
pourrait consid´rer une cr´ation de particules comme plongeant le premier espace en une sous-
    ee                     e                         u                         e e ee
vari´t´ du suivant (d´finie par le point exact o` la nouvelle particule a ´t´ cr´´e), la densit´ de    e
            e
probabilit´ qui avait une dilution volumique dans le premier n’aurait plus une dilution volumique
                                                                 ee                           a
dans le second mais une concentration sur une sous-vari´t´, ce qui donnerait alors ` l’entropie
                                                                     e                         e
finale la valeur de moins l’infini (!). Par exemple, si on interpr`te classiquement la lumi`re comme
     e                                                e                  e       ıt
syst`me de particules et non comme onde, toute ´mission de lumi`re apparaˆ comme une cr´ation      e
de particules.
                       a                                                                    a
     Par rapport ` cela, que nous dit la physique quantique ? Qu’il y a une limite ` la division
                                                             a
du volume de l’espace des phases (et donc une limite ` la concentration de la probabilit´). En    e
effet, dans toute direction de surface de dimension 2 dans l’espace des phases, on a une mesure des
             e                                                     a                           e
aires donn´e par la restriction de la structure symplectique ` cette surface. Une aire y ´tant ainsi
         e a                                 e
homog`ne ` une action, on a comme unit´ de mesure naturelle de cette aire la constante de Planck
h                          e                                     e                          e
¯ . Alors, la possibilit´ de division de cette surface est limit´e comme ne pouvant pas ˆtre plus fine
          e                                    h                                          e
qu’un d´coupage en cellules d’aire h = 2π¯ chacune (cela se comporte comme tel d´coupage bien
                 e                                                                  e e
que les fronti`res entre les cellules ne soient pas localisables en termes de la g´om´trie usuelle).
                                                                     e            e
     Ainsi s’exprime le principe d’incertitude de Heisenberg: l’´tat d’un syst`me dans l’espace des
                              e e       e
phases n’est pas plus pr´cis´ment d´fini suivant chaque direction de surface, que par la donn´e de    e
                                           e                            e
la cellule qui le contient dans un tel d´coupage flou. Par cons´quent, le volume minimal qu’on
peut consid´rer dans un espace des phases de dimension 2k vaut hk . En fait, la r´alit´ qui se cache
               e                                                                       e e
derri`re l’apparence classique d’une portion de l’espace des phases de volume nhk , est un espace
      e
                                                        e                   e
de Hilbert de dimension n, et ce qui se cache derri`re une apparente ´volution incompressible de
ce volume, est une rotation l’espace de Hilbert.
                                  e              e                       a                e
     Alors, nous allons ici d´velopper la m´canique statistique ` partir d’un mod`le de d´part      e
       e                                                       e
math´matiquement simple, intuitivement proche de la m´canique classique tout en refl´tant assez e
                   ee                     e e
bien les propri´t´s essentielles de la r´alit´ quantique.
     Il consiste ` partir d’un ensemble E discret (fini ou d´nombrable) nomm´ “ensemble des ´tats
                    a                                          e                  e                  e
                                                                                          k
                             e
classiques”. Il s’interpr`te classiquement comme l’ensemble des cellules de volume h en lesquelles
               e       e
on aurait d´coup´ l’espace des phases, ou quantiquement comme celui des vecteurs d’une base
                                                                              e e
choisie dans l’espace de Hilbert. Nous oublierons totalement la forme g´om´trique de l’espace des
                                                                e                    e
phases, son rapport avec l’espace physique et ses points d’´quilibre au sens exp´rimental classique.
     On consid`re qu’on ne connaˆ pas la valeur x ∈ E de l’´tat classique du syst`me mais que cet
                   e                 ıt                           e                     e
e            e                                     e           e        e a          e
´tat est al´atoire suivant une loi de probabilit´ p bien d´termin´e: ` chaque ´tat classique x est
        e                e        e   e e                             e          e e
associ´ sa probabilit´ p(x) d’ˆtre r´alis´. Cette loi de probabilit´ p est appel´e l’´tat statistique (ou
thermodynamique) du syst`me. Un ´tat statistique sur un espace E est donc une application p de
                                e        e
E dans [0, 1] dont la somme des valeurs vaut 1:

                                                   p(x) = 1.
                                             x∈E

                                    e               a               e                      c
On passe ainsi de la notion d’´tat classique ` la notion d’´tat statistique en rempla¸ant l’espace
E par l’ensemble des lois de probabilit´ sur E. On passe alors de la notion d’´quilibre classique
                                             e                                       e
a         e                                                         e       e
` celle d’´quilibre statistique (ou thermodynamique). Un ´tat d’´quilibre statistique est un ´tat  e
                                                           e                                   e
statistique qui ne varie pas au cours du temps. L’´quilibre statistique n’implique pas l’´quilibre
                 e                                                               e                 e
classique car il ´nonce seulement que la diminition de chaque p(x) par l’´volution possible de l’´tat
                 e                                  e                              e
x vers d’autres ´tats sera exactement compens´ par son augmentation due aux ´volutions des autres
e
´tats vers x, en sorte que p(x) demeure constant.
                     e                 ee                                                       e
     Pour pouvoir ´tablir ses propri´t´s, il faut partir d’un postulat physique que nous allons ´noncer
maintenant. Introduisons d’abord des notations.
     Soit un syst`me S isol´, d’´tat statistique p1 sur un espace E ` l’instant t1 , en ´volution vers
                   e          e e                                            a           e
un espace E ` l’instant t2 > t1 . Pour tous x ∈ E et y ∈ E , notons p(x, y) la probabilit´ pour que, si
              a                                                                           e
son ´tat est x ` l’instant t1 , il passe ` y ` l’instant t2 . On a ´videmment ∀x ∈ E, y∈E p(x, y) = 1,
     e          a                        a a                        e
               e                                     e                         e     a
et cet objet d´termine la transformation de l’´tat statistique du syst`me de p1 ` l’instant t1 ` p2a
` l’instant t2 par la formule
a
                                      ∀y ∈ E , p2 (y) =      p(x, y)p1 (x).
                                                         x

                                                    44
                                            e
L’axiome de base dont nous allons partir, s’´nonce alors par la formule :

                                          ∀y ∈ E ,         p(x, y) ≤ 1
                                                     x∈E

                  e                                e     e
ou bien cette mˆme formule mais comme une ´galit´, en fonction du contexte pour la raison
                                                     e     e
suivante: fondamentalement, la loi est celle d’une ´galit´; mais en pratique, on peut se restreindre
` l’expression des parties qui interviennent effectivement: E ⊂ E0 , E ⊂ E0 avec : ∀x ∈ E0 , p1 (x) =
a
0 ⇒ x ∈ E d’une part, p2 (x) = 0 ⇒ x ∈ E d’autre part. Le cas d’une in´galit´ stricte provient donc
                                                                          e     e
du fait que certains ´tats initiaux dans E0 sont consid´r´s comme a priori impossibles et exclus de
                     e                                  ee
E ` cause des conditions initiales de l’exp´rience qui ne leur permet pas de se r´aliser.
  a                                        e                                      e
                                                     e e                            e e
     Cet axiome se comprend comme reflet du th´or`me de Liouville (et il refl`te ´galement un
   e     e                                                       e            a
ph´nom`ne correspondant de physique quantique) de la mani`re suivante: ` t1 , l’espace des phases
      e     e                 e                       e         e      a
est d´coup´ en cellules et l’´tat classique du syst`me se r´sume ` la cellule dans laquelle il se
                                           e                e              e                    e
trouve. Il n’y a pas d’information plus pr´cise, la densit´ de probabilit´ dans chaque cellule ´tant
                                     e                             e    e
donc “uniforme”. Puis on efface le d´coupage et on laisse le syst`me ´voluer suivant un mouvement
                                              a               u              e
incompressible de l’espace des phases, jusqu’` l’instant t2 o` on fait un red´coupage en de nouvelles
                          e                                        e                      a    e
cellules. Ainsi, chaque d´coupage en cellules a pour effet d’op´rer un parfait mixage ` l’int´rieur
de chaque cellule, augmentant son entropie comme nous allons voir.
5.2. Loi de Boltzmann
     e      e                                             e
   L’´tat d’´quilibre statistique vers lequel tend un syst`me en contact thermique avec un milieu
                e
ambiant de temp´rature T , s’exprime par la formule
                                                             E(x)−E0
                                            p(x) = e−           kT



 u                                                                      e                  e
o` k est la constante de Boltzmann servant de correspondance entre les ´nergies et les temp´ratures,
            e           e                          e          a
E(x) est l’´nergie de l’´tat x et E0 est la quantit´ qui sert ` la normalisation :

                                     E0               E(x)                            E(x)
                      p(x) = 1 ⇔ e− kT =         e−    kT    ⇔ E0 = −kT ln       e−    kT    .
                  x                          x                               x

                                    e                   e            e      e
En fait, nous verrons que E0 est l’´nergie libre du syst`me dans cet ´tat d’´quilibre thermody-
namique.
                                                     a            e                 e        e
    Dans la suite on fixera la constante de Boltzmann ` k = 1 par d´finition de l’unit´ de temp´ra-
ture.
                   e                a                                         e      e
     En voici la d´monstration, ` partir de notre axiome sous sa forme d’´galit´ et de l’hypoth`se    e
                   e                           e                                                e       e
suivant laquelle l’´nergie est la seule quantit´ physique qui se conserve dans le cas d’un syst`me isol´.
                                                                                e
(Remarque: il existe des situations physiques comportant d’autres param`tres qui se conservent,
                 a            e                        e
ce qui aboutit ` des lois d’´quilibre plus compliqu´es).
                                               e                            e         e
     D’abord, montrons que la condition d’´quilibre thermique d’un syst`me isol´ est que p(x) doit
     e                 e                                           a              e              e
ne d´pendre que de l’´nergie E(x). En effet, en se restreignant ` un niveau d’´nergie donn´, la plus
                 e                      e                          e                   e
forte probabilit´ finale ne peut exc´der la plus forte probabilit´ initiale, et de mˆme la plus faible
                                                                    e                    e
ne peut pas diminuer. Si elle demeurait constante, le nombre d’´tats ayant cette mˆme probabilit´        e
                                                                    e e           e
diminuerait: il ne peut augmenter et s’il ne diminuait pas, en r´p´tant le mˆme raisonnement sur
    e                       a     e           e                                                     e
les ´tats restants menant ` un ´tat final d’´quilibre p, alors cette fonction p serait une quantit´ qui
                               a          e          e
se conserve, contrairement ` l’hypoth`se que l’´nergie (et donc aussi toute fonction de l’´nergie)e
                     e
est la seule quantit´ qui se conserve.
                                      e                  e             e     a
     En tout cas, si les probabilit´s sur un niveau d’´nergie sont ´gales ` l’instant t, elles le sont
  e                    a
n´cessairement aussi ` l’instant t .
                                                 e          e            e                    e
     Ensuite, la relation entre les probabilit´s pour des ´nergies diff´rentes vient concr`tement de
             e e                   e
la possibilit´ d’´changer cette ´nergie avec des parties du milieu ambiant. Soit une particule du
                                                   e       e                               e
milieu ambiant pouvant se trouver dans un ´tat e d’´nergie E1 avec la probabilit´ p1 ou dans
un ´tat e d’´nergie E2 avec la probabilit´ p2 , et venant interagir avec notre syst`me S. On
    e          e                                e                                           e

                                                       45
suppose que ces probabilit´s p1 et p2 ne d´pendent pas de l’´tat de S (on dit que la particule n’est
                          e               e                 e
pas corr´l´e ` S; l’hypoth`se sous-jacente est que le milieu ambiant est infiniment plus vaste et
        ee a              e
qu’il peut donc ´changer avec S une quantit´ de chaleur quelconque sans modifier ses propri´t´s
                e                            e                                                  ee
  e e                            e    e                                                  e
g´n´rales). Comme on l’a suppos´ en ´quilibre thermique avec le milieu ambiant, le syst`me form´   e
de S et de la particule doit ˆtre en ´quilibre thermique, et en particulier deux ´tats de mˆme
                              e        e                                            e           e
´nergie doivent avoir la mˆme probabilit´. Donc, quels que soient deux ´tats x et x de S tels
e                          e              e                                 e
que E(x ) − E(x) = E(e ) − E(e), les combinaisons d’´tats (x, e ) et (x , e) ayant la mˆme ´nergie
                                                      e                                e    e
                                                e              e
E(x) + E(e ) = E(x ) + E(e) doivent avoir la mˆme probabilit´ p(x)p2 = p(x )p1 , autrement dit

                                               p(x )  p2
                                                     = .
                                               p(x)   p1

                                 e          e          e                   e         e
Donc le rapport des probabilit´s de deux ´tats ne d´pend que de la diff´rence d’´nergie entre ces
      e                                                  e          e
deux ´tats et est identique au rapport des probabilit´s de deux ´tats d’une particule du milieu
                      e       e         e
ambiant ayant la mˆme diff´rence d’´nergie. (Au lieu d’une particule on peut prendre un grand
    e             e                   e          e
syst`me, les cons´quences sont les mˆmes). La d´monstration de la loi de Boltzmann est maintenant
       e
termin´e.
                                   ee                    e                              e e
    On peut remarquer la propri´t´ suivante, qui se d´duit de notre axiome et le g´n´ralise. Soit
un syst`me S d’´tat statistique p sur un espace E ` l’instant t. On le met en contact thermique
        e        e                                    a
avec un syst`me ext´rieur S initialement non corr´l´ ` S et ` l’´quilibre de temp´rature T d´fini
             e        e                               eea       a e                   e           e
par la loi de Boltzmann. On suppose que S ´volue vers un espace E d’´tats possibles ` l’instant
                                               e                           e                a
t > t, tandis que l’ensemble des ´tats possibles de S reste le mˆme avec la mˆme loi d’´nergie, et
                                   e                              e              e          e
                    e         e                                                   e
que le tout est isol´ de l’ext´rieur. Alors on a la formule suivante sur la loi d’´volution p(x, y) de
S tandis qu’il interagit avec S :
                                                              E(y)−E(x)
                                  ∀y ∈ E ,         p(x, y)e       T       ≤1
                                             x∈E


            e                e     e            e
ou bien la mˆme formule avec ´galit´, pour les mˆmes raisons.
              e
5.3. Energie, ´nergie libre
                             e                      e          e
    Nous allons calculer l’´nergie libre F du syst`me dans l’´tat thermodynamique p, c’est-`-   a
       e                                              e          e
dire l’´nergie qu’on peut en extraire par un travail m´canique (r´versible), sans tenir compte des
e                                               a  e
´changes de chaleur avec le milieu ambiant ` temp´rature T .
                e            e                 e                                       e
    D’abord, d´finissons l’´nergie U d’un ´tat statistique p : c’est la moyenne des ´nergies des
e                                          e
´tats particuliers, suivant leur probabilit´ :

                                        U (p) =          p(x)E(x).
                                                     x

                               e                                   ee
      Ensuite, pour calculer l’´nergie libre il faut choisir une r´f´rence pour laquelle on convient que
       e                                                                                u
cette ´nergie est nulle. Admettons pour le moment qu’elle est nulle dans le cas o` le syst`me este
    e
en ´quilibre suivant la loi de Boltzmann avec E0 = 0 (et nous verrons pourquoi cette supposition
                                                                                 E(x)
est bonne; en attendant, prenons cela comme une d´finition) : p(x) = e− T . Tout autre ´tat p
                                                          e                                        e
         e     e                            a                                   e
peut (tr`s th´oriquement !) se ramener ` cette situation par le travail “m´canique” suivant.
      On commence par isoler S thermiquement du milieu ambiant et interdire toute ´volution    e
thermique de S. Autrement dit, le d´coupage en cellules de l’espace des phases est transport´ par
                                        e                                                           e
  e                                                                                            e
l’´volution en sorte qu’elle s’y exprime par p(x, y) = 1 si x = y et 0 sinon. Etant donn´ un ´tat     e
                 e          e                                   ıt      e
statistique p fix´ (suppos´ connu, tandis qu’on ne connaˆ pas l’´tat particulier x du syst`me),     e
              e                             e
modifions m´caniquement la fonction d’´nergie E(x) pour la remplacer par la fonction E d´finie        e
par
                                           E (x) = −T ln p(x).
         e     e      e         e
A l’arriv´e, l’´tat p ´tant rest´ le mˆme, son ´nergie libre s’est annul´e, d’apr`s notre hypoth`se.
                                      e        e                        e        e              e
                                                            e                              e
Comme cette transformation est adiabatique (i.e. sans ´change de chaleur avec l’ext´rieur) et

                                                      46
 e            e                          e       e         e     a e              e
r´versible, l’´nergie libre F (p) du syst`me au d´part est ´gale ` l’´nergie retir´e sous forme de
travail lors de cette transformation :

                          F (p) = U (p) − U (p) =           p(x)(E(x) + T ln p(x)).
                                                       x


                     e
On pourrait consid´rer que ce raisonnement n’est pas valable du fait qu’il faudrait travailler avec
  e        e          e       e                e
l’´nergie r´ellement ´chang´e et non son esp´rance, mais nous allons confirmer plus loin ce r´sultate
                           ea                              e
par d’autres moyens. D´j`, le fait que dans le cas de l’´quilibre de Boltzmann le E0 co¨      ıncide avec
  e                    e              e
l’´nergie libre ainsi d´finie est imm´diat (on a tout fait pour).
                         a           e                                  e
     Ensuite, et c’est l` le plus int´ressant, voyons comment cette ´nergie libre se modifie lorsque
       e                                        e
le syst`me subit une transformation infinit´simale, dans laquelle les fonctions E(x) et p(x) se
                  e
modifient infinit´simalement de δE(x) et δp(x) respectivement.
      a               e                                          e                 e
     L` encore par d´finition, la part d’effet direct pour p fix´ de δE(x) sur l’´nergie libre F (p), de
   e              e
mˆme que sur l’´nergie totale U (p), co¨                                        e                 e
                                          ıncide avec le travail fourni de l’ext´rieur sur le syst`me,

                                           W =         p(x)δE(x).
                                                   x


                                        a e                      e
D’autre part, l’effet de δp, qui apporte ` l’´nergie U une quantit´ de chaleur

                                           Q=          E(x)δp(x)
                                                   x


modifie F d’une ampleur de
                                           δp(x)(E(x) + T ln p(x))
                                       x

puisque
                                p(x)δ(ln p(x)) =        δp(x) = δ(       p(x)) = 0.
                            x                      x                 x

On remarque alors que la condition pour que les variations de F au premier ordre ci-dessus soient
                                   e
nulles quel que soit δp (qui v´rifie toujours                                          e            e
                                                       x δp(x) = 0) pour une loi d’´nergie E fix´e, est
                                  e                                     e
que E(x) + T ln p(x) soit ind´pendant de x, donc que p soit d´fini par la loi de Boltzmann de
       e
temp´rature T .
              e
     Ainsi, l’´quilibre statistique co¨               e              e                        e
                                        ıncide avec l’´quilibre de l’´tat p dans l’espace des ´tats statis-
                                 e                       e
tiques, en prenant en guise d’´nergie potentielle l’´nergie libre F .
                                       e      e                e e               u e
     On remarque que cet unique ´tat d’´quilibre est pr´cis´ment celui o` l’´nergie libre prend sa
valeur minimale.
     En effet (en cherchant des p tels que F soit la plus petite possible), on remarque qu’elle ne prend
                                    e
pas sa valeur minimale en un ´tat statistique qui soit au bord (une valeur limite) de l’ensemble
     e                                     a                          e
des ´tats statistiques possibles, c’est-`-dire en l’occurence un ´tat qui s’annule pour un certain x
(∃x, p(x) = 0). En effet, en s’approchant d’un tel bord, ln p(x) approche −∞ (moins l’infini), donc
                                     e
δp(x) donne une contribution d’´nergie libre importante de signe contraire δp(x)(E(x) + T ln p(x))
ce qui prouve que F augmente lorsqu’on s’approche du bord du domaine. Donc F doit prendre
                                                      e       a
sa valeur minimale pour une position de p int´rieure ` son domaine (i.e. un p qui ne s’annule
pas) donc une valeur autour de laquelle ses variations sont nulles au premier ordre, ce qu’on vient
   e
d’´tudier.
        e                          e
     V´rifions maintenant que l’´nergie libre est effectivement la mesure du travail qu’on peut retirer
 e                         e     a e                                      a    e              e
r´versiblement d’un syst`me ` l’´quilibre statistique en l’amenant ` un ´tat pur x0 (d´fini comme
e                                                                      a a      e
´tat statistique par p(x0 ) = 1 et p(x) = 0 pour tout autre x) grˆce ` des ´changes thermiques avec
              e              e                    e e          a               e         e
le milieu ext´rieur de temp´rature T : le proc´d´ consite ` amener le syst`me d’un ´tat statistique `     a
                               e                                                     c
l’autre en modifiant la loi d’´nergie E (et donc lui fournissant un travail) de fa¸on progressive pour
           a                                                                 e        e
le laisser ` chaque instant rejoindre (par contact avec le milieu ext´rieur) l’´quilibre thermique
            e                                                                        e
des lois d’´nergie successives. Alors la part thermique de la variation de l’´nergie libre devient

                                                       47
                   e              e        e
d’autant plus n´gligeable, et l’´nergie m´canique fournie se rapproche d’autant plus du montant
                                e
de cette variation que cette ´volution est progressive (la somme des travaux se rapprochant de
          e                         e
son esp´rance du fait que, plus l’´volution est progressive, plus le travail se divise en contributions
    e                                              e       e             e               e    e
ind´pendantes, la contribution de chaque instant ´tant al´atoire d’apr`s la probabilit´ p d’´quilibre
                     ee           e                                             e e
de l’instant consid´r´ sans corr´lation avec les contributions des instants pr´c´dents).
                                                                                    e      e
      Il reste la question : au cours d’une transformation quelconque d’un syst`me, l’´nergie libre
                               e                                   e        e
F diminue-t-elle ? Comme l’´nergie U se conserve pour un syst`me isol´, la question se ram`ne `   e a
                 e
celle de la diff´rence entre les deux.
5.4. Entropie.
                                    e                      e                   e
    La formule de l’entropie S d’un ´tat statistique p se d´duit de celle de l’´nergie libre que nous
avons ´tablie, suivant la formule F = U − T S :
      e

                                             S(p) = −          p(x) ln p(x)
                                                          x


 a                                                                e a                         e
(` multiplier par la constante de Boltzmann que nous avons ici fix´e ` 1). L’entropie d’un syst`me
     e                   e              ee
form´ de deux sous-syst`mes non corr´l´s (p(x, y) = p1 (x)p2 (y)) est la somme des entropies S1 =
                                      e
S(p1 ) et S2 = S(p2 ) de ces sous-syst`mes :

   −S(p) =          p1 (x)p2 (y) ln(p1 (x)p2 (y)) =           p1 (x)p2 (y) ln(p1 (x)) +            p1 (x)p2 (y) ln(p2 (y))
              x,y                                      x,y                                  x,y

           = −(S1 + S2 ).

                     e        ee                                         e       a
Dans le cas de syst`mes corr´l´s, l’entropie du tout S = S(p) est inf´rieure ` la somme des
                         e
entropies S1 et S2 des ´tats p1 (x) = y p(x, y) et p2 (y) = x p(x, y). En effet, en attribuant
` ces deux sous-syst`mes les ´nergies respectives E1 (x) = −T ln p1 (x) et E2 (y) = −T ln p2 (y),
a                     e       e
                                 u         e            ee
on constate que U (p) = U (p ) o` p est l’´tat non corr´l´ correspondant p (x, y) = p1 (x)p2 (y);
           e    e       e                            e               e
mais p ´tant l’´tat d’´quilibre statistique de cette ´nergie, il poss`de la plus grande entropie:
F (p ) < F (p) ⇒ S(p) < S(p ) = S1 + S2 .
       e                                           e       e
     V´rifions maintenant que l’entropie d’un syst`me isol´ ne peut qu’augmenter au cours du
         a
temps, ` partir de notre axiome.
                    e               a            e       e
     On a pour une ´volution de p1 ` p2 d’un syst`me isol´

                           −S1 =           p1 (x) ln p1 (x) =            p(x, y)p1 (x) ln p1 (x)
                                       x                           x,y

                           −S2 =           p2 (y) ln p2 (y)
                                       y


    Or, pour tout y on a

                                       p(x, y)p1 (x) ln p1 (x) ≥ p2 (y) ln p2 (y)
                                   x


                             a                    e                               ee
parce que l’application qui ` u associe u ln u ´tant convexe, la moyenne pond´r´e par p(x, y) des
                           e       a
images des p1 (x) est sup´rieure ` l’image de leur moyenne p2 (y).
                                                      e              e        e                e
     Maintenant que la croissance de l’entropie est ´tablie, on en d´duit la d´croissance de l’´nergie
libre d’un syst`me S lors d’un ´change thermique avec un milieu S de temp´rature T ainsi :
                e                e                                              e
       e
     L’´nergie totale U (S +S ) se conserve, et l’entropie du tout S(S +S ) augmente, donc F (S +S )
diminue. Les syst`mes S et S ´tant initialement d´corr´l´s, F (S + S ) est ´gal ` F (S) + F (S ) au
                   e             e                    e     ee                e    a
d´part mais lui est sup´rieur ` la fin. Comme S est initialement ` l’´quilibre de temp´rature T ,
  e                      e     a                                       a e                 e
F (S ) ne peut qu’augmenter. Donc F (S) diminue.



                                                              48
                                      a
                      6. Introduction ` la physique quantique
                         e
6.1. Introduction: une th´orie en deux parties
                                             e           e              e
     La physique quantique est riche en th´ories math´matiques int´ressantes, en paradoxes aussi.
          e                                                     e
Ses myst`res ne sont pas “explicables” par les concepts de m´canique classique ordinaires, ni mˆmee
                       e e                                                     e
par les principes de r´alit´ ordinaires. Certains de ses aspects lui sont sp´cifiques, et d’autres sont
    e a
reli´s ` la physique classique qui leur donne son langage et ses concepts.
                     e                                                                 e
     On peut consid´rer la physique quantique comme une conjonction de deux th´ories aux d´ve-    e
                               e e
loppements plus ou moins s´par´s, suivant la divergence de ses deux axiomes fondateurs com-
     e          e                                    e
mun´ment not´s U et R. Elles sont toutes deux ´tranges et paradoxales et en manque de fonde-
                                             e                        e
ments clairs, mais pas du tout pour les mˆmes raisons. Il faut pr´ciser que, du moins suivant les
                                     e             e e      e
connaissances actuelles, ces deux th´ories sont tr`s ´loign´es l’une de l’autre au niveau fondamental,
tandis qu’elles interagissent en permanence au niveau de la physique appliqu´e.   e
              e                                                     e
     Les myst`res de U sont le travail exclusif des physiciens math´maticiens, et sont d’une bien trop
                e                                 e                                            e
grande difficult´ technique pour que des non-sp´cialistes puissent seulement en avoir une id´e; c’est
                         e                                                                      e
uniquement sur cette th´orie que se portent les recherches en physique des particules. La th´orie R
                     e     e                                               e
par contre, une fois ´nonc´es ses formules de base, ne laisse que des myst`res de nature philosophique
       e                            e e             e                        e        e e
(ou m´taphysique) sans possibilit´ d’´preuve exp´rimentale, et qui n’int´ressent g´n´ralement plus
les physiciens depuis longtemps.
                                           e                                e
     Rare en son genre, Roger Penrose rˆve d’unifier U et R comme ´tant deux approximations
          e
d’une th´orie plus vaste.
        e
La th´orie U
                                                      e
       C’est celle du monde quantique en lui-mˆme, de ses ondes et de ses particules qui sont une
   e                                                                                  e
mˆme chose, et dont on n’a actuellement pas fini de sonder les profondeurs math´matiques (sauf
                                        e                                      e                 e
approximations), lesquelles sont tr`s lointaines car cette exploration math´matique, tout en ´tant
                                                e                     e
fructueuse, repousse ses fondements extrˆmement loin. On esp`re en trouver un jour enfin le fond,
                           e
notamment avec la th´orie des supercordes.
                 e             e            e                 e                   e
       Cette th´orie est enti`rement d´terministe, de mˆme que dans une th´orie probabiliste les
                  e                 e                ee
valeurs calcul´es des probabilit´s sont consid´r´es comme parfaitement certaines. Le monde de la
   e                                                         e e                 e    e
th´orie U est un monde platonicien, et la notion de r´alit´ factuelle lui est ´trang`re. Son temps
       e                                  ee
est r´versible, en dehors des propri´t´s de quelques particules exotiques (exception sans rapport
          e
intrins`que avec le sens de variation de l’entropie).
                                          c                             a
       Elle peut se “construire” de fa¸on plus ou moins magique ` partir de la physique classique
                    e e        e
suivant un proc´d´ nomm´ “quantification”.
          e                           a                                             e
       Pr´cisions que ce n’est pas l` un lien exact et rigoureux, et ne peut pas en ˆtre un, bien que
     e         a                                              e
l’id´e soit l`, puisque le monde quantique n’est pas r´ductible au monde classique. Non que le
                              e                        e                                       e
monde quantique soit diff´rent de ce qui sera d´crit ici [partie en projet], mais ce qui sera d´crit ici
                         e                                          e                       e
n’est pas vraiment d´crit, car cette description sera vague, ´ludant ses nombreux probl`mes ainsi
                                                                            e
que d’autres notions fondamentales de la physique quantique, compl´mentaires de ceux-ci (dont
        e                      e                     ee    e                 e
les th´ories de jauge qui d´crivent “les propri´t´s m´caniques particuli`res” des diverses sortes de
                                  e     a                                                     e
particules, cette expression ´tant ` prendre avec beaucoup de guillemets; les pires probl`mes de
              e        e                          ee         e
divergence ´tant d´pendants de ces propri´t´s particuli`res, les omettre peut simplifier beaucoup la
   e                                                 e
pr´sentation). En un mot, elle sera non-math´matique (normal, ce n’est ici qu’une introduction !).
                      e                  e                            e                    e e
Non qu’elle soit d´pourvue de math´matiques, ou que les math´matiques ne puissent y p´n´trer, ou
                                o                                                       e        a
qu’elles n’y jouent pas un rˆle fondamental (bien au contraire !) mais que sa pleine r´duction ` une
             e                                                  e e               e
base math´matique serait extraordinairement ardue et g´n´ralement incompl`te. La formalisation
  e      e           e                                    e
d´taill´e de la th´orie pose, en effet, de graves probl`mes. On pourrait exprimer cette situation en
                    e
disant que la th´orie ne repose pas sur un fondement bien solide contenu dans quelques axiomes
                                                           e
clairs et qui expliquerait ou impliquerait tout en d´tail. Mais faute de fondement sur lequel se
                           e a                           e
reposer, on peut se rep´rer ` l’aide du plafond (la m´canique classique qui en est une approximation
et dont les objets sont, eux, clairs).
                         e                e      e                                            a
       Ici encore, les id´es qui seront ´nonc´es ne sont pas vraiment nouvelles par rapport ` ce qui
                                              a                           e    e          e e
est connu, car elles sont sous-jacentes ` tout le formalisme de la th´orie, mˆme si en g´n´ral on ne
                                      e
les trouve pas facilement explicit´es ainsi dans les cours sur le sujet.

                                                  49
                          e                                    a          e    e
     La restriction de l’´tude de la physique quantique ` des ph´nom`nes non-relativistes (aux
                                        e                                             e
vitesses faibles devant celle de la lumi`re) est le bon moyen couramment employ´ pour limiter dans
            e e                               e              e              ee        e       e
une premi`re ´tape la profondeur de la th´orie, ce mod`le approch´ ´tant enti`rement r´ductible
a           e                                          e                e
` un syst`me axiomatique sans trop de difficult´. Cette premi`re approche axiomatique claire
et maˆ                                               e     e
       ıtrisable de la physique quantique, appel´e “m´canique quantique de base” ou “premi`re        e
quantification”, est suffisante dans beaucoup de situations.
                                    e                                             e
     Mais nous n’allons pas proc´der ainsi car notre but ne sera pas de r´soudre des probl`mes     e
             e
standardis´s mais de donner un panorama plus large et qualitatif de la situation, en montrant au
                        ee                             a
maximum le sens et l’´l´gance des choses, quitte ` amener plus de questions que de r´ponses.e
                         e e                                          e                  a
     Voici donc le proc´d´ de quantification qui passe de la m´canique classique ` la m´caniquee
                              a                      e                                 e      e
quantique: il est semblable ` la construction de l’´quilibre statistique comme fond´ sur la m´canique
                         e                        e              e         a
classique, mais appliqu´ au niveau de la repr´sentation th´orique ` l’espace de configuration des
   e
sc´narios non soumis au principe de moindre action dans l’espace pseudo-euclidien. (On prend
                                                                     e
l’espace de configuration au lieu de l’espace des phases: la diff´rence ne consiste qu’en le fait que
                                     e                    e                 a
l’espace de phase y ajoute la donn´e des impulsions, li´e au rapport ` un temps qui n’existe plus et
                                e                                     e                        o
qui n’a en fait de toute mani`re pas d’influence sur le reste de l’´quilibre statistique). Le rˆle de la
      e               e                                                                   a
temp´rature est jou´ par la constante de Planck et l’action correspond finalement ` une quantit´        e
                                                E
                                              − kT           iA
               e
imaginaire d’´nergie: la loi de Boltzmann e         devient e      u
                                                               h o` A est l’action (normalement l’action
                                                               ¯

        e                         ea        e
est not´e S mais nous avons d´j` trop us´ la lettre S).
                            a                         e
     Dans cette analogie, ` la fonction probabilit´ correspond la fonction amplitude qui n’est plus
                 e                                        e
une probabilit´, puisqu’elle peut prendre des valeurs n´gatives voire complexes, que sa somme n’est
                   a                                               e                       e
plus contrainte ` valoir 1, et qu’elle ne sera pas la probabilit´ qui interviendra concr`tement.

       e
La th´orie R
                                      e          a       e                e e
      C’est celle qui traite du probl`me du lien ` l’exp´rience avec sa r´alit´ factuelle, ses mesures, son
                  o                                          e                                 e
hasard, son rˆle de l’observateur. Ses fondements math´matiques sont parfaitement d´finis et sans
       e                                          e       e                          e           e
myst`re, permettant de calculer les probabilit´s exp´rimentales en fonction pr´cise des r´sultats de
       e                                  e             e                  e
la th´orie U . En fait, c’est cette th´orie R elle-mˆme qui est la m´canique statistique quantique
                     e       e     e                                     e            c
que nous avons ´voqu´. Son ´criture en fonction de U n’est affect´e que de fa¸on superficielle par
                                                                      e
la grande reformulation que traverse U quand il passe de la m´canique quantique de base ` son          a
expression relativiste.
                 e                              e                e           e
      Le probl`me est qu’elle arrive sur la th´orie U sans y ˆtre invit´e; elle constitue une rupture
                 a e                   e
par rapport ` l’´volution gouvern´e par U , que U est par nature incapable de produire lui-mˆme          e
                                   e
(quelle que soit la complexit´ de l’environnement qu’on pourrait prendre en compte). De plus,
             e
aucune r`gle ne semble pouvoir indiquer quand ni comment elle intervient. Mais elle intervient
                     e                            e
d’une telle mani`re que la question des param`tres particuliers de son intervention, n’ayant (jusqu’`       a
   e                                                           e   e
pr´sent du moins) aucune influence mesurable sur les ph´nom`nes, ne se pose finalement pas : elle
intervient comme si elle n’intervenait pas. Elle est issue de nulle part et elle est introuvable (sans
                                                ıt´                     e                   e
qu’il y ait pour autant la moindre ambigu¨ e pratique sur les r´sultats de ses pr´dictions). De
           e                                                       e                         e
la mani`re la plus remarquablement subtile (et facilement d´montrable), elle est r´interpr´table      e
                    a      e            e
comme fondue ` l’int´rieur de la th´orie U jusqu’au dernier moment : tant que ce sont les appareils
                                            e
de mesure qui observent, on peut interpr´ter ces appareils de mesure comme n’ayant pas d´clench´    e       e
                    e                                     e      e
R mais comme ´tant de simples objets quantiques d´termin´s par U , et comme si seuls les humains
               e e
(ou plus g´n´ralement les organismes vivants) avaient le pouvoir de la faire intervenir, ce qui d’ici
 a e                   e
l` r´soud le probl`me de son intervention comme n’ayant pas eu lieu.
                       oe e              e
      D’un autre cˆt´, d`s qu’un syst`me un tant soit peu complexe et thermiquement agit´ comme    e
                                 e
un organisme vivant ou mˆme un simple appareil de mesure entre dans le coup, son agitation
                                   e      a         e      e                                 o
thermique engendre (conform´ment ` U ) un ph´nom`ne statistique de perte de contrˆle de certains
         e               e           e e e
param`tres du syst`me nomm´ d´coh´rence, tel qu’il ne reste plus aucune chance pour que la
     e                         e
diff´rence entre l’hypoth`se de la non-intervention de R ou de son intervention d’une mani`re              e
                       e e                                     e
correspondant pr´cis´ment au type d’observation effectu´e, puisse encore finalement jouer quelque
 o
rˆle observable que ce soit. Cette sorte d’intervention virtuelle donne ainsi en pratique le droit
             e
d’interpr´ter R comme ayant eu lieu.
      Mais, alors qu’au niveau microscopique (fondamental) l’intervention de R passe pour inexis-

                                                     50
                                     e
tente ou virtuelle, son existence r´elle globale est quasiment incontestable : c’est elle qui, une fois
                    a
pour toutes, fixe ` partir de rien l’orientation du temps thermodynamique (celui de la croissance
                e                                          e                           e
de l’entropie, ´quivalent au choix de l’ordre de causalit´ temporel) et qui fait se r´aliser un seul
                                             e        e                                        e
des avenirs possibles suivant les probabilit´s donn´es par les calculs lorsque ce que la th´orie U
  e
d´termine est en fait une combinaison d’avenirs ne se ressemblant pas du point de vue de ce qui
           e                   a                                                   e
est observ´ subjectivement ` l’observateur (par exemple dans la fameuse exp´rience du chat de
     o
Schr¨dinger, une combinaison (chat mort)+(chat vivant)). (A la rigueur on n’en a pas de preuve,
                                   e                     e      a                            e
on pourrait supposer qu’ils se r´alisent tous conform´ment ` U dans des univers parall`les qui `      a
              e     e
cause de la d´coh´rence perdent toute relation entre eux).
                                                                  e
     Et en fait, la situation est encore pire que cela. Cette th´orie R ne fait pas que laisser par-
fois un intervalle de temps et de circonstances possibles pour son intervention, entre lesquelles on
                          e                                               a e
ignorerait quelle hypoth`se d’intervention serait la vraie. Elle va jusqu’` d´montrer, si on admet
                                                                                e
quelques principes physiques difficilement contestables, qu’aucune des hypoth`se “raisonnables” de
     e e                e                                    e
loi g´n´rale pouvant d´terminer les circonstances particuli`res de son intervention dans l’intervalle
              e                                                                   e e
des possibilit´s, ne peut finalement tenir la route, cet intervalle de possibilit´s ´tant finalement
 e     a                         e                                                               e
r´duit ` l’ensemble vide d’apr`s ces principes sans qu’on puisse pour autant la prendre au pi`ge de
                          a
ses contradictions. Voil` ce que nous montrera le paradoxe EPR : non seulement on ne sait pas
                                                                        e              e
comment s’effectue l’intervention de R, mais en plus, alors que les pr´dictions exp´rimentales de
     e                                   e                     u e
la th´orie demeurent parfaitement coh´rentes et sans ambig¨it´, le raisonnement montre qu’aucun
   e                                               e           ee
sc´nario particulier d’intervention de R ne peut ˆtre consid´r´ comme “le vrai” sans rompre arbi-
                      e              e                  e
trairement une sym´trie du probl`me qu’aucune exp´rience ne vient mettre en doute par ailleurs.
                                    e                       e
Aucun, sauf l’impensable interpr´tation en univers parall`les (suivant laquelle R n’a jamais lieu et
                  o                                                                        e
le chat de Schr¨dinger demeure dans la superposition mort+vivant), toujours en coh´rence avec
                    e        e                        e
toutes les interpr´tations g´ocentriformes particuli`res.
6.2. Le paradoxe EPR
                                         e                                     e                    a
     C’est l’un des paradoxes les plus ´tranges de la physique quantique (th´orie R), qui, au-del` de
                 e
la simple dualit´ onde/particule ou du principe d’incertitude, exprime assez nettement le probl`me  e
                                e                                                     e
que cette physique pose au r´alisme classique. Et il semble que sa signification pr´cise n’ait pas ´t´ ee
                   e    e
toujours vulgaris´e tr`s parfaitement : on trouve souvent l’affirmation d’une influence instantan´e      e
                                                          e      e         u e
d’une particule sur l’autre, comme si cette influence ´tait r´elle. D’o` pr´texte pour dire que la
   e                   e                       ıne            e                         a             e
th´orie de la relativit´ restreinte, qui entraˆ l’impossibilit´ d’une relation de cause ` effet propag´e
                                                     e  e                                   e
plus vite que c, serait fausse. Or, dans ce ph´nom`ne quantique il n’y a rien, ni th´oriquement
       e
ni exp´rimentalement, qui permette de situer effectivement dans l’espace-temps quelque influence
                                           e                                              e
que ce soit plus rapide que c. Seul le r´alisme classique peut nous y conduire, en d´posant l` sona
e
´chec qu’il n’a pas voulu avouer ailleurs.
                                                                                  e     e
     Et pour mieux cerner sa signification, nous nous concentrerons ici sur l’´nonc´ exact des pr´-     e
              e                     e                                              e
dictions exp´rimentales de la th´orie quantique dans les purs termes des cons´quences observables
                                                       e           e
de R oubliant tous ses liens avec U par lesquels ces r´sultats se d´montrent habituellement, en sorte
                                  e           e e                  e                           e
de ne pas confondre les myst`res de la r´alit´ avec les interm´diaires de calcul. Ces pr´dictions
          ee e e           e                        e                          e        e
auraient ´t´ v´rif´es exp´rimentalement d’apr`s les nouvelles de ces derni`res ann´es. (Mais je ne
      e              e e               e          e                   e
m’int´resse pas pr´cis´ment aux d´tails exp´rimentaux du probl`me, et le but de cette page est
                      e                       e
uniquement d’en pr´senter ses aspects th´oriques.)
Quelles particules utiliser ?
             e       ee                             ee       u
      L’exp´rience a ´t´ faite avec des photons corr´l´s. D’o` l’erreur classique de certaines personnes
                                                                                 e     e
n’ayant pas de connaissances solides en physique, de supposer que ce ph´nom`ne de corr´lation     e
                                       e                                           e
s’expliquerait par le fait que la dur´e du voyage d’un photon est pour lui-mˆme toujours nulle, ce
        e                             e e
qui pr´serverait un lien de causalit´ r´ciproque de ces photons sur leur origine commune. Ceci est
                              e                a                               e     e
faux, la vitesse de la lumi`re n’ayant rien ` faire avec tout cela : le ph´nom`ne est en principe
    e                                      e
ind´pendant du type de particule utilis´ et de leurs vitesses.
      A ceux qui font cette erreur, je conseille de s’efforcer de mieux comprendre ce que dit la
           e           a                                 e
relativit´ restreinte ` ce sujet : la mesure des dur´es est une chose, mais l’ordre de causalit´       e
                                               e e                        e
temporel en est une tout autre. Entre deux ´v`nements distincts reli´s par une droite de direction
          e              e
de lumi`re, bien que l’´cart en mesure de temps soit nul, l’ordre temporel n’a lieu que dans un seul

                                                  51
                                   e e                                o            e    e    e
sens. Ce qui peut influencer un ´v`nement se trouve dans son cˆne de lum`re pass´e (int´rieur et
        e                                 o              e
fronti`re), tandis que les points de son cˆne de lumi`re future ou de l’hyperplan t = 0 en sont bien
loin.
            e       e                                        e
     La mˆme exp´rience peut se concevoir avec des ´lectrons, sauf que dans ce cas elle devient
                        a e                                                e           e
beaucoup plus difficile ` r´aliser techniquement. Voici pourquoi : la r´ussite de l’exp´rience suppose
                             e e                  e                   e
que la particule (ou plus pr´cis´ment le param`tre qui nous int´resse dans la particule, ici le spin
      e
de l’´lectron) n’a subi aucune interaction thermique avec son environnement, qui ferait perdre en
                                                                             e
la dispersant dans la nature cette information sur le spin qu’on veut ´tudier.
            e         e
     Or, l’´lectron pr´sente un risque d’interaction avec l’environnement beaucoup plus fort que le
                                                                ee           e
photon, parce qu’il interagit avec les photons (le champ ´l´ctromagn´tique) tandis que le photon
                                 e
n’interagit qu’avec des charges ´lectriques, or il est beaucoup plus difficile de vider l’espace de ses
photons que de le vider de ses charges : le rayonnement thermique, qu’on pourrait d’ailleurs appeler
                                    e            e                   e e
“l’agitation thermique du champ ´lectromagn´tique”, est en g´n´ral relativement important, et il
                                                   e                                      a
a d’autant plus le temps de perturber un des ´lectrons avant qu’ils ne parviennent ` la distance
                                                                               e
voulue l’un de l’autre, que leur vitesse est faible devant celle de la lumi`re. Donc probablement le
                                                             e e                   e   e
seul moyen de faire le vide de rayonnement serait de r´frig´rer les parois pr`s du z´ro absolu.
                        e                 e                        e                        e
     Cependant nous d´crirons cette exp´rience dans le cas d’´lectrons, pour des motifs th´oriques :
                         ae                  e                e
     1) Dans le fond, “` ´quivalence math´matique pr`s”, cela ne change rien : toute exp´riencee
                            e                                 e
(et les paradoxes qui en d´coulent) avec le spin d’un ´lectron est exactement traduisible en une
    e                                                                    e
exp´rience avec la polarisation d’un photon et inversement. Cette ´quivalence vient du fait que le
             e                                                                     e
nombre d’´tats quantiques possibles du spin de chaque particule (ce qui d´signe la dimension de
                                  e     a
son espace de Hilbert) est le mˆme, ` savoir 2 (il en faut au moins 2 pour qu’il se passe quelque
          a                                   e
chose, ` partir de 3 ce serait plus compliqu´).
                                                 e
     2) Entre ces deux cas, c’est le cas de l’´lectron, et uniquement lui, qui manifeste dans la
 e e                                                 e                           e
g´om´trie de l’espace physique la forme des sym´tries internes du probl`me quantique consid´r´,  ee
               ee                                     e                            ee e e
ou si on pr´f`re celle de ses manifestations exp´rimentales. Ces propri´t´s g´om´triques sont
                             a                         e
remarquables (son rapport ` U s’exprime par la th´orie des spineurs), plus que dans la description
de la polarisation du photon.
                  e                   e                    e
     3) Par la mˆme occasion, le r´cit de cette exp´rience permettra de se familiariser avec les
         ee              e                                      e
propri´t´s du spin de l’´lectron et la notion de doublet d’´lectrons qu’on rencontre en chimie.

                                                                                e
    Nous allons donc maintenant entrer dans quelques manifestations de la th´orie R. N’oublions
                           e                                          e            e
pas qu’il n’existe aucune s´paration qu’on puisse faire entre cette th´orie et la m´canique statis-
                                                                                               a
tique. Les vecteurs que nous emploierons seront uniquement des vecteurs de l’espace euclidien ` 3
                  ee            e e         e
dimensions, un r´f´rentiel galil´en ´tant fix´ une fois pour toutes.

                         e
Mesure du spin d’un ´lectron
       Prenons d’abord le cas d’un seul ´lectron. C’est une particule de spin 1 . Que repr´sente son
                                         e                                        2          e
                                                                             e
spin ? Dans le langage de la physique classique, c’est son moment cin´tique de rotation sur lui-
   e                  a
mˆme. C’est bien l` l’objet quantique qui se conserve dans U et qui, dans la correspondance entre
                                                                                e
physique classique et physique quantique, traduit la notion de moment cin´tique qui se conserve.
       Or, du point de vue de la physique classique, en choisissant conventionnellement une orientation
                             e                         e
de l’espace, on peut repr´senter ce moment cin´tique par un vecteur σ. Comme un moment
     e                  e a                           h                  e
cin´tique est homog`ne ` une action, c’est donc ¯ lui servira d’unit´ de mesure de la norme de σ
en physique quantique, et la propri´t´ de spin 2 signifie que “classiquement”, ||σ|| = 1 .
                                       ee          1
                                                                                          2
                                                                e                             e
       Mais, du point de vue quantique, il n’y a que deux ´tats possibles du spin d’un ´lectron ,
pouvant donner un seul bit d’information : ce spin vaut un tel vecteur de norme 1 , ou bien son
                                                                                        2
        e                                        e
oppos´. Et pas un autre vecteur. Il est orient´ dans un sens, mais il n’a pas de direction. S’il avait
                                                   ee                e
une direction, cette direction serait une propri´t´ du spin de l’´lectron plus riche que cette seule
              a                 e                         e        e       e
alternative ` deux possibilit´s : ce serait un param`tre port´ par l’´lectron pouvant varier con-
                                   e                e                                           e e
tinument, en prenant une infinit´ de valeurs diff´rentes au passage. Mais une telle diversit´ d’´tats
                                       ee
n’existe pas. (On peut voir avec la t´l´portation quantique qu’en un certain sens, l’information sur
  e                  e              e
l’´tat de spin de l’´lectron peut ˆtre classiquement contenue dans deux bits d’information, soit un
e
´tat parmi quatre possibles.)

                                                  52
                                                          e
     Alors, comment se manifeste le sens du spin de l’´lectron, sans qu’il ait une direction ? C’est
       e                                                            e
l’exp´rimentateur qui, pour observer ce sens, est libre d’en d´cider la direction comme il veut. Il
choisit une droite, ou ce qui revient au mˆme une paire de vecteurs oppos´s {σ, −σ} de norme 1 , de
                                             e                                   e                      2
       e        e                                                        e
mani`re sym´trique : il ne propose pas un vecteur puis son oppos´, mais les deux en mˆme temps   e
                    e                               e                 a              a e
pour n’en privil´gier aucun a priori. Son exp´rience consiste ` demander ` l’´lectron : “Autour
de cette droite, dans quel sens tournes-tu ?” (Ou pour le dire plus rigoureusement, il lui demande
                                  e                                                        e
non le vecteur moment cin´tique mais sa composante suivant la direction donn´e, sans s’occuper
                                        e                                        e
des autres composantes). Alors, n´cessairement, sans l’ombre d’une h´sitation ni quelque autre
humeur que ce soit, celui-ci donnera sa r´ponse, qui sera l’un des deux vecteurs σ et −σ (en fait,
                                              e
l’une des deux valeurs ± 1 de cette composante). Mais alors, comment cette r´ponse d´pend-elle
                               2                                                          e       e
de la direction choisie ?
                              e                      e                 e                e         a
     Voici ce que dit la th´orie dans le cas d’un ´lectron dans un ´tat spatial pr´cis, c’est-`-dire une
disposition de la fonction d’onde dans l’espace physique, qui englobe l’information en positions et
                        e                   e                                e               e
impulsions de cet ´lectron (ceci afin d’´viter toute question de corr´lation entre l’´tat spatial et
  e
l’´tat de spin):
                       e            e                e
     1) Pour tout ´lectron d’´tat spatial donn´ issu d’un processus dont les conditions initiales
                e                                      a
seraient enti`rement connues en un certain sens (` savoir qu’il n’existe aucune influence ext´rieure   e
                  e          e                    ee a              e                            ee
qui aurait pu ˆtre analys´e et qui ne l’a pas ´t´; ` ce titre, un ´tat statistique est consid´r´ comme
                                                                  1
enti`rement connu), il existe un vecteur σ de norme ||σ|| ≤ 2 qui r´sume l’influence mesurable de
     e                                                                     e
                                    e             ee e e                                   e
ces conditions sur le spin de l’´lectron consid´r´ s´par´ment du contexte de l’exp´rience, au sens de
    e                                                             e                  e
la r`gle suivante: quel que soit le vecteur unitaire u, si l’exp´rimentateur d´cide alors de mesurer
le spin suivant la direction de u, la probabilit´ d’obtenir u sera ´gale ` 1 + σ · u. Ce vecteur σ est
                                                   e          2        e       a 2
              e              e
alors appel´ le spin de l’´lectron produit par ce processus.
                                e     e      e                       e       e
     On remarque que cet ´nonc´ est coh´rent avec la possibilit´ de d´cider au hasard du processus
                                                   a e                                e
qui produira le spin: le processus qui consiste ` d´cider suivant une probabilit´ p de faire appel ` un  a
processus produisant le spin σ et suivant la probabilit´ 1 − p de faire appel ` un autre processus qui
                                                         e                         a
produit le spin σ , n’est finalement rien d’autre qu’un processus produisant le spin pσ + (1 − p)σ .
                             e                                                            e
     2) Quelle qu’ait pu ˆtre la situation auparavant, si on mesure le spin d’un ´lectron suivant la
paire {σ, −σ}, apr`s la mesure le spin de l’´lectron au sens du 1) sera ´gal au r´sultat trouv´ par la
                       e                        e                             e         e            e
                           e              e
mesure (cette mesure d´truit donc enti`rement toute autre information qui a pu exister auparavant
dans ce spin).
     Ainsi, une fois obtenu le r´sultat d’une mesure, par exemple 1 u, si on lui pose ` nouveau
                                      e                                      2                   a
                     e                            e                                 e
exactement la mˆme question (suivant la mˆme direction u), il donnera n´cessairement la mˆme             e
           1
 e
r´ponse 2 u, Par contre, si on lui pose ensuite la question de sa direction par rapport ` un autre
                                                                                                 a
                                                                         1
vecteur unitaire v, il r´pondra par une nouvelle valeur de σ = ± 2 v suivant la probabilit´ ´gale `
                          e                                                                         ee     a
  1
( 2 + σ · u). Si apr`s cela on lui redemande sa direction suivant u, il aura oubli´ sa premi`re r´ponse,
                     e                                                                e        e     e
                       e         e                              e                       e
mais sa nouvelle r´ponse d´pendra uniquement de la derni`re qu’il avait donn´e, suivant la mˆme          e
loi de probabilit´. e

   e                           ee
Pr´paration de la paire corr´l´e
                               e                                         e
     On part d’un doublet d’´lectrons. C’est un ensemble de deux ´lectrons qui sont dans un mˆme        e
e                                e                      e
´tat spatial, mais “dans des ´tats de spin oppos´s” au sens de ce que nous allons d´crire. Poure
                                      a                        e    e
l’obtenir, il suffit de les contraindre ` se mettre dans le mˆme ´tat spatial, car le principe d’exclusion
                   e      e    a                  e       e                   e    e
de Pauli les empˆche d’ˆtre ` la fois dans le mˆme ´tat spatial et le mˆme ´tat de spin (ou pour le
                                        e                 e    e                               e
voir autrement, il implique que deux ´lectrons de mˆme ´tat spatial sont de spin oppos´s). (En fait,
le principe d’exclusion de Pauli et le principe d’incertitude de heisenberg ne se pas des principes
                e
mais des cons´quences d’autres lois).
                                                                               e
     Enfin, cela n’est pas parfaitement exact : ils sont bien dans des ´tats de spin oppos´s mais     e
      e                                                                                 a
leurs ´tats spatiaux ne sont pas identiques mais seulement assez proches (c’est-`-dire que les prob-
      e       e                                 e                           e
abilit´s de r´sultats de toute mesure de cet ´tat spatial sur les deux ´lectrons sont des probabilit´s     e
                                           e
voisines l’une de l’autre et de faible corr´lation. . . en les distinguant l’un de l’autre suivant leur spin
                  a                e        e                          e                  e e
bien entendu), ` cause de la r´pulsion ´lectrostatique qui empˆche cette identit´ d’ˆtre parfaite.
Na¨                                           e                     e                 e
   ıvement, on pourrait penser que cette r´pulsion entre les ´lectrons les empˆche de se rencontrer,
                                                                                  a
et rend ainsi superflu le principe d’exclusion de Pauli. Ce n’est pas vrai, ` cause d’un ph´nom`ne  e     e

                                                    53
ondulatoire quantique qui se manifeste par ce qu’on appelle l’effet tunnel : alors qu’il faudrait
                     e                                                     e
classiquement une ´nergie infinie pour que des charges ponctuelles de mˆme signe se rencontrent,
      e                             e             e         e
en m´canique quantique la densit´ de probabilit´ du syst`me dans l’espace de configuration d’un
doublet ne tend pas vers 0 lorsque la distance r entre eux tend vers 0.
     Pour que le principe d’exclusion de Pauli puisse se mettre en œuvre, il faut le rendre dominant
        e         e                                          e
sur la r´pulsion ´lectrostatique. Dans le cas d’une paire d’´lectrons seuls mobiles dans un environ-
                                     e         e                                 e           e
nement fixe, le seul moyen est de r´duire leur ´talement spatial ∆x. En effet, l’´nergie de r´pulsion
                                       1
´lectrostatique est proportionnelle ` r tandis que l’´nergie de r´pulsion due au principe d’exclusion
e                                    a               e           e
                                                                                                   ¯
                                                                                                   h
se lit sur le principe d’incertitude de Heisenberg avec r ≈ ∆x : l’impulsion p est de l’ordre de ∆x
                                                                                     2
                                                                                            p
      e            e
et l’´nergie cin´tique d’une particule d’impulsion p et de masse m vaut 2m , soit une ´nergie de          e
                 2
               ¯
               h
                                                                                         e      e
l’ordre de mr2 . Pour des distances assez faibles, il domine donc sur la r´pulsion ´lectrostatique.
       En pratique on n’a pas besoin que le principe d’exclusion devienne infiniment plus grand que
     e           e                        e                          e                      e
la r´pulsion ´lectrostatique : si les ´lectrons sont confin´s dans un espace r´duit, la d´composition  e
     e                                           e
en ´tats distincts suivant les niveaux d’´nergie donne d’une part des doublets (o` les spins sont  u
                       e   e            e                               e      e       e
exactement oppos´s mˆme si les ´tats spatiaux peuvent ˆtre tr`s diff´rents), et d’autre part des
e         u                      e
´tats o` les spins des deux ´lectrons s’ajoutent en un certain sens. Le plus bas niveau d’´nergie des    e
                                                     e             u
doublets est plus bas que celui des paires d’´lectrons o` les spins s’ajoutent; il suffit donc de laisser
          e                 e
le syst`me perdre son ´nergie pour obtenir un doublet. En fait, ce n’est pas exactement vrai `                a
                                     a                                 e           e
une distance encore plus petite ` cause du moment magn´tique de l’´lectron qui vient perturber ce
    e       e                                                   e
ph´nom`ne par l’interaction entre les spins des deux ´lectrons, mais c’est une bonne approximation.
                                                       e                                   u
       En particulier dans le cas de l’atome d’h´lium, le puits de potentiel dˆ au noyau a cet effet de
                e                     e      e                  e
confiner les ´lectrons dans un mˆme ´tat spatial, cr´ant un doublet.
                                                        e             e
       Maintenant qu’on a le doublet, il faut s´parer les ´lectrons. Bon, ici ce n’est pas pratique,
                                   a
mais imaginons qu’on arrive ` virer le noyau sans influer sur le spin (en le bombardant par un
                      e                                                                       e
neutron de haute ´nergie par exemple, ou encore en appliquant un fort champ ´lectrique qui envoie
     e                                                                       u
les ´lectrons dans un sens et le noyau dans l’autre sens; bien sˆr on parle ici de th´orie et non dee
       e
la m´thode la plus pratique pour tester EPR).
            a                 e                                                    e
       Voil` donc nos deux ´lectrons du doublet subitement libres de s’´loigner l’un de l’autre. Main-
tenant, on veut qu’ils se retrouvent dans deux boˆ                                       e
                                                               ıtes distinctes qu’on ´loignera ensuite l’une de
               e                            ıte
l’autre, un ´lectron dans chaque boˆ (les boˆ                                        e     e
                                                          ıtes sont elles aussi tr`s th´oriques, pour supposer
                                                                  e
qu’elles puissent contenir et transporter chacune un ´lectron sans perturber son spin). Comment
                                                          e                e
peut-on faire ? Il ne faut surtout pas trier les ´lectrons d’apr`s leur spin, il n’y aurait plus d’effet
EPR. Il faut que jusqu’au dernier moment, aucune mesure ou autre influence ext´rieure ne vienne  e
interagir avec leur spin.
                               e
       Il faut les trier d’apr`s leur position spatiale. Pour cela, on peut par exemple disposer une
   ıte                oe                       e
boˆ de chaque cˆt´, attendre que les ´lectrons puissent venir dedans, fermer les boˆ et compter     ıtes
                                                  e                             ıte.
s’il y a bien, oui ou non, exactement un ´lectron dans chaque boˆ Sinon, on recommence (avec
                                                       ıtes
un autre doublet, ou bien en rouvrant les boˆ pour laisser une seconde chance ` notre doublet),  a
         a
jusqu’` ce que cette condition voulue se r´alise.  e
                     c
       Maintenant, ¸a y est, notre paire EPR est prˆte.      e
                                       e
Mesure des spins d’une paire EPR d’´lectrons
                                        e                           e
    Nous avons maintenant deux exp´rimentateurs avec chacun son ´lectron dans une boˆ les ıte,
      e        e                   e
deux ´lectrons ´tant issus d’un mˆme doublet. Et chacun peut, quand il veut, mesurer le spin de
    e
son ´lectron dans la direction qu’il veut.
                                     e     e              e     e      a                e
    Quels sont alors les probabilit´s de r´sultats ? La th´orie ´nonce ` ce sujet les pr´dictions
suivantes :
Proposition 1. Le premier qui mesure le spin, quelle que soit la direction choisie, obtient in-
diff´remment l’un ou l’autre r´sultat suivant la probabilit´ 1 chacun, autrement dit son spin est
    e                          e                           e 2
                                              e     e                 e
nul avant la mesure au sens que nous avons ´nonc´. Notons σ le r´sultat de la mesure. Alors ce
 e                  ıtre       e                e                   e
r´sultat fait connaˆ l’autre ´lectron comme ´tant de spin oppos´: si l’autre observateur mesure
                e                   a                                                        e
le spin de son ´lectron par rapport ` un autre vecteur v, alors la connaissance du premier r´sultat
permet d’estimer la probabilit´ d’obtenir 2 v pour le deuxi`me ` la hauteur de ( 1 − σ · v).
                               e          1
                                                           e     a               2

                                                      54
                                   e                                            e       e
Proposition 2. Si les deux exp´rimentateurs mesurent chacun leur spin de mani`re ind´pendante,
suivant des directions librement choisies au dernier moment par eux (peu importe comment), alors,
                                          e         e            e                    e
le choix de leurs directions de mesure ´tant donn´, la probabilit´ que le couple des r´ponses soit
un certain (σ, σ ) est ´gale ` ( 1 − σ · σ ).
                       e     a 4
                                                                                      e
Proposition 3. Comme on le voit, les propositions 1 et 2 ne sont que des formulations ´quivalentes
      e    e               ee                                e
d’un mˆme r´sultat, interpr´t´ suivant des points de vue diff´rents.
                        e        e
Consistance du ph´nom`ne d’un point de vue quantique.
                    e       e e                                         e                ee
       D’une mani`re g´n´rale (quels que soient les syst`mes consid´r´s avec un plus grand nombre
   e              e                                                        e
d’´tats), le r´sultat de mesures successives ne peut diff´rer du cas de mesures ind´pendantes que           e
                         u
dans la situation o` une mesure viendrait affecter l’autre partie du syst`me par une interactione
      e                                                       e               e
mat´rielle (quelle qu’en soit la forme, champ ´lectromagn´tique ou autre). Or, conform´ment ` la                   e     a
           e
relativit´ restreinte, une telle influence ne se produire d’une mesure sur l’autre que suivant l’ordre
                                 e e                                                             e
temporel entre ces deux ´v`nements, autrement dit pas plus vite que la lumi`re. Si l’intervalle entre
les mesures est de type espace, ces mesures sont ind´pendantes.       e
                                                     e           e     e
       Chaque observateur peut interpr´ter le ph´nom`ne en disant que les mesures ont lieu dans
            u                              a                                           c
l’ordre o` il les observe, c’est-`-dire l’ordre dans lequel il en re¸oit l’information par des signaux
                                                                                  e            e e
lumineux. Donc dans le cas EPR, si les deux mesures sont ind´pendantes (s´par´es par un intervalle
                                             e                                e
de type espace), chacun des exp´rimentateurs peut consid´rer que c’est lui qui effectue la premi`re                        e
                                                                                    e
mesure qui a une chance sur deux de donner l’un ou l’autre r´sultat. Ce r´sultat obtenu, il peut  e
                 e                          e              e                          e     e
alors consid´rer (les chances ult´rieures de r´sultats sur) l’autre ´lectron ´loign´ exactement commee
                 ea          e                   e                                                 e
s’il l’avait d´j` mesur´ suivant la mˆme direction et qu’il en avait obtenu le r´sultat oppos´. En un                e
                                                             e     e
certain sens, on pourrait dire que c’est le mˆme ´lectron dont la ligne d’univers va d’une mesure
` l’autre en passant par le doublet initial. (Ceci ne remet nullement en question l’orientation du
a
                                                                 e                    e
temps : les lignes d’univers des particules sont d´crites par la th´orie U qui ignore l’ordre temporel
en tant qu’ordre de causalit´.)        e
                                                                   e                e
       Le lien qui existe dans la loi de probabilit´ entre les r´sultats de mesures, n’est pas une
                                    e                            e
interaction mais une corr´lation quantique, qui ´tend la notion classique de corr´lation entre deux     e
                      e                                  e              e
parties d’un syst`me (que nous avions d´finie en m´canique statistique: une loi de probabilit´                               e
p(x, y) qui n’est pas de la forme p1 (x)p2 (y)). En effet, quelle que soit la situation, toute identit´                      e
     e                                e                                       e
alg´brique entre probabilit´s valable dans le cas des corr´lations classiques est ´galement valable      e
                          e                                                      ee
dans le cas de corr´lations quantiques, et les seules propri´t´s qui peuvent ˆtre mises en d´faut    e                 e
                e    e                              e              e
sont des in´galit´s sur ces probabilit´s. La corr´lation quantique ne fait que prolonger l’espace
           e                                             e               e
des corr´lations classiques, utilisant les mˆmes param`tres et leur permettant simplement d’aller
                                        e          e                                     e
“un peu plus loin” sur la mˆme lanc´e. On sait bien qu’une corr´lation classique n’a absolument
aucune chance de transmettre quelque information que ce soit, ne faisant qu’exprimer un hasard qui
  e        ea                                             e                     e e
s’´tait d´j` produit avant que les sous-syst`mes ne soient s´par´s. En allant un peu plus loin dans
         e
la corr´lation, on ne fait que multiplier par quelque chose une interaction instantan´e ` distance             e a
      e
qui ´tait nulle, ce qui donne toujours une interaction nulle.
                 e                                              ee
       Un syst`me statistique classiquement corr´l´ devrait avoir une entropie d’au moins ln 2 pour
               e                          a            e                       a
pouvoir pr´senter un spin nul ` la premi`re mesure, jusqu’` la valeur maximale de 2 ln 2 correspon-
                               e                  ee
dant au cas d’un syst`me non corr´l´. Par contre, l’entropie d’une paire EPR d’´lectrons reste              e
nulle tant qu’aucune mesure de spins n’est effectu´e.                e
         e e                    e          e                                     e
       Pr´cis´ment, d’apr`s la th´orie quantique, les paires d’´lectrons suivantes sont dans le mˆme                     e
e                                              e
´tat concernant le spin pour des ´tats spatiaux donn´s “dans deux boˆ   e                                  a
                                                                                            ıtes” (c’est-`-dire que quel
                               e                                         a
que soit le type d’exp´rience qu’on puisse concevoir ` partir d’une paire d’´lectrons, les lois de   e
              e             e
probabilit´s sur les r´sultats observables seront toujours identiques d’une paire ` l’autre):           a
                                           e                                                     e
       – D’une part, une paire d’´lectrons founis par un processus ayant secr`tement tir´ au sort un            e
                       e                         e                                    e
vecteur u uniform´ment sur la sph`re, puis fourni une paire d’´lectrons mesur´s comme ´tant de         e             e
                    1             1
spins respectifs 2 u et − 2 u (l’information sur ce vecteur ´tant ensuite oubli´e).
                                                                             e                    e
                                             e                                                     e
       – D’autre part, une paire d’´lectrons founis par un processus ayant secr`tement tir´ au sort le            e
                                                                                               e1
choix entre donner une paire EPR (issue d’un doublet) suivant la probabilit´ 3 , ou donner une paire
d’´lectrons de spins compl`tement al´atoires (spins nuls et ind´pendants) suivant la probabilit´ 2 .
   e                                 e             e                                e                                    e 3
               e e                        e e                                     e
       Plus g´n´ralement, des th´or`mes similaires peuvent se d´montrer pour tout syst`me quantique          e

                                                             55
    ee                                                e                         e
corr´l´, quels que soient le nombre de parties du syst`me et la forme (nombre d’´tats quantiques
                 e
possibles suppos´ fini) de chaque partie.
 ´                  e
Echec de l’interpr´tation classique
                                       e
     Classiquement, on serait tent´s de faire le raisonnement suivant pour deux mesures ind´pen-          e
dantes.
                  e                                          e         e           e
     Chaque exp´rimentateur, une fois sa mesure effectu´e, peut pr´dire le r´sultat de l’autre d’une
      e                      e
mani`re probabiliste, et mˆme certaine si les directions des mesures sont identiques. Et comme
                                           e                                           e
aucune des deux mesures ne peut r´ellement affecter l’autre, il peut consid´rer que le r´sultat          e
                  e       e                                                                 a
de l’autre est d´termin´ d’avance quoi qu’il fasse. Du moins, c’est ce qui vient ` l’esprit quand
           e            u                                      e
on consid`re le cas o` les mesures se font suivant la mˆme direction. Or, chacun peut choisir
                                                                       e
sa direction au dernier moment sans que cela ait la moindre cons´quence sur (les probabilit´s de          e
                                                                                               e
mesure de) l’autre particule. Donc, puisque c’est vrai quand les directions sont les mˆmes et qu’un
                                             a                     e                   e
choix de direction n’a aucune influence ` distance sur l’autre ´lectron, cela doit ˆtre vrai de mani`re      e
  e e
g´n´rale.
                             e
     Ainsi, les chances des r´sultats qu’on peut obtenir suivant les directions choisies sont d´termi-  e
  e                                                                                          e
n´es avant sa mesure. On peut alors compendre les propositions sur les probabilit´s de mesure en
                                                         e               e
disant que sur l’ensemble des chances initiales du syst`me, une moiti´ M sont des chances d’obtenir
                                                                                e       e
un vecteur σ si on mesure dans cette direction, et d’autre part une moiti´ M ´galement sont des
                                   e
chances d’obtenir pour l’autre ´lectron un vecteur σ si on le mesure dans cette autre direction.
     Quand on compare M ` M , une proportion de ( 1 − 2 σ · σ ) de chances issues de M se
                                a                             2
retrouvent dans M (ce sont les chances dans M ∩ M ), et les autres qui auraient donn´ le r´sultat e     e
oppos´ (celles de M − M ) sont remplac´es dans M par un autre ensemble (M − M ) de chances
        e                                      e
                  e
issues du compl´mentaire de M .
                                                               e
     D’autre part, si au lieu de cela on effectue la deuxi`me mesure suivant une autre direction,
      e
le mˆme raisonnement s’applique avec un ensemble M de chances d’obtenir un vecteur σ . Et
                    e a                                                                  e
on est alors amen´s ` penser qu’entre une direction ou une autre pour la deuxi`me mesure, si on
compare l’ensemble M des chances qu’on avait d’obtenir σ avec celui M de celles d’obtenir σ ,
           e                                 a
la quantit´ de remplacements de M ` M ne devrait pas surpasser la somme des quantit´s de                  e
                         a                 a                                e
remplacements de M ` M et de M ` M . C’est ce qu’on appelle l’in´galit´ de Bell.    e
                                  e e                e    e       e
     Or, cette conclusion est r´fut´e par les r´sultats ´nonc´s plus haut de la physique quantique.
                                                                                 e
On peut le voir par un simple exemple, ou qualitativement de la mani`re suivante. Entre des
                    e
mesures des deux ´lectrons suivant deux directions proches formant un angle θ, on est presque sˆr            u
d’obtenir les r´sultats oppos´s, la proportion d’exceptions ´tant ´gale ` 1−cos θ , soit une quantit´
                e              e                                  e  e       a      2                         e
nulle au premier ordre au voisinage de θ = 0. Les chances ne varient donc pas au premier ordre
d’approximation lorsqu’on bouge v au voisinage de u. Mais comme la position de u ne devrait
                                                                              e
avoir aucune influence sur la proportion de chances qui sont remplac´es pour le r´sultat de la   e
       e                                                                 e
deuxi`me mesure, cette annulation au premier ordre de la quantit´ de remplacements lors d’un
  e                          e
d´placement de v devrait ˆtre valable pour toute position de v, donc finalement de proche en
                                         e
proche en additionnant les quantit´s de remplacements successifs, pour toute variation de v, ce
                              e                                           a
qui est absurde puisque le r´sultat doit s’inverser lorsque v va jusqu’` se retourner vers la position
oppos´e.e
                                                                e              e      e a
     Ainsi, le raisonnement classique sur les “causes” des r´sultats observ´s m`ne ` des conclusions
                                                           e
contradictoires, ce qui prouve que les objets invoqu´s dans le raisonnement (les ensembles de
            e                e                     e                               a
chances pr´existantes qui d´terminent les r´sultats) ne correspondent pas ` des objets r´els. Ceci  e
                                e
vient du fait que parler du r´sultat qu’on obtiendrait si on effectuait une certaine mesure n’a pas
                                                 e               e                         e
de sens tant que cette mesure n’est pas r´ellement effectu´e. Et pour mesurer l’´tat des spins de
                                     a
la paire, on n’a que deux essais ` disposition : mesurer une fois le spin de l’un, et une fois le spin
                                                           e             ee              e
de l’autre. Il est impossible de produire un triplet d’´lectrons corr´l´s de la mˆme mani`re (cela    e
                                                       e
n’est pas concevable dans le formalisme de la m´canique quantique).
                      a                e     e
     En conclusion, ` cause des in´galit´s qui ne sont plus valables, le hasard quantique de l’obser-
                                                                                            e
vation d’un spin ne peut pas se comprendre suivant l’intuition classique comme ´tant d´termin´       e        e
                             e                       ea
par une cause (un “jet de d´s”) qui existait d´j` dans l’environnement local de chaque observateur
avant qu’il n’effectue sa mesure.


                                                      56

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:2
posted:9/1/2012
language:French
pages:56