Sur la diagonalisation des matrices 2x2
Yves Coudène, 20/10/04

On sait que toute matrice A, à coefficients réels ou complexes, dont les valeurs propres sont toutes distinctes, est diagonalisable. Peut-on réaliser cette diagonalisation de manière continue ? En d’autres termes, peut-on choisir la matrice conjuguant A à une matrice diagonale, de façon à ce quelle dépende continument de A ? Le but de ce texte est de démontrer que cela n’est pas possible sur tout l’ouvert des matrices dont les valeurs propres sont toutes distinctes.

1. Etude locale
Remarquons d’abord que si M est conjuguée à une matrice diagonale D par le biais d’une matrice U GLn,

U1MU = D

alors les coefficients diagonaux de D sont des valeurs propres de M et les vecteurs colonnes de U sont des vecteurs propres de M. Réciproquement, si U est une matrice inversible dont les colonnes sont des vecteurs propres de M, alors U1MU est diagonale.

Par conséquent, diagonaliser M continument revient donc peu ou prou à faire un choix pour les vecteurs propres de M, qui dépende continument de M.

Ce choix est toujours possible localement, au voisinage d’une matrice dont toutes les valeurs propres sont distinctes. C’est une application classique du théorème d’inversion locale.

Pour simplifier, on va se restreindre au cas des matrices 2x2, et donner des expressions explicites pour ces conjuguaisons. Intéressons nous au cas des matrices à coefficients réels et notons 𝒰 l’ouvert de M2(R) correspondant aux matrices ayant leurs deux valeurs propres distinctes.

𝒰 = {M M2(R)|Δ(Pc(n))0}

Pc(M) est le polynôme caractéristique de M et Δ est son discriminant : Δ(x2 + αx + β) = α2 4β. Cet ouvert 𝒰 a deux composantes connexes 𝒰+ et 𝒰 correspondant à Δ > 0 et Δ < 0. Considérons le cas Δ > 0, c’est à dire le cas où M a ses deux valeurs propres réelles.

M = ( ab c d )

Les deux valeurs propres de M sont données par les expressions :

λ+ = 1 2(a + d + (a d)2 + 4bc),λ = 1 2(a + d (a d)2 + 4bc)

Elles dépendent continument de a,b et c sur l’ouvert 𝒰+. Les vecteurs propres associés à λ+ sont proportionnels à ( b a λ + ) ; remarquons que ce vecteur est lui-même proportionnel à ( d λ+ c ). Les vecteurs propres associés à λ sont proportionnels à ( b a λ ) ; remarquons que ce vecteur est lui-même proportionnel au vecteur propre ( d λ c ).

On peut donc former différentes matrices susceptibles de diagonaliser M à partir de ces vecteurs ; par exemple, la matrice ( b b a λ +a λ ), dont le déterminant est égal à b(λ+ λ), ou ( b d λ a λ+c )de déterminant égal à bc + (a λ+)2 (car λ+ + λ = a + d), ou encore ( d λ+ b c a λ )de déterminant égal à bc (a λ)2. Par conséquent :

Sur 𝒰+ {b0},

( abcd ) = ( b b a λ+ a λ )1 ( λ+ 0 0 λ ) ( b b a λ +a λ )

Sur 𝒰+ {aλ+,|bc| < (a λ+)2},

( abcd ) = ( b d λ a λ+ c )1 ( λ+ 0 0 λ ) ( b d λ a + λ+ c )

Sur 𝒰+ {aλ,|bc| < (a λ)2},

( abcd ) = ( d λ+ b c a λ )1 ( λ+ 0 0 λ ) ( d λ+ b c a λ )

Les trois ouverts précédents recouvrent 𝒰+ ; on est donc parvenu à diagonaliser ( ab c d ), au moins localement. Le problème est que les trois matrices qui réalisent ces conjuguaisons ne coïncident pas sur l’intersection de ces ouverts, si bien qu’il n’est pas possible de les "recoller" afin de former une solution globale continue qui conjugue M à une matrice diagonale.

On pourrait penser que cela est dû à un mauvais choix quant au choix des vecteurs propres que nous avons fait. Il n’en est rien :

Théorème 1 Soit K = R et 𝒰 = {M M2(R)|Δ(Pc(M)) > 0} ,
ou K = C et 𝒰 = {M M2(C)|Δ(Pc(M))0}.
Il n’existe pas de fonction continue f : 𝒰GL2(K) telle que, pour tout M 𝒰, f(M)1Mf(M) soit diagonale.

Remarque  : ce théorème est en fait vrai en toute dimension.

2. Le cas réel

Remarquons que si une telle fonction f existait, alors on pourrait diagonaliser continument les matrices symétriques à l’aide de matrices de S02. En effet, si v1,v2 sont les deux vecteurs colonnes de f(M) : f(M) = (v1,v2), alors f~(M) = ( v1 |v1|, v2 |v2|) conjugue encore M à une matrice diagonale. Si M est symétrique, ses vecteurs propres v1 et v2 sont orthogonaux ; par conséquent f~(M) 02(R). La fonction f~(M) detf~(M) S02(R) réalise donc la conjuguaison recherchée. Le théorème précédent découle donc de l’énoncé suivant :

Théorème 2 Soit Sym(R2) = {M M 2(R)|tM = M}.
Il n’existe pas de fonction continue f : 𝒰 Sym(R2)S0 2(R) telle que, pour tout M 𝒰 Sym(R2), f(M)1Mf(M) soit diagonale.

Au lieu de considérer l’ensemble de toutes les matrices symétriques, on peut même se restreindre à la classe de conjugaison d’une matrice diagonale A0 𝒰. Posons

𝒪A0 = {UA0U1|U S0 2(R)}

Les matrices de la forme f(A)1Af(A), A 𝒪A0, sont diagonales et conjuguées à A0 ; elles ont donc les même valeurs propres que A0. Il n’existe qu’un nombre fini de telles matrices, elles sont obtenues en permutant les termes diagonaux de A0. Comme 𝒪A0 est connexe, on voit que f(A)1Af(A) est constant. Quitte à multiplier f par une matrice de permutation, on peut donc supposer que f(A)1Af(A) est égale à A0.

Théorème 3 Soit A0 𝒰 une matrice diagonale.
Il n’existe pas de fonction continue f : 𝒪A0S02(R) tel que

f(A)1Af(A) = A 0.

Lemme 1 Soit A0 𝒰 une matrice diagonale.
Si A = UA0U1 = V A 0V 1, alors UV 1 est diagonale

Preuve du lemme
UV 1 doit commuter avec A0. La matrice UV 1 doit donc laisser invariant les sous-espaces propres de A0 ; ceux-ci sont engendrés par les vecteurs de la base canonique. La matrice UV 1 est donc diagonale.

Preuve du théorème
Soit 𝒟 le sous-ensemble des matrices diagonales de S02. Considérons la projection π de S02 sur 𝒪A0 donnée par  :

π :SO2(R)𝒪A0 U UA0U1

Le lemme montre que les "fibres" de cette projection s’identifient naturellement à 𝒟 S02(R) :

π(u) = π(v)uv1 𝒟 S0 2(R).

L’existence de f permettrait d’établir un homéomorphisme entre S02(R) et 𝒪A0 × (𝒟 S02(R)) :

𝒪A0 × (𝒟 S02(R)) S02(R) (A,D) f(A)D

On peut écrire explicitement l’inverse de cette application :

𝒪A0 × (𝒟 S02(R)) S02(R) (UA0U1,f(UA 0U1)1U) U

La matrice f(UA0U1)1U est bien diagonale car elle commute avec A0. En effet, d’après la définition de f, on doit avoir l’égalité :

f(UA0U1)1UA 0U1f(UA 0U1) = A 0.

On est parvenu a une absurdité. Il n’existe pas d’homéomorphisme entre S02(R) et 𝒪A0 × (𝒟 S02(R)) car S02(R) est connexe tandis que 𝒟 S02(R) = {Id,Id} n’est pas connexe.

Remarques
– La preuve se généralise à des matrices de taille quelquonque.
– L’application π est un revétement à deux feuillets non trivial de S1 par S1.

3. Le cas complexe
Les énoncés précédents se généralisent au cas complexe en remplaçant S02(R) par SU2(C) et les matrices symétriques par les matrices hermitiennes.

Les arguments précédents établiraient un homéomorphisme entre SU2(C) et 𝒪A0 × (𝒟 SU2(C)). Mais SU2(C) est homéomorphe à S3 qui est simplement connexe ; l’homéomorphisme est donné par :

{(a,b) C2||a|2 + |b|2 = 1} SU 2(C) (a,b) ( a b b ¯ a¯ )

tandis que 𝒟SU2(C) = { ( ei𝜃 0 0 ei𝜃 )|𝜃 R} est homéomorphe au cercle S1, qui n’est pas simplement connexe.

Remarques
– On peut démontrer que 𝒪A0 est homéomorphe à la sphère S2. La projection π : SU2(C)𝒪A0 est la fibration de Hopf.
– La preuve se généralise en dimension quelquonque. Le groupe 𝒟 SUn(C) est maintenant homéomorphe à un tore S1 × S1 × × S1.