3.1. Chaine de Markov en temps long#
Soit \((X_n)_{n \ge 0}\) une chaîne de Markov (CM) sur \(E\) dénombrable de matrice de transition \(P\). Dans la suite, \(\mu\) désigne un mesure positive sur \(E\), non nulle et telle que \(\mu(x) < +\infty\) pour tout \(x \in E\).
Une mesure positive \(\mu\) sur \(E\) est invariante pour \(P\) si elle vérifie
Ce système d’équations linéaires est appelé équations de bilan global. Une probabilité invariante pour \(P\) (ou stationnaire) est une mesure invariante de masse 1.
Si \(X_0\) suit la loi \(\pi\) invariante pour \(P\) alors \(X_n \sim \pi\) pour tout \(n \ge 0\), d’où le nom de probabilité stationnaire: la loi marginale \(X_n\) sera la loi \(\pi\), la même pour tout indice \(n \ge 0\).
Soit \(\pi\) une probabilité invariante pour \(P\) sur \(E\) vérifiant \(\pi(x) > 0\) pour tout \(x \in E\). On introduit la matrice \(Q\) par
Alors \(Q\) est une matrice stochastique car pour tout \(x\in E\), \(\sum_{y \in E} Q(x, y) = 1\). De plus, si \(X_0 \sim \pi\) on a (formule de Bayes)
Ainsi on peut interpréter \(Q\) comme la matrice de transition de la chaîne de Markov après retournement du temps. Cela introduit la notion de réversibilité.
La CM de transition \(P\) est réversible par rapport à la mesure positive \(\mu\) si
Ce système d’équations linéaires est appelé équations de bilan détaillé.
Par abus, on dit que \(\mu\) est une mesure réversible. Il est important de noter que si \(P\) est réversible par rapport à \(\mu\) alors \(\mu\) est invariante pour \(P\). En effet si \(P\) est réversible par rapport à \(\mu\)
La notion de mesure réversible est plus forte que celle de mesure invariante: une mesure peut être invariante sans être réversible.
Si \(P\) est réversible par rapport à une probabilité \(\pi\) et \(X_0 \sim \pi\) alors pour tout \(n \ge 0\), le vecteur \((X_0,\dots, X_n)\) a même loi que le vecteur (retourné en temps) \((X_n, \dots, X_0)\).
Ces systèmes d’équations linéaires (3.1) ou (3.2) permettent de trouver algébriquement une expression explicite de \(\mu\), mais lorsque \(\operatorname{card}(E)\) est grand ces systèmes sont complexes à résoudre. Ensuite il faut normaliser la mesure \(\mu\) et donc calculer la constante de normalisation \(\sum_x \mu(x)\) ce qui est aussi coûteux. Une alternative est d’utiliser la convergence de la CM vers sa probabilité stationnaire. Pour cela il est utile de rappeller de deux notions importantes: l’irréductibilité et l’apériodicité de la CM.
Une CM est irréductible si la probabilité d’atteindre un point \(y \in E\) partant d’un point \(x \in E\) en un nombre fini d’étapes est strictement positive i.e.
Dans toute la suite on considère des chaines de Markov irréductible sur \(E\). On admet le résultat suivant.
Une CM irréductible possède au plus une probabilité invariante \(\pi\) et \(\pi(x) > 0\) pour tout \(x \in E\). Si \(E\) est fini alors une CM irréductible possède une unique probabilité invariante.
Un état \(x \in E\) est dit apériodique si \(\exists N_x \ge 1\), \(\forall n \ge N_x\), \(P^n(x, x) > 0\). Une chaine de Markov dont tous les états sont apériodiques est dite apériodique.
Une chaine de Markov irréductible qui possède 1 état apériodique est apériodique.
Une chaine de Markov \((X_n)_{n \ge 0}\) vérifie la condition de Doeblin s’il existe \(\ell \ge 1\), \(\alpha > 0\) et \(c\) une probabilité sur \(E\) tels que
Il est important de remarquer qu’une chainte de Markov irréductible qui vérifie la condition de Doeblin est apériodique. Si \(E\) est fini, la proposition suivante donne la réciproque.
Si \(E\) est fini, une CM irréductible vérifie la condition de Doeblin si et seulement si elle est apériodique.
La condition de Doeblin permet d’obtenir la convergence de \((X_n)_{n \ge 0}\) vers sa probabilité invariante et une vitesse de convergence géométrique qui dépend de \(\alpha\) et de \(\ell \ge 1\). La vitesse est d’autant plus rapide que \(\ell\) est petit et \(\alpha\) proche de 1.
Dans la suite on note \(\|\cdot\|\) la norme en variation d’une mesure (signée) \(\mu\) sur \(E\) définie comme \(1/2\) de la norme \(l^1\) d’un vecteur de \(\mathbf{R}^E\) i.e.
Si \((X_n)_{n \ge 0}\) est une CM de matrice de transition \(P\) irréductible vérifiant la condition de Doeblin, alors pour toute loi initiale \(\nu\) de \(X_0\), la loi de \(X_n\) converge en variation vers une probabilité \(\pi\), plus précisément
De plus \(\pi\) est l’unique probabilité invariante de \((X_n)_{n \ge 0}\).
Proof. On suppose d’abord le cas \(\ell = 1\). Soit \(\mu\) et \(\mu'\) deux probabilités quelconques sur \(E\), alors
Or \(\sum_{x \in E} (\mu(x) - \mu'(x)) c(y) = 0\) pour tout \(y \in E\) donc
Par inégalité triangulaire et comme \(P(x, y) - \alpha c(y) \ge 0\) et \(\sum_{y \in E} (P(x, y) - \alpha c(y)) = 1-\alpha\), on obtient par Fubini
L’application \(\big( \mu \mapsto \mu P \big)\) est contractante de rapport \((1-\alpha)\) pour la norme en variation. Elle admet donc un unique point fixe qu’on note \(\pi\), probabilité sur \(E\) vérifiant \(\pi = \pi P\). Si \(X_0\) est de loi \(\nu\) alors \(X_n\) est de loi \(\nu P^n\) et
en itérant. On conclut en remarquant que \(\|\nu - \pi\| \le \|\nu\| + \|\pi\| = 1\).
Pour le cas général \(\ell > 1\), on considère la chaine de Markov \((X_{k \ell})_{k \ge 0}\) qui est de transition \(P^\ell\) et qui vérifie Doeblin avec \(\ell' = 1\), le même \(\alpha > 0\) et la même probabilité \(c\) que \((X_n)_{n \ge 0}\). D’après ce qui précède, si \(X_0 \sim \nu\) alors
où \(\pi\) est l’unique probabilité vérifiant \(\pi = \pi P^\ell\) i.e. \(\pi\) est invariante pour \(P^\ell\). Mais on a
donc \(\pi P\) est invariante pour \(P^\ell\) et par unicité \(\pi = \pi P\) donc \(\pi\) est invariante pour \(P\). Soit \(n \ge 1\) une itération que l’on écrit sous la forme \(n = k \ell + p\) avec \(0 \le p < \ell\), alors
d’où le résultat énoncé avec \(k = \lfloor n / \ell \rfloor\).