1.8. Copules#

Une copule est une fonction permettant de modéliser et de simuler les lois multidimensionnelles à partir de leurs marginales.

Pour comprendre la construction prenons un exemple. On souhaite simuler 3 variables aléatoires \(\tau_1\), \(\tau_2\) et \(\tau_3\), appelées instants de défauts par la suite. L’instant de défaut \(\tau_i\) représente par exemple la durée de vie d’un composant \(i\) et cette durée de vie est modélisée par une loi exponentielle de paramètre \(\lambda_i > 0\). Ainsi

\[\begin{equation*} \forall i \in \{ 1,2,3 \}, \quad \tau_i \sim \mathcal{E}(\lambda_i). \end{equation*}\]

On veut que les instants de défauts soient corrélés: si un composant fait défaut (tombe en panne) la durée de vie d’un autre composant est réduite. Comment simuler le vecteur \((\tau_1, \tau_2, \tau_3)\) ?

La question est donc de mettre une “structure de corrélation” entre les variables aléatoires \(\tau_i\). Pour cela on a recourt aux fonction copules. Pour simuler \(\tau_i\) il suffit de poser

\[\begin{equation*} \tau_i = - \frac{1}{\lambda_i} \log(U_i) \quad \text{avec $U_i \sim \mathcal{U} \big( ]0,1[ \big)$}, \end{equation*}\]

mais attention le vecteur \((U_1, U_2, U_3)\) ne doit pas être uniforme sur \(]0,1[^3\), c’est à dire que les v.a. \(U_i\) ne doivent pas être indépendantes sinon on aurait aussi indépendance entre les \(\tau_i\). Pour construire un vecteur \((U_1, U_2, U_3)\) dont les marginales sont uniformes et les composantes corrélées on peut par exemple utiliser un vecteur gaussien \((G_1, G_2, G_3)\). En effet

\[\begin{equation*} \text{si} \quad \begin{pmatrix} G_1 \\ G_2 \\ G_3 \end{pmatrix} \sim \mathcal{N}\left( 0, \begin{pmatrix} 1 & a & b \\ a & 1 & c \\ b & c & 1 \end{pmatrix} \right) \quad \text{alors} \quad U_i = F_{\mathcal{N}(0,1)}(G_i) \sim \mathcal{U} \big( ]0,1[ \big), \end{equation*}\]

et \(\operatorname{cov}(U_i, U_j) \neq 0\) pour \(i \neq j\) (\(F_{\mathcal{N}(0,1)}\) est la fonction de répartition de la loi \(\mathcal{N}(0,1)\)).

1.8.1. Définition et résultats principaux#

Soit \(d \ge 1\) et \(X\) une variable aléatoire à valeurs dans \(\mathbf{R}^d\). La fonction de répartition (multidimensionnelle) \(F\) de \(X = (X_1,\dots,X_d)\) est définie par

\[\begin{align*} F: \mathbf{R}^d & \to [0,1] \\ x = (x_1,\dots, x_d) & \mapsto \mathbf{P} \big( X_1 \le x_1, \dots, X_d \le x_d \big). \end{align*}\]

Dans la suite on note \(\{X \le x\} = \{X_1 \le x_1, \dots, X_d \le x_d\}\).

Definition 1.3

Une fonction \(C:[0,1]^d \to [0,1]\) est appelée copule de dimension \(d \ge 2\) si \(C\) est la restriction à \([0,1]^d\) de la fonction de répartition d’une variable aléatoire \(U = (U_1, \dots, U_d)\) dont chaque marginale \(U_i\) est de loi uniforme sur \([0,1]\) i.e.

\[\begin{equation*} \forall u \in [0,1]^d, \quad C(u) = \mathbf{P}(U \le u) \end{equation*}\]

Voici quelques propriétés d’une fonction copule.

Proposition 1.7

Soit \(u \in [0,1]^d\). On a les propriétés suivantes:

  1. pour tout \(1 \le i \le d\), \(C(u_1, \dots, u_{i-1}, 0, u_{i+1}, \dots, u_d) = 0\),

  2. pour tout \(1 \le i \le d\), \(C(1, \dots, 1, u_i, 1, \dots, 1) = u_i\),

  3. pour tout \(1 \le i \le d\), l’application \(\big(v \to C(u_1, \dots, u_{i-1}, v, u_{i+1} , \dots, u_d) \big)\) est croissante,

  4. la fonction \(C\) est Lipschitz i.e.

    \[\begin{equation*} \forall u, v \in [0,1]^d, \quad |C(u) - C(v)| \le \sum_{i=1}^d |u_i - v_i|. \end{equation*}\]

Proof. Les 3 premiers points découlent directement de la définition de la fonction \(C\) comme fonction de répartition d’un vecteur \((U_1, \dots, U_d)\).

Montrons le point 4. en utilisant le lemme algébrique suivant.

Lemma 1.1

Soit \((a_k)_{k \ge 1}\) et \((b_k)_{k \ge 1}\) deux suites réelles bornées par 1 i.e. \(|a_k| \le 1\) et \(|b_k| \le 1\). Alors

\[\begin{equation*} \left|\prod_{k=1}^n a_k - \prod_{k=1}^n b_k\right| \le \sum_{k=1}^n |a_k - b_k|. \end{equation*}\]

Soit \(u, v \in [0,1]^d\), alors

\[\begin{equation*} |C(u) - C(v)| \le \mathbf{E} \Bigg[ \left| \prod_{i=1}^d \mathbf{1}_{U_i \le u_i} - \prod_{i=1}^d \mathbf{1}_{U_i \le v_i} \right| \Bigg], \end{equation*}\]

et d’après le lemme

\[\begin{equation*} |C(u) - C(v)| \le \sum_{i=1}^d \mathbf{E} \big[ \big| \mathbf{1}_{U_i \le u_i} - \mathbf{1}_{U_i \le v_i} \big| \big]. \end{equation*}\]

On conclut en remarquant que \(|\mathbf{1}_{U_i \le u_i} - \mathbf{1}_{U_i \le v_i}| = \mathbf{1}_{u_i \wedge v_i < U_i \le u_i \vee v_i}\) et \(\mathbf{P} \big(u_i \wedge v_i < U_i \le u_i \vee v_i \big) = |u_i - v_i|\).

Definition 1.4

Soit \(X = (X_1, \dots, X_d)\) une variable aléatoire de \(\mathbf{R}^d\) de fonction de répartition \(F\). On note \(F_i\) la fonction de répartition de la \(i\)-ème marginale \(X_i\). Une copule pour \(X\) est une copule \(C\) vérifiant

\[\begin{equation*} \forall x \in \mathbf{R}^d, \quad F(x_1, \dots, x_d) = C \big( F_1(x_1), \dots, F_d(x_d) \big). \end{equation*}\]

On vérifie d’abord que l’application \(\big( x \mapsto C\big( F_1(x_1), \dots, F_d(x_d) \big) \big)\) est bien une fonction de répartition d’une v.a. \(X \in \mathbf{R}^d\). Soit \((U_1, \dots, U_d)\) de fonction de répartition \(C\) et on pose \(X = \big( F_1^{-1}(U_1), \dots, F_d^{-d}(U_d) \big)\)\(F_i^{-1}\) est l’inverse généralisée de \(F_i\). Alors

\[\begin{align*} \mathbf{P} \big( X \le x \big) &= \mathbf{P} \big( F_1^{-1}(U_1) \le x_1, \dots, F_d^{-1}(U_d) \le x_d \big), \\ &= \mathbf{P} \big( U_1 \le F_1(x_1), \dots, U_d \le F_d(x_d) \big), \\ &= C\big( F_1(x_1), \dots, F_d(x_d) \big). \end{align*}\]

Le résultat important est le suivant: il indique qu’on peut toujours construire une loi multidimensionnelle à partir des lois marginales et d’une fonction copule.

Theorem 1.3 (de Sklar)

Pour tout vecteur aléatoire \(X \in \mathbf{R}^d\) il existe une copule pour \(X\). Si les fonctions de répartitions \(F_i\) des marginales \(X_i\) sont continues alors cette copule est unique.

Proof. Montrons uniquement le cas continu. Soit \(X\) un vecteur aléatoire de \(\mathbf{R}^d\). On note \(F\) sa fonction de répartition multidimensionnelle et \(F_i\) la fonction de répartition de sa \(i\)-ème marginale \(X_i\). On pose \(U_i = F_i(X_i)\). Alors si \(F_i\) est continue, la variable aléatoire \(U_i\) est uniforme sur \([0,1]\). On considère \(C\) la fonction de répartition de \((U_1, \dots, U_d)\) alors

(1.7)#\[\begin{align} \mathbf{P} \big(X \le x \big) &= \mathbf{P} \big( X_1 \le x_1, \dots, X_d \le x_d \big), \\ &= \mathbf{P} \big(U_1 \le F_1(x_1), \dots, U_d \le F_d(x_d) \big),\\ &= C\big( F_1(x_1), \dots, F_d(x_d) \big). \end{align}\]

Par construction et continuité des \(F_i\) la fonction \(C\) est unique.

1.8.2. Exemples de copules#

1.8.2.1. Copule d’indépendance#

Il s’agit de la fonction de répartition \(C:[0,1]^d \to [0,1]\) d’un vecteur \((U_1, \dots, U_d) \sim \mathcal{U} \big(]0,1[^d \big)\) c’est à dire

\[\begin{equation*} \forall u \in [0,1]^d, \quad C(u) = \prod_{i=1}^d u_i. \end{equation*}\]

1.8.2.2. Copule de comonoticité#

C’est la fonction \(M\) définie sur \([0,1]^d\) par

\[\begin{equation*} \forall u \in [0,1]^d, \quad M(u) = \min_{1 \le i \le d} u_i. \end{equation*}\]

Il s’agit donc de la fonction de répartition du vecteur \((U_1, \dots, U_1)\). La copule de comonoticité apparait comme un cas extrème de dépendance et on a les bornes suivantes: toute copule \(C\) vérifie

\[\begin{equation*} \forall u \in [0,1]^d, \quad \Big( \sum_{i=1}^d u_i - d + 1 \Big)_+ \le C(u) \le M(u). \end{equation*}\]

Ces bornes sont appelées bornes de Fréchet. On peut remarquer que dans le cas \(d = 2\) la borne inférieure est la copule du vecteur \((U_1, 1-U_1)\).

1.8.2.3. Copule Gaussienne#

On considère \(\phi\) la fonction de répartition de la loi normale centrée réduite et pour une matrice de corrélation \(\Sigma\) donnée (avec des 1 sur la diagonale) la fonction de répartition multidimensionnelle \(\Phi_{\Sigma}\) définie par

\[\begin{equation*} \forall x = (x_1, \dots, x_d), \quad \Phi_{\Sigma}(x) = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_d} \frac{e^{-\frac{1}{2} y^t \Sigma^{-1} y}}{(2 \pi)^{d/2} \sqrt{\det(\Sigma)}} \operatorname{d}\!y_1 \dots \operatorname{d}\!y_d. \end{equation*}\]

La copule gaussienne \(C_{\Sigma}\) est définie par

\[\begin{equation*} C_{\Sigma}(u) = \Phi_{\Sigma} \big( \phi^{-1}(u_1), \dots, \phi^{-1}(u_d) \big). \end{equation*}\]

Note

Il est classique de considérer la copule Gaussienne, dite à un facteur, introduite de la façon suivante. Soit \(\rho\) un paramètre fixé de \(]0,1[\). On pose

\[\begin{equation*} U_i = \phi \big( \sqrt{\rho} Z + \sqrt{1-\rho} G_i \big) \end{equation*}\]

\(Z \sim \mathcal{N}(0,1)\) et \(G = (G_1,\dots, G_d) \sim \mathcal{N}(0, \operatorname{Id}_d)\) sont indépendantes. En notant \(\tilde G_i = \sqrt{\rho} Z + \sqrt{1-\rho} G_i\) on vérifie que \(\tilde G_i \sim \mathcal{N}(0,1)\) et que le vecteur \(\big(\tilde G_1, \dots, \tilde G_d\big)\) est de covariance

\[\begin{equation*} \Sigma = A A^t = \begin{pmatrix} 1 & \rho & \cdots & \rho \\ \rho & 1 & \ddots & \vdots \\ \vdots & \ddots & \ddots & \rho \\ \rho & \cdots & \rho & 1 \end{pmatrix} \end{equation*}\]

avec \(A = \begin{pmatrix} \sqrt{\rho} & \sqrt{1-\rho} & 0 & \cdots & 0 \\ \sqrt{\rho} & 0 & \sqrt{1-\rho} & \ddots & \vdots \\ \vdots & \vdots & \ddots & \ddots & 0 \\ \sqrt{\rho} & 0 & \cdots & 0 & \sqrt{1-\rho} \end{pmatrix}.\)
Le vecteur \(\big(U_1, \dots, U_d \big)\) a pour fonction de répartition la copule Gaussienne \(C_\Sigma\).

1.8.2.4. Copules archimédiennes#

Il s’agit de toute une famille de copules qui se construisent à partir de la transformée de Laplace d’une loi sur \(\mathbf{R}^+\).