Variables antithétiques

2.5. Variables antithétiques#

On expose pour commencer l’idée de la méthode dans le cas simple où \(X = f(U)\) avec \(U \sim \mathcal{U}([0,1])\). La transformation \(T(u) = 1-u\) préserve la loi uniforme sur \([0,1]\) (on dit que la loi est invariante par cette transformation) donc

\[\begin{equation*} I = \mathbf{E}\big[f(U)\big] = \frac{1}{2} \Big( \mathbf{E}\big[f(U)\big] + \mathbf{E}\big[f(1-U) \big] \Big) = \mathbf{E} \Big[ \frac{f(U) + f(1-U)}{2} \Big]. \end{equation*}\]

Cette égalité suggère d’utiliser l’estimateur suivant, appelé estimateur antithétique,

\[\begin{equation*} \forall n \ge 1, \quad \frac{1}{n} \sum_{k=1}^n \frac{f(U_k) + f(1-U_k)}{2} \end{equation*}\]

\((U_k)_{k \ge 1}\) suite i.i.d. uniforme sur \([0,1]\). On considère \(\operatorname{cost}(f(U_1)) = \kappa\) et on suppose que \(\operatorname{cost}(f(U_1) + f(1-U_1)) = 2 \kappa\) (le coût de la v.a. \(U_1\) est supposé négligeable devant l’évaluation de \(f\)). Pour comparer cet estimateur antithétique \(\tilde I_n\) avec l’estimateur standard \(I_n = \frac{1}{n} \sum_{k=1}^n f(U_k)\) il faut comparer leurs efforts

(2.8)#\[\begin{equation} \operatorname{effort}(I_n) = \kappa \operatorname{var}(f(U)) \quad \text{et} \quad \operatorname{effort}(\tilde I_n) = 2 \kappa \operatorname{var}\Big(\frac{f(U) + f(1-U)}{2}\Big). \end{equation}\]

Or

(2.9)#\[\begin{equation} \operatorname{var}\Big(\frac{f(U) + f(1-U)}{2} \Big) = \frac{1}{2} \big( \operatorname{var}(f(U)) + \operatorname{cov}(f(U), f(1-U)) \big), \end{equation}\]

donc

(2.10)#\[\begin{equation} \operatorname{effort}(\tilde I_n) = \operatorname{effort}(I_n) + \kappa \operatorname{cov}(f(U), f(1-U)). \end{equation}\]

L’estimateur antithétique \(\tilde I_n\) est plus efficace que \(I_n\) si et seulement si \(\operatorname{cov}(f(U), f(1-U)) \le 0\) c’est à dire si \(f(U)\) et \(f(1-U)\) sont négativement corrélées. La proposition suivante permet de conclure lorsque \(f\) est monotone.

Proposition 2.3 (Principe de comonotonie)

Soit \(Z\) une variable aléatoire. On considère \(\varphi\) et \(\psi\) 2 fonction réelles monotones et de même monotonie. On suppose \(\varphi(Z), \psi(Z) \in \mathbf{L}^2\), alors

\[\begin{equation*} \operatorname{cov}\big(\varphi(Z), \psi(Z) \big) \ge 0. \end{equation*}\]

Proof. Soit \(Z_1\) et \(Z_2\) deux variables aléatoires. Comme les fonctions \(\varphi\) et \(\psi\) ont même monotonie on a

\[\begin{equation*} \big(\varphi(Z_1) - \varphi(Z_2)\big) \big(\psi(Z_1) - \psi(Z_2)\big) \ge 0 \end{equation*}\]

(cette inégalité est vrai ponctuellement i.e. pour tout \(\omega \in \Omega\)). En développant le produit et en prenant l’espérance on obtient

\[\begin{equation*} \mathbf{E}\big[\varphi(Z_1) \psi(Z_1)\big] - \mathbf{E}\big[\varphi(Z_1) \psi(Z_2)\big] - \mathbf{E}\big[\varphi(Z_2) \psi(Z_1)\big] + \mathbf{E}\big[\varphi(Z_2) \psi(Z_2)\big] \ge 0 \end{equation*}\]

Si on suppose que \(Z_1\) et \(Z_2\) ont même loi et sont indépendantes alors on obtient

\[\begin{equation*} 2 \Big( \mathbf{E}\big[\varphi(Z_1) \psi(Z_1)\big]- \mathbf{E}\big[\varphi(Z_1) \big] \mathbf{E}\big[\psi(Z_1) \big] \Big) \ge 0, \end{equation*}\]

d’où le résultat.

Corollary 2.1

Soit \(U \sim \mathcal{U}([0,1])\). Si \(f\) est monotone alors

(2.11)#\[\begin{equation} \operatorname{cov} \big( f(U), f(1-U) \big) \le 0, \end{equation}\]

et l’estimateur antithétique \(\tilde I_n\) est efficace.

Proof. Il suffit d’appliquer la proposition précédente avec \(X = U\), \(\varphi = f\) et \(\psi(u) = -f(1-u)\).

On peut sans difficulté généraliser cette approche au cas multidimensionnel. Voici le théorème général que l’on peut énoncer.

Proposition 2.4

Soit \(f:\mathbf{R}^d \to \mathbf{R}\) une application dont les marginales sont monotones i.e. \(x_i \mapsto f(x_1,\dots, x_i, \dots, x_d)\). Soit \(Z_1, \dots, Z_d\) des variables aléatoires indépendantes et \(T_i : \mathbf{R} \to \mathbf{R}\) des applications décroissantes telles que \(T_i(Z_i) \sim Z_i\) (invariance de la loi de \(Z_i\) par \(T_i\)). Si \(f(Z_1, \dots, Z_d) \in \mathbf{L}^2\) alors

\[\begin{equation*} \operatorname{cov} \big(f(Z_1,\dots, Z_d), f(T_1(Z_1), \dots, T_d(Z_d)) \big) \le 0, \end{equation*}\]

et l’estimateur antithétique \(\tilde I_n = \displaystyle \frac{1}{2 n} \sum_{k=1}^n \big( f(Z_1^{(k)},\dots,Z_d^{(k)}) + f(T_1(Z_1^{(k)}),\dots,T_d(Z_d^{(k)})) \big)\) est efficace.