Inverse de la fonction de répartition

1.3. Inverse de la fonction de répartition#

Dans toute cette section X est une variable aléatoire réelle définie sur un espace de probabilité (Ω,A,P).

Definition 1.1

On appelle fonction de répartition de X la fonction F:R[0,1] définie par F(x)=P(Xx) pour tout xR. En anglais cette fonction s’appelle cumulative distribution function (cdf).

On rappelle des propriétés usuelles.

Property 1.1

La fonction de répartition F de X vérifie

  • F est croissante et continue à droite,

  • si X est finie p.s., limxF(x)=0 et limx+F(x)=1,

  • pour tout xR, la limite à gauche de F en x existe et vaut F(x)=P(X<x). Ainsi F(x)F(x)=P(X=x) et la fonction F possède au plus un nombre dénombrable de points de discontinuité.

Dans toute la suite on considère une variable aléatoire réelle X finie p.s. ie P(|X|<+)=1.

Proposition 1.1

La fonction de répartition caractérise la loi: deux variables aléatoires réelles ont même loi si et seulement si elles ont même fonction de répartition.

Si X est une variable aléatoire dont la loi est absolument continue par rapport à la mesure de Lebesgue et de densité f telle que f(x)>0 p.p. alors sa fonction de répartition est strictement croissante. En effet on a

xR,F(x)=P(Xx)=xf(y)dy.

La fonction F est donc une bijection de R dans ]0,1[ et il existe une fonction réciproque F1 (inverse pour la composition) telle que F(F1(x))=F1(F(x))=x. La fonction réciproque est strictement croissante et continue. De plus on vérifie aisément que

XF1(U)avecUU(]0,1[).

En effet, pour tout xR, P(F1(U)x)=P(UF(x))=F(x). Pour simuler selon la loi de X, c’est à dire obtenir une réalisation X(ω) on peut alors transformer un nombre pseudo-aléatoire en appliquant la fonction F1.

Cette approche peut se généraliser à des variables aléatoires réelles quelconques (lois discrètes ou mélanges par exemple). Pour cela on introduit l’inverse généralisée F1 d’une fonction croissante continue à droite F par la définition

u]0,1[,F1(u)=inf{xR,F(x)u}.

Definition 1.2

On appelle fonction quantile de X l’inverse généralisée de la fonction de répartition F de X. Pour p]0,1[, la quantité F1(p) s’appelle le quantile ou fractile d’ordre p de la loi de X.

Proposition 1.2

La fonction quantile est croissante continue à gauche et vérifie

(1.3)#xR,u]0,1[,F(x)uxF1(u).

Proof. Montrons (1.3). Soit xR et u]0,1[. Le sens direct est trivial, en effet par définition de F1, si F(x)u alors xF1(u). Pour le sens réciproque, si xF1(u) alors pour tout ε>0 on a x+ε>F1(u) ce qui implique F(x+ε)u (définition de F1). En faisant tendre ε vers 0 on obtient par continuité à droite de F que F(x)u.

Proposition 1.3

Soit X une variable aléatoire réelle de fonction de répartition F et U une variable aléatoire uniforme sur ]0,1[. Alors X et F1(U) ont même loi.

Proof. Il suffit de vérifier que la fonction de répartition de F1(U) est F. Soit xR,

{F1(U)x}={UF(x)}

d’après (1.3), donc P(F1(U)x)=P(UF(x))=F(x).

Example 1.1 (Loi exponentielle)

Soit XE(λ) avec λ>0. On rappelle que la fonction de répartition de X est F(x)=1exp(λx) donc la fonction quantile est

u]0,1[,F1(u)=1λlog(1u).

Donc pour obtenir une réalisation de X il suffit de poser X=1λlog(U) avec UU(]0,1[) (on rappelle que U et 1U ont même loi).

Example 1.2 (Loi de Cauchy)

On considère la loi de Cauchy de paramètre c>0 i.e. la loi de densité f(x)=cπ(x2+c2). On vérifie que F(x)=1π(arctan(xc)+π2) et donc

X=ctan(π(U1/2))Cauchy(c).

1.3.1. Simulation d’une loi discrète sur un espace d’états fini#

Soit E={x1,,xN} un espace d’état fini et X:(Ω,A,P)E variable aléatoire de fonction de masse p(k)=P(X=xk) pour tout k=1,,N. Alors la fonction de répartition s’écrit

xR,F(x)=k=1Np(k)1xkx.

On introduit la notation p¯(k)=p(1)++p(k) (et p(0)=0) de sorte que

xR,F(x)=k=1Np¯(k)1xkx<xk+1.

La fonction quantile s’écrit alors

(1.4)#u[0,1],F1(u)=k=1Nxk1p¯(k1)<up¯(k).

Example 1.3 (Loi de Bernoulli)

Soit p]0,1[. Il suffit de poser

X=1UpB(p)si UU(]0,1[).

Example 1.4 (Loi binomiale)

Par la méthode de l’inverse de la fonction de répartition cela nécessite de précalculer les p¯(k)=p(1)++p(k) avec p(k)=(nk)pk(1p)nk et de rechercher l’intervale ]p¯(k1),p¯(k)] pour une réalisation de U donnée cf. (1.4).
Une alternative est d’utiliser la définition probabiliste et donc de renvoyer la somme de n variables aléatoires de Bernoulli. La comparaison sera faite en TP.