Certains problèmes de la vie courante peuvent être modélisés par des marches aléatoires. On montre comment, par des raisonnements élémentaires, on peut étudier le comportement d’une de ces marches.
Nicolas, 10 ans, se lance dans une collection de cartes Pokémon. Chaque carte
représente un Pokémon, et il existe 150 Pokémons différents. Les cartes sont vendues
dans des paquets scellés, si bien que lorsque Nicolas achète une carte, il peut tomber
sur n’importe quel Pokémon ; en particulier sur un Pokémon qu’il possède
déjà.
En supposant qu’à chaque achat, on ait même probabilité d’obtenir chacun des 150
Pokémons, quel est le nombre moyen de cartes que Nicolas doit acheter afin d’obtenir
tous les Pokémons ?
Un raisonnement simple permet d’obtenir la réponse. Traitons le cas général où le nombre total de Pokémons est quelconque, égal à . Notons le nombre moyen de cartes à se procurer pour terminer la collection, sachant que l’on est déjà en possession de Pokémons distincts.
Supposons que nous avons Pokémons, tous différents, et achetons une carte supplémentaire. Avec probabilité , cette carte était déjà en notre possession ; il faut donc encore acheter en moyenne cartes pour terminer la collection. Avec probabilité , c’est une nouvelle carte ; il faut donc acheter en moyenne cartes supplémentaires. Par conséquent :
Ce qui donne :
, soit .
Le nombre de cartes nécessaires pour terminer la collection, sachant que l’on possède déjà
Pokémons distincts,
est égal à zéro : .
Le nombre moyen total de cartes à se procurer pour posséder l’ensemble des
Pokémons
est égal à ,
avec
Une comparaison série-intégrale, appliquée à la fonction , donne l’encadrement . La différence est décroissante ; elle converge donc vers une certaine constante , appelée constante d’Euler. Si bien que le nombre recherché est de l’ordre de . En première approximation, on peut prendre . Pour , on obtient . Nicolas peut espérer terminer sa collection après avoir acheté cartes.
Cherchons à formaliser les raisonnements précédents. Pour cela, il faut se donner un univers, composé des résultats qui peuvent être obtenus à l’issue de l’épreuve, d’une probabilité sur cet ensemble, et d’une variable aléatoire qui représente la quantité à étudier.
L’univers
Dans chacun des deux exemples, on peut modéliser la situation par une suite de nombres compris entre et . Dans le premier exemple, le terme de rang de la suite, noté , correspond au nombre de Pokémons différents en possession de Nicolas, après l’achat de cartes.
L’univers de tous les résultats possibles correspond donc à l’ensemble des suites indexées par les entiers, à valeurs dans .
La variable aléatoire est donnée par la projection sur la coordonnée.
La probabilité
Cherchons à définir sur
une probabilité
rendant compte du phénomène étudié. Rappelons que le cylindre
est le sous-ensemble de
composé des suites qui
débutent par . Pour
définir une probabilité
sur , il suffit de spécifier
sa valeur sur les cylindres ,
et ce pour tout
et tout -uplet
.
Nous allons définir la probabilité
par une récurrence sur la taille des cylindres. Pour cela, rappelons la notion de probabilité
conditionnelle. Soit ,
deux
sous-ensembles de ,
et une probabilité
sur . La
probabilité de
sachant
est donnée par
Prenons pour l’événement et pour l’événement . L’intersection de et de correspond à l’événement , si bien qu’il suffit de spécifier les valeurs pour déterminer .
Dans nos exemples, la valeur prise par ne dépend pas des valeurs prises par , mais juste de la valeur prise par (C’est la propriété de Markov). En effet, si la valeur de est connue, disons égale à , la variable aléatoire ne peut prendre que les deux valeurs et , et les probabilités associées à ces deux valeurs sont complètement déterminées.
avec .
Nous décidons donc de munir
de la probabilité
définie par les relations précédentes, car nous pensons qu’elle correspond aux
situations que nous sommes en train d’étudier.
Remarquons que la probabilité
n’est pas entièrement déterminée par les relations données plus haut ; les quantités
n’ont
pas été spécifiées. Elles n’interviendront pas dans la suite.
La variable aléatoire
On s’intéresse au temps nécessaire pour atteindre la valeur . Cette quantité est une variable aléatoire définie sur qui peut s’exprimer en fonction des .
Rappelons maintenant comment est défini le concept d’espérance conditionnelle. Soit une variable aléatoire définie sur , prenant des valeurs entières, et soit un sous-ensemble de . L’espérance conditionnelle de sachant est donnée par une des deux expressions équivalentes suivantes.
La quantité que nous cherchons à calculer correspond au temps moyen nécessaire pour atteindre la valeur , sachant que nous sommes parti de la valeur . Il s’agit donc de l’espérance de , sachant que :
On peut maintenant définir précisément les quantités et dériver la relation de récurrence qui permet de les calculer. Les quantités correspondent au temps moyen nécessaire pour atteindre la valeur , sachant qu’on part de la valeur . On a donc :
Le résultat suivant se déduit aisément de la définition de l’espérance conditionnelle.
Théorème
Soit une variable
aléatoire définie sur ,
un sous-ensemble
de . Soit
une partition
de : les
sont des
sous-ensembles de
disjoints deux à deux, et l’union de tous ces sous-ensembles est égale à
. On a
alors la relation suivante :
Soit un entier strictement inférieur à . Considérons l’événement et les événements . Posons , si bien que . La relation précédente devient :
La quantité ne dépend que des variables mais pas de la variable . Par conséquent, on a l’égalité , ce qui donne :
La quantité correspond au temps moyen nécessaire pour atteindre , sachant qu’on est parti de . Elle est donc égale à (Il s’agit du caractère stationnaire de la marche aléatoire). L’équation précédente devient :
C’est la relation attendue.