Le collectionneur, épisode 3

Publié le 09/02/17

Pour les notations, on se reportera à l’épisode 1.
On va déterminer la fonction de répartition puis la loi de la variable {X}.
On note {F_{k}} le numéro de la figurine dans la {k}-ème tablette achetée.

  1. Exprimer l’événement {X>n} à l’aide des {F_{k}}.
  2. En déduire l’expression de {\mathbb{P}(X\le n)} pour tout {n}.
  3. Donner alors l’expression de la probabilité {\mathbb{P}(X=n)}.

  1. Dire {X>n}, c’est dire qu’au moins une figurine n’apparaît dans les {n} premiers achats.

    C’est donc dire qu’il existe {1\le j\le N} tel que {G_{n,j}=\displaystyle\bigcap_{k=1}^{n}(F_{k}\ne j)} soit réalisé.
    Ainsi : {(X>n)=\displaystyle\bigcup_{j=1}^{N}G_{n,j}=\displaystyle\bigcup_{j=1}^{N}\biggl(\displaystyle\bigcap_{k=1}^{n}(F_{k}\ne j)\biggr)}.

  2. Pour calculer {\mathbb{P}(X>n)}, on utilise la formule du crible.

    La somme suivante est sur les parties {J} non vides de {[[ 1,N]]}) :
    {\mathbb{P}(X>n)=\displaystyle\sum_{J}(-1)^{\text{card}(J)+1}\,\mathbb{P}\Bigl(\bigcap_{j\in J}G_{n,j}\Bigr)}

    Mais l’événement {\displaystyle\bigcap_{j\in J}G_{n,j}} s’écrit {\displaystyle\bigcap_{k=1}^{n}(F_{k}\notin J)}.

    D’autre part, on a : {\mathbb{P}(F_{k}\notin J)=1-\dfrac{\text{card}(J)}{N}}

    Par indépendance des {F_{k}\;}: {\mathbb{P}\biggl(\displaystyle\bigcap_{j\in J}G_{n,j}\biggr)=\biggl(1-\dfrac{\text{card}(J)}{N}\biggr)^{n}}.

    Ainsi {\mathbb{P}(X>n)=\displaystyle\sum_{J}(-1)^{\text{card}(J)+1}\biggl(1-\dfrac{\text{card}(J)}{N}\biggr)^{n}}.

    On regroupe alors suivant les {k=\text{card}(J)\in[[ 1,N]]}.

    On trouve {\mathbb{P}(X>n)=\displaystyle\sum_{k=1}^{N}(-1)^{k+1}\dbinom{N}{k}\biggl(1-\dfrac{k}{N}\biggr)^{n}}.

    On en déduit finalement : {\begin{array}{rl}\mathbb{P}(X\le n)&=1-\mathbb{P}(X>n)\\\\&=1-\displaystyle\sum_{k=1}^{N}(-1)^{k+1}\dbinom{N}{k}\biggl(1-\dfrac{k}{N}\biggr)^{n}\\\\&=\displaystyle\sum_{k=0}^{N}(-1)^{k}\dbinom{N}{k}\biggl(1-\dfrac{k}{N}\biggr)^{n}\end{array}}Remarque: le résultat est encore valable si {n=0}.

  3. Par différence, les {\mathbb{P}(X\le n)} donnent les {\mathbb{P}(X= n)} :
    {\begin{array}{rl}\mathbb{P}(X=n)&=\mathbb{P}(X\le n)-\mathbb{P}(X\le n-1)\\\\&=\displaystyle\sum_{k=0}^{N}(-1)^{k}\dbinom{N}{k}\biggl(\biggl(1-\dfrac{k}{N}\biggr)^{n}-\biggl(1-\dfrac{k}{N}\biggr)^{n-1}\biggr)\\\\&=\displaystyle\sum_{k=0}^{N}(-1)^{k+1}\dfrac{k}{N}\dbinom{N}{k}\biggl(1-\dfrac{k}{N}\biggr)^{n-1}\end{array}}Remarque: pour des raisons liées à l’expérience, on a {\mathbb{P}(X=n)=0} pour {0\le n\lt N} (on ne peut pas espérer compléter l’album tant qu’on n’a pas acheté au moins {N} tablettes).

    Même si ça n’a rien d’évident visuellement, l’expression précédente donne effectivement {\mathbb{P}(X=n)=0} pour n\lt N.

    Application numérique: la fonction Mathematica suivante calcule {\mathbb{P}(X=n)}:

    Expérimentalement, la suite {n\mapsto \mathbb{P}(X=n)} est croissante puis décroissante.

    On voit ici (avec {N=151}) le tracé des {\mathbb{P}(X=n)} pour {500\le n\le 1000} :

    article-09-02-17plot
    La probabilité maximum est atteinte pour {n=757} et elle vaut {\approx 2.5e-3} :