Les notations de probabilité.

发布于 5 天前  41 次阅读



En tant qu'un étudiant qui a exposé une fois, au logique, je suis sensible par rapport aux expressions mathématiques, les sémantiques des symboles formels, et c'est pourquoi les notations de probabilité, celles-là me troublent beaucoup. Et beaucoup de livres, y compris ce que j'utilise maintenant n'y font pas trop attention. Lors qu'on dit "un variable aléatoire", e.g. "Soit X un variable aléatoire qui représente les hauteurs humaines", on le considère comme un nombre, et quand on écrit \Pr(X = x), on ne dirait que la probabilité d'un nombre inconnu X se trouve être x. Mais cette interprétation devient en panne quand on fait face à la définition de la convergence en probabilité

    \[\lim\limits_{n \to \infty} \Pr(|X_n - X| > \epsilon) = 0\]

Cet article court vise à expliquer d'une manière formelle ces concepts, avec une bonne intuition afin qu'on ne se perde pas dans le formalisme. 

On n'a pas besoin du mesure aujourd'hui, cela va finir bientôt. On parle désormais à l'intérieur d'un univers \Omega, et on peut prendre des échantillons depuis S. On arrive souvent à notre premier malentendu ici: un échantillon, ce n'est pas un individuel dans l'univers, en revanche, le résultat d'un échantillonnage parcourrait l'univers plénier, alors on traite un échantillon comme une fonction au profit de le bien décrire, cette fonction, c'est un variable aléatoire X(\omega), il est une fonction de \Omega dans \mathbb{R} (et certes, en principe on se permet de choisir d'autres espaces tant qu'il est mesurable). Cet étape nous laisse de voir des échantillons et des évènement arbitraires comme l'apparence des nombres; dit simplement, les variables aléatoires bâtissent un pont entre le monde non-mathématique à celui qui est. Avec les variables aléatoires on peut écrire des probabilité des évènements arbitraires comme celles des évènements de nombres \Pr(E), un évènement, c'est un ensemble E = \{\omega \in \Omega | P(X(\omega)) \}P: \mathbb{R} \to \{0,1\} est un prédicat.

Maintenant on se tourne vers la fonction de densité et la fonction de loi, prenons comme un exemple un dé fair, les chances de tirer chaque nombre entre 1 et 6 sont équiprobables, alors l'univers c'est \{1,2,3,4,5,6\}, soit X(\omega): \Omega \to \mathbb{R}  un variable sur cet univers, et soit 

    \[ \begin{cases} X(\omega) = 1 & \text{$\omega$ est paire}\\ X(\omega)=0 & \text{$\omega$ est impair} \end{cases} \]

si tu as une fois appris la probabilité, tu reconnais immédiatement que "X suit un loi binomiale", mais qu'est-ce que cela veut dire? Remarques que X envoie 1,3,5 à 0 et 2,4,6 à 1, si on dessine cette application dans un diagramme, tu verras une ligne grêle à x=1 avec une hauteur 0.5, et c'est la fonction de densité, elle veut essentiellement dire que "combien d'échantillons le variable a-t-il envoyé à ce résultat, par rapport à l'univers plénier?".

On peut également se tourner vers le cas continu, e.g., soit X suit une loi normale, dit, les hauteurs humaines, et supposons qu'on contrôle l'hauteur humaine par deux gènes indépendants: A et B, et chacun des gènes peut prendre beaucoup de valeurs: A_1, A_2, \dots, A_n et B_1, B_2, \dots, B_n, alors l'univers sera

    \[ \Omega = \{ A_1, A_2, \dots, A_n\} \times \{B_1, B_2, \dots, B_n\} \]

et X sera une telle fonction qui envoie une combinaison de gènes (A_i, B_j) à un nombre (l'hauteur). Par exemple, il enverrait (A_1, B_1) à l'hauteur "180cm". La fonction n'est pas fidèle: elle est tout à fait possible d'envoyer deux combinaisons à la même hauteur; puisque l'hauteur est une valeur continue, on dit toujours un intervalle d'hauteurs, au lieu d'une valeur précise, et du coup, X envoie, par exemple, S_1 \subseteq \Omega à (160, 170), et envoie S_2 \subseteq \Omega à (150, 160), envoie S_3\subseteq \Omega à (170, 180), etc.., et finalement, la phrase "X suit une loi normale" dit que si on compte les tailles de S_1, S_2, S_3, \dots, on trouvera que |S_2| est plus grand, ensuite |S_1| et |S_3|, et puis d'autre intervalles. si on les range en une ligne par intervalles, ils forment une courbe en cloche, cette courbe est la fonction de densité de la loi normale, et également, elle veut dire que "combien d'échantillons le variable X a-t-il envoyé dans cet intervalle, par rapport à l'univers plénier."

Et finalement c'est le moment pour expliquer la notation \Pr(X\le x), \Pr(E), en soi-même, c'est une fonction qui accepte un évènement et, souviens-toi qu'un évènement, c'est simplement une partir E \subseteq \Omega, par conséquent X \le x serait aussi une partie de \Omega, on arrive à le faire d'une façons la plus directe, soit 

    \[ X \le x := \{\omega \in \Omega| X(\omega)  \le x\} \]

et plus généralement, soit P un prédicat arbitraire sur \Omega, on écrit \Pr(P(X)) pour

    \[\Pr(P(X)) := \Pr(\{\omega \in \Omega | P(X(\omega))\})\]

Et enfin on est assez prêt pour expliquer la convergence en probabilité, on dit que une séquence de variables X_1, X_2, \dots converge vers un variable X en probabilité si 

    \[ \forall \epsilon. \lim\limits_{n \to \infty} \Pr(|X_n - X| \ge \epsilon) = 0 \]

Au profit de la simplicité, ignorons la fonction absolue, qu'est-ce que X_n - X veut dire? Si on insiste à utiliser l'exemple de l'hauteur, on sait que X_i et X nous disent approximativement "j'enverrai une combinaison de gènes \omega à quelle hauteur?", et par conséquent X_i - X nous montre la distance entre les hauteurs auxquelles elles ont envoyées. Depuis ce point de vue, \Pr(|X_n - X| > \epsilon) \to 0 nous dit que la probabilité que cette distance dépasse \epsilon finira par 0. Et si on se tourne vers un point de vue plus formel, on demande: quelle est la fonction de densité du variable X_n -X? Remarques que X_n(\omega)-X \ge \epsilon signifie que "la distance des hauteurs affectées par ces deux variables est plus grande que \epsilon", du coup par notre interprétation auparavant, la fonction de densité de X_n - X nous montre "combien de combinaison de gènes dont la distance des hauteurs affectées par X_n et X tombe dans chaque intervalle, par rapport à l'univers plénier?", et par suite \Pr(|X_n - X| > \epsilon) \to 0 exige clairement que le nombre approximatif de combinaison de gènes dont la distance des hauteurs affectées par X_n et X dépasse \epsilon devrait finir par 0.

Jusqu'à ce que le mort nous sépare.
最后更新于 2025-12-12