Leçon 5 — Probabilités conditionnelles et arbres

Probabilité sachant qu'un événement s'est produit — définition, formules de multiplication, des probabilités totales, de Bayes et arbres pondérés

I. L'idée de la probabilité conditionnelle

Quand on sait qu'un événement \(B\) s'est déjà réalisé, l'espace des possibilités se réduit à \(B\). La probabilité d'un autre événement \(A\) sachant que \(B\) est réalisé s'appelle la probabilité conditionnelle de \(A\) sachant \(B\).

Pourquoi la connaissance d'un événement change les probabilités

Imagine que tu tires une carte dans un jeu de 52 cartes. La probabilité d'obtenir un roi est \(4/52=1/13\). Mais si quelqu'un te dit "la carte est rouge", les possibilités se réduisent à 26 cartes rouges, dont 2 sont des rois. La probabilité conditionnelle est \(2/26=1/13\) — la même ! Les rois sont indépendants de la couleur.

En revanche, si on te dit "la carte est un as ou un roi", il y a 8 telles cartes (4 as + 4 rois), dont 4 rois. La probabilité d'un roi sachant "as ou roi" est \(4/8=1/2\) — très différente de \(1/13\). Cette information est pertinente.

La probabilité conditionnelle quantifie précisément comment une information nouvelle modifie notre évaluation d'un événement.

Nerveux explique : Les agents de santé du Centre médical de Kaya utilisent les probabilités conditionnelles tous les jours. Si un patient présente de la fièvre, la probabilité qu'il ait le paludisme est plus élevée que dans la population générale. La probabilité d'avoir le paludisme sachant qu'on a de la fièvre est une probabilité conditionnelle. C'est ce que calcule le médecin mentalement quand il évalue son diagnostic — il met à jour ses probabilités en fonction des symptômes observés.

II. Définition et formule de multiplication

Probabilité conditionnelle de \(A\) sachant \(B\) (avec \(P(B)>0\)) : \[P(A\mid B) = \frac{P(A\cap B)}{P(B)}\] Ce qui équivaut à la formule de multiplication : \[P(A\cap B) = P(B)\times P(A\mid B) = P(A)\times P(B\mid A)\] Lecture : "la probabilité que A et B arrivent = probabilité que B arrive × probabilité que A arrive sachant B"

Justification de la définition

Si \(B\) est réalisé, l'univers se réduit à \(B\). Dans ce nouvel univers, la probabilité de \(A\) est la proportion de \(B\) qui est aussi dans \(A\), soit \(A\cap B\). Pour que cette "probabilité réduite" satisfasse les axiomes de Kolmogorov (en particulier \(P(B\mid B)=1\)), on normalise par \(P(B)\) :

\(P(A\mid B) = \frac{P(A\cap B)}{P(B)}\) — l'unique définition compatible avec les axiomes \(\square\)

Vérification : \(P(B\mid B)=P(B\cap B)/P(B)=P(B)/P(B)=1\) ✓ et \(P(\emptyset\mid B)=0/P(B)=0\) ✓

Attention : \(P(A\mid B) \neq P(B\mid A)\) en général ! Ces deux probabilités sont très différentes. Confondre les deux est l'erreur classique dite "du procureur" (prosecutor's fallacy) : la probabilité qu'un innocent laisse des traces ADN sur une scène de crime est différente de la probabilité qu'une personne avec des traces ADN soit innocente.

III. Formule des probabilités totales

Quand on ne peut pas calculer directement \(P(A)\) mais qu'on peut le décomposer à travers une partition de l'univers, on utilise la formule des probabilités totales.

Formule des probabilités totales

Si \(B_1, B_2, \ldots, B_k\) forment une partition de \(\Omega\) (mutuellement exclusifs et exhaustifs : \(\bigcup B_i=\Omega\), \(B_i\cap B_j=\emptyset\)), alors :

\[P(A) = \sum_{i=1}^{k} P(A\mid B_i)\times P(B_i)\]

Preuve de la formule des probabilités totales

Puisque les \(B_i\) partitionnent \(\Omega\), les événements \(A\cap B_i\) partitionnent \(A\) :

\(A = (A\cap B_1)\cup(A\cap B_2)\cup\cdots\cup(A\cap B_k)\) — réunion disjointe

Par l'additivité des probabilités sur les incompatibles :

\(P(A) = \sum_i P(A\cap B_i) = \sum_i P(A\mid B_i)\times P(B_i) \quad \square\)

IV. Formule de Bayes

La formule de Bayes permet de "remonter" des effets vers les causes : connaissant la probabilité que l'effet \(A\) soit produit par la cause \(B_i\), elle donne la probabilité que la cause soit \(B_i\) sachant qu'on a observé \(A\).

Formule de Bayes (avec \(B_1,\ldots,B_k\) partition de \(\Omega\)) : \[P(B_j\mid A) = \frac{P(A\mid B_j)\times P(B_j)}{P(A)} = \frac{P(A\mid B_j)\times P(B_j)}{\displaystyle\sum_{i=1}^k P(A\mid B_i)\times P(B_i)}\] "Prob. de la cause \(B_j\) sachant l'effet \(A\)" — au numérateur : la branche \(B_j\), au dénominateur : toutes les branches menant à \(A\)

Bayes : mettre à jour nos croyances avec les nouvelles données

La formule de Bayes est l'outil fondamental du raisonnement sous incertitude. Elle formalise comment une observation (\(A\)) met à jour notre évaluation de la probabilité d'une hypothèse (\(B_j\)).

En médecine : \(B_1\) = "patient malade", \(B_2\) = "patient sain", \(A\) = "test positif". On calcule \(P(B_1\mid A)\) = probabilité d'être vraiment malade sachant un test positif — ce qui intègre la prévalence de la maladie et la précision du test.

Au Burkina : \(B_1\) = "saison des pluies", \(A\) = "ciel nuageux". Les agriculteurs du Sahel utilisent intuitivement Bayes : sachant les nuages (observation), ils révisent leur estimation de la probabilité de pluie.

V. Arbres de probabilité — lecture et construction

Un arbre de probabilité représente graphiquement une expérience aléatoire à plusieurs étapes. Chaque branche porte la probabilité de la transition. La probabilité d'un chemin est le produit des probabilités sur ce chemin (formule de multiplication). La probabilité d'un événement est la somme des chemins menant à cet événement (formule des probabilités totales).

Arbre de dépistage paludisme — produit sur chaque chemin, somme pour les événements finaux

VI. Exemples travaillés

Exemple 1 — Calcul direct de probabilité conditionnelle

Dans une classe de Terminale de Ouagadougou, 60 % des élèves ont révisé (R) et 40 % n'ont pas révisé (\(\bar{R}\)). Parmi ceux qui ont révisé, 80 % réussissent (S). Parmi ceux qui n'ont pas révisé, 30 % réussissent.

Formule des probabilités totales :

\(P(S)=P(S\mid R)\times P(R)+P(S\mid\bar{R})\times P(\bar{R})\)

\(=0{,}80\times0{,}60+0{,}30\times0{,}40=0{,}48+0{,}12=\mathbf{0{,}60}\)

Formule de Bayes — P(R | S) : Sachant qu'un élève a réussi, quelle est la probabilité qu'il ait révisé ?

\(P(R\mid S)=\dfrac{P(S\mid R)\times P(R)}{P(S)}=\dfrac{0{,}80\times0{,}60}{0{,}60}=\dfrac{0{,}48}{0{,}60}=\mathbf{0{,}80}\)

Interprétation : 80 % des élèves qui ont réussi avaient révisé.

\(P(S)=60\%\) | \(P(R\mid S)=80\%\)

Exemple 2 — Test de dépistage paludisme (lecture de l'arbre)

En utilisant l'arbre ci-dessus (P(M)=0,15, sensibilité=0,95, spécificité=0,90) :

P(T+) par les probabilités totales :

\(P(T+)=P(T+\mid M)\times P(M)+P(T+\mid S)\times P(S)\)

\(=0{,}95\times0{,}15+0{,}10\times0{,}85=0{,}1425+0{,}0850=0{,}2275\)

Valeur prédictive positive (VPP) — formule de Bayes :

\(P(M\mid T+)\) = probabilité d'être vraiment malade sachant test positif :

\(P(M\mid T+)=\dfrac{P(T+\mid M)\times P(M)}{P(T+)}=\dfrac{0{,}1425}{0{,}2275}\approx\mathbf{0{,}626}\)

Malgré un test très précis (95 % sensibilité, 90 % spécificité), si la maladie est rare (15 %), un test positif n'est vrai que dans 62,6 % des cas — c'est le paradoxe du test de dépistage !

VPP = 62,6 % — même un bon test peut avoir beaucoup de faux positifs si la maladie est rare

Exemple 3 — Tirage sans remise (urne)

Une urne contient 5 boules rouges (R) et 3 boules bleues (B). On tire 2 boules successivement sans remise.

Arbre :

1er tirage : P(R₁) = 5/8, P(B₁) = 3/8.

2ème tirage sachant R₁ : P(R₂|R₁) = 4/7 (4 R restantes sur 7), P(B₂|R₁) = 3/7.

2ème tirage sachant B₁ : P(R₂|B₁) = 5/7, P(B₂|B₁) = 2/7.

P(R₁ ∩ R₂) :

\(P(R_1\cap R_2)=\frac{5}{8}\times\frac{4}{7}=\frac{20}{56}=\frac{5}{14}\)

P(une rouge et une bleue) :

\(P=(R_1\cap B_2)\text{ ou }(B_1\cap R_2)=\frac{5}{8}\times\frac{3}{7}+\frac{3}{8}\times\frac{5}{7}=\frac{15}{56}+\frac{15}{56}=\frac{30}{56}=\frac{15}{28}\)

\(P(RR)=5/14\approx35{,}7\%\) | \(P(\text{1R+1B})=15/28\approx53{,}6\%\)

VII. Indépendance de deux événements

Deux événements \(A\) et \(B\) sont indépendants si la réalisation de l'un ne modifie pas la probabilité de l'autre. C'est une propriété symétrique.

\(A\) et \(B\) indépendants \(\iff\) \(P(A\cap B) = P(A)\times P(B)\) \[\iff P(A\mid B) = P(A) \iff P(B\mid A) = P(B)\] Les trois formulations sont équivalentes — la première (produit) est la définition, les deux autres sont des conséquences

Incompatibles ≠ Indépendants : Deux événements incompatibles (\(A\cap B=\emptyset\)) avec \(P(A),P(B)>0\) sont dépendants car \(P(A\cap B)=0\neq P(A)\times P(B)\). La réalisation de l'un exclut l'autre — c'est la dépendance maximale. Ne pas confondre "mutuellement exclusifs" et "indépendants".

VIII. Application concrète ⭐

⭐ Situation concrète Contrôle qualité des semences à la SOFITEX

La SOFITEX (Société Burkinabè des Fibres Textiles) contrôle la qualité des semences de coton. Une machine produit des semences de deux origines :

60 % proviennent de la variété A (\(V_A\)) et 40 % de la variété B (\(V_B\))
Parmi les semences \(V_A\) : 5 % sont défectueuses
Parmi les semences \(V_B\) : 12 % sont défectueuses

a) Construire l'arbre de probabilité complet.
b) Calculer la probabilité qu'une semence choisie au hasard soit défectueuse.
c) Sachant qu'une semence est défectueuse, quelle est la probabilité qu'elle provienne de la variété B ? (Formule de Bayes)
d) Deux semences sont tirées indépendamment. Calculer la probabilité qu'exactement une soit défectueuse.

Exemple 4 — Contrôle qualité SOFITEX

b) Probabilité qu'une semence soit défectueuse (D) :

\(P(D)=P(D\mid V_A)\times P(V_A)+P(D\mid V_B)\times P(V_B)\)

\(=0{,}05\times0{,}60+0{,}12\times0{,}40=0{,}030+0{,}048=\mathbf{0{,}078}\)

7,8 % des semences sont défectueuses.

c) Probabilité que la semence défectueuse vienne de \(V_B\) — Bayes :

\(P(V_B\mid D)=\dfrac{P(D\mid V_B)\times P(V_B)}{P(D)}=\dfrac{0{,}048}{0{,}078}=\dfrac{48}{78}=\dfrac{8}{13}\approx\mathbf{61{,}5\%}\)

Bien que \(V_B\) ne représente que 40 % de la production, elle est responsable de 61,5 % des défauts — car son taux de défaut est plus de deux fois supérieur à celui de \(V_A\).

d) Exactement une défectueuse sur deux tirages indépendants :

\(P(D)=0{,}078\) et \(P(\bar{D})=0{,}922\).

\(P(\text{exactement 1})=P(D_1\cap\bar{D}_2)+P(\bar{D}_1\cap D_2)\)

\(=0{,}078\times0{,}922+0{,}922\times0{,}078=2\times0{,}078\times0{,}922\approx\mathbf{0{,}1438}\approx14{,}4\%\)

\(P(D)=7{,}8\%\) | \(P(V_B\mid D)=61{,}5\%\) | \(P(\text{exactement 1 sur 2})=14{,}4\%\)

✏️ Exercices d'application

Exercice 1 — Calcul de probabilités conditionnelles

On sait que \(P(A)=0{,}4\), \(P(B)=0{,}5\) et \(P(A\cap B)=0{,}2\).

a) Calculer \(P(A\mid B)\) et \(P(B\mid A)\).
b) A et B sont-ils indépendants ? Justifier.
c) Calculer \(P(A\cup B)\) et \(P(\bar{A}\mid B)\).

a) \(P(A\mid B)=0{,}2/0{,}5=\mathbf{0{,}4}\). \(P(B\mid A)=0{,}2/0{,}4=\mathbf{0{,}5}\).

b) \(P(A)\times P(B)=0{,}4\times0{,}5=0{,}2=P(A\cap B)\) → A et B sont indépendants. (Et on remarque que \(P(A\mid B)=P(A)\) ✓.)

c) \(P(A\cup B)=0{,}4+0{,}5-0{,}2=\mathbf{0{,}7}\). \(P(\bar{A}\mid B)=1-P(A\mid B)=1-0{,}4=\mathbf{0{,}6}\).

Exercice 2 — Arbre et probabilités totales

Dans une mine artisanale de la région de Koudougou, les ouvriers viennent de deux villages : 70 % du village A et 30 % du village B. Les ouvriers du village A ont 15 % de chances d'être en retard le lundi, contre 25 % pour ceux du village B.

a) Quelle est la probabilité qu'un ouvrier choisi au hasard soit en retard le lundi ?
b) Un ouvrier est en retard. Quelle est la probabilité qu'il vienne du village A ?

a) \(P(R)=0{,}15\times0{,}70+0{,}25\times0{,}30=0{,}105+0{,}075=\mathbf{0{,}180}\). 18 % des ouvriers sont en retard.

b) \(P(A\mid R)=\frac{0{,}105}{0{,}180}=\frac{105}{180}=\frac{7}{12}\approx\mathbf{58{,}3\%}\).

Exercice 3 — Indépendance

On lance deux dés équilibrés. Soit \(A\) = "la somme est 7" et \(B\) = "le premier dé donne 4".

a) Calculer \(P(A)\) et \(P(B)\).
b) Calculer \(P(A\cap B)\).
c) A et B sont-ils indépendants ?

a) \(|\Omega|=36\). Somme 7 : {(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)} → \(P(A)=6/36=1/6\). \(P(B)=6/36=1/6\).

b) "Somme 7 et premier dé = 4" → (4,3) uniquement. \(P(A\cap B)=1/36\).

c) \(P(A)\times P(B)=\frac{1}{6}\times\frac{1}{6}=\frac{1}{36}=P(A\cap B)\) → A et B sont indépendants. Intuitivement : savoir que le premier dé donne 4 ne change pas la probabilité que la somme soit 7.

Exercice 4 — Contrôle sanitaire dans les marchés de Ouagadougou

Un inspecteur sanitaire visite deux marchés de Ouagadougou : Rood Woko (R) et Pissy (P). Il visite Rood Woko avec probabilité 0,6 et Pissy avec probabilité 0,4. À Rood Woko, il trouve une infraction avec probabilité 0,35. À Pissy, avec probabilité 0,20.

a) Quelle est la probabilité qu'il trouve une infraction lors de sa visite ?
b) Sachant qu'il a trouvé une infraction, quelle est la probabilité qu'il soit à Rood Woko ?
c) Sachant qu'il n'a pas trouvé d'infraction, quelle est la probabilité qu'il soit à Pissy ?

a) \(P(I)=0{,}35\times0{,}6+0{,}20\times0{,}4=0{,}210+0{,}080=\mathbf{0{,}290}\).

b) \(P(R\mid I)=\frac{0{,}210}{0{,}290}=\frac{21}{29}\approx\mathbf{72{,}4\%}\).

c) \(P(\bar{I})=1-0{,}290=0{,}710\). \(P(P\cap\bar{I})=0{,}80\times0{,}4=0{,}320\). \(P(P\mid\bar{I})=0{,}320/0{,}710\approx\mathbf{45{,}1\%}\).

Exercice 5 — Dépistage du paludisme à grande échelle ⭐

Dans la région du Centre-Nord burkinabè pendant la saison des pluies, 20 % de la population est infectée par le paludisme. Un test rapide a une sensibilité de 90 % (P(T+|malade) = 0,90) et une spécificité de 85 % (P(T−|sain) = 0,85).

a) Calculer P(T+) — la probabilité qu'un habitant testé au hasard soit positif.
b) Calculer la Valeur Prédictive Positive (VPP) = P(malade | T+).
c) Calculer la Valeur Prédictive Négative (VPN) = P(sain | T−).
d) Si le programme de santé teste 10 000 personnes, combien de faux positifs (sains mais T+) sont attendus ?

P(M)=0,20, P(S)=0,80. P(T+|M)=0,90, P(T−|M)=0,10. P(T+|S)=0,15, P(T−|S)=0,85.

a) \(P(T+)=0{,}90\times0{,}20+0{,}15\times0{,}80=0{,}180+0{,}120=\mathbf{0{,}300}\). 30 % des personnes testées seront positives.

b) VPP = \(P(M\mid T+)=\frac{0{,}180}{0{,}300}=0{,}60=\mathbf{60\%}\). Un résultat positif correspond à un vrai cas dans 60 % des situations.

c) \(P(T-)=1-0{,}300=0{,}700\). \(P(S\cap T-)=0{,}85\times0{,}80=0{,}680\). VPN = \(0{,}680/0{,}700\approx\mathbf{97{,}1\%}\). Un résultat négatif est rassurant.

d) Faux positifs = P(S∩T+) × 10 000 = 0,120 × 10 000 = 1 200 personnes saines mais diagnostiquées positives.

À retenir

Probabilité conditionnelle : \(P(A\mid B)=P(A\cap B)/P(B)\) — probabilité de \(A\) dans l'univers réduit à \(B\).
Formule de multiplication : \(P(A\cap B)=P(B)\times P(A\mid B)\).
Probabilités totales : \(P(A)=\sum_i P(A\mid B_i)\times P(B_i)\) pour toute partition \((B_i)\).
Bayes : \(P(B_j\mid A)=P(A\mid B_j)\times P(B_j)/P(A)\) — remonter des effets vers les causes.
Arbre : produit sur chaque chemin, somme des chemins menant à l'événement.
Indépendance : \(P(A\cap B)=P(A)\times P(B)\) — la réalisation de l'un n'affecte pas l'autre.
\(P(A\mid B)\neq P(B\mid A)\) — ne jamais inverser les conditionnements !
Paradoxe du test : même un test très précis peut avoir une faible VPP si la maladie est rare.

Supports Vidéo

← L4 : Calcul des probabilités L6 : Événements indépendants →