Leçon 2 — Moyenne, médiane et mode

Les trois mesures de tendance centrale — définitions rigoureuses, propriétés, calculs sur données groupées et choix selon le contexte

I. Les trois mesures de tendance centrale

Une mesure de tendance centrale est un nombre unique qui résume l'ensemble d'une série statistique en donnant une valeur « typique » ou « centrale ». Il en existe trois principales, chacune répondant à une question différente.

Moyenne \(\bar{x}\)
Quelle est la valeur que prendrait chaque individu si on redistribuait équitablement le total ?

Sensible aux valeurs extrêmes.

\(\bar{x} = \frac{\sum n_i x_i}{N}\)
Médiane \(\text{Me}\)
Quelle valeur partage la série en deux moitiés égales ?

Robuste aux valeurs extrêmes.

\(F(\text{Me}) = 0{,}5\)
Mode \(\text{Mo}\)
Quelle est la valeur la plus fréquente ?

Peut être multiple ou inexistant.

Valeur de \(n_i\) maximal
Relation approx. (Pearson)
Pour les distributions unimodales légèrement asymétriques :
\(\text{Mode} \approx 3\,\text{Médiane} - 2\,\text{Moyenne}\)

Relation empirique — pas une loi exacte.

mascotte Nerveux
Nerveux explique : Imagine 10 familles du marché de Rood Woko. Neuf d'entre elles gagnent 80 000 FCFA par mois et une gagne 800 000 FCFA. La moyenne est \(\frac{9\times80\,000+800\,000}{10}=152\,000\) FCFA — une valeur que personne ne gagne vraiment ! La médiane est 80 000 FCFA (la valeur du milieu) — elle décrit mieux la situation de la majorité. C'est pourquoi les économistes utilisent le revenu médian plutôt que le revenu moyen pour évaluer le niveau de vie. La moyenne peut être trompeuse quand il y a des valeurs extrêmes (ici : le commerçant riche).

II. La moyenne arithmétique — définition et propriétés

Moyenne d'une série de données \(x_1, x_2, \ldots, x_n\) : \[\bar{x} = \frac{1}{N}\sum_{i=1}^{k} n_i x_i = \frac{n_1 x_1 + n_2 x_2 + \cdots + n_k x_k}{N}\] Pour des données non groupées (tous les \(n_i=1\)) : \(\bar{x} = \frac{x_1+x_2+\cdots+x_N}{N}\)
📐 Propriété fondamentale : la somme des écarts à la moyenne est nulle

Pour toute série, \(\displaystyle\sum_{i=1}^{k} n_i(x_i - \bar{x}) = 0\).

Preuve :

\(\sum n_i(x_i-\bar{x}) = \sum n_i x_i - \bar{x}\sum n_i = N\bar{x} - \bar{x}\cdot N = 0 \quad \square\)

Interprétation : la moyenne est le "point d'équilibre" de la série. Si on plaçait des masses \(n_i\) sur une règle aux positions \(x_i\), la règle serait en équilibre en \(\bar{x}\). C'est pourquoi la moyenne est aussi appelée le centre de gravité de la série.

Linéarité
Si \(y_i = ax_i + b\) : \[\bar{y} = a\bar{x} + b\]

La moyenne de la série transformée est la transformation de la moyenne.

\(\overline{ax+b} = a\bar{x}+b\)
Moyenne de moyennes
Si deux groupes ont \(N_1, N_2\) individus et moyennes \(\bar{x}_1, \bar{x}_2\) : \[\bar{x}_{\text{total}} = \frac{N_1\bar{x}_1+N_2\bar{x}_2}{N_1+N_2}\]
Moyenne pondérée
🔍 Pourquoi la propriété de linéarité facilite les calculs

Si les valeurs sont grandes, on peut centrer et réduire : choisir un pivot \(a\) et calculer \(d_i = x_i - a\). La moyenne est alors \(\bar{x} = a + \bar{d}\), et \(\bar{d}\) est plus facile à calculer sur des petits nombres.

Exemple : pour calculer la moyenne de 1 503, 1 507, 1 512, 1 498, 1 510, on pose \(a=1\,500\) et on calcule la moyenne de 3, 7, 12, -2, 10, qui est \(\bar{d}=6\). Donc \(\bar{x}=1\,506\). Beaucoup plus rapide que de sommer les cinq grands nombres !

III. Moyenne sur données groupées en classes

Quand les données sont regroupées en classes, on ne connaît pas les valeurs individuelles exactes. On utilise le centre de classe \(c_i\) comme représentant de toutes les valeurs dans cette classe.

Moyenne approchée pour données groupées en classes : \[\bar{x} \approx \frac{\sum n_i c_i}{N} = \sum f_i c_i\] \(c_i = \frac{a_i+b_i}{2}\) est le centre de la classe \([a_i\,;\,b_i[\) — approximation d'autant meilleure que les classes sont étroites

IV. La médiane — définition rigoureuse

La médiane est la valeur qui partage la série ordonnée en deux parties de même effectif. Sa définition précise dépend de la parité de \(N\).

Pour une série ordonnée \(x_{(1)} \leq x_{(2)} \leq \cdots \leq x_{(N)}\) : \[ \text{Médiane} = \begin{cases} x_{((N+1)/2)} & \text{si } N \text{ est impair}\\ \dfrac{x_{(N/2)} + x_{(N/2+1)}}{2} & \text{si } N \text{ est pair} \end{cases} \] Pour données groupées en classes : interpolation linéaire dans la classe médiane (Leçon 1)
🔍 La médiane minimise la somme des déviations absolues

La médiane a une propriété d'optimalité remarquable : parmi tous les points \(c\), c'est la médiane qui minimise la somme \(\displaystyle\sum_{i=1}^N |x_i - c|\).

La moyenne, elle, minimise la somme des carrés des déviations : \(\displaystyle\sum_{i=1}^N (x_i - c)^2\).

C'est cette différence (valeur absolue vs carré) qui explique pourquoi la médiane est robuste aux outliers : si une valeur est très loin, elle contribue peu à \(\sum|x_i-c|\) en proportion — mais contribue beaucoup à \(\sum(x_i-c)^2\), ce qui "tire" la moyenne vers elle.

V. Le mode

Le mode est la valeur (ou la classe) qui apparaît le plus fréquemment. Pour les données discrètes, c'est la valeur d'effectif maximal. Pour les données groupées en classes, c'est la classe modale (celle de fréquence maximale), et le mode estimé se calcule par la méthode des aires.

Plusieurs modes : une série peut avoir plusieurs modes (distribution bimodale, multimodale). C'est un signe qu'il y a peut-être plusieurs sous-populations dans les données. Exemple : si les notes d'une classe ont deux modes à 8 et 16, il y a probablement deux groupes de niveau distincts.
Mode d'une série continue : pour les données groupées, le mode est dans la classe modale. On l'estime souvent comme le centre de cette classe. Une méthode plus précise (méthode des demi-espaces) donne : \(\text{Mo} = a + \frac{\Delta_1}{\Delta_1+\Delta_2}\times h\) où \(\Delta_1 = f_{\text{cl}}-f_{\text{prec}}\) et \(\Delta_2 = f_{\text{cl}}-f_{\text{suiv}}\).

VI. Comparaison et choix de la bonne mesure

Distribution symétrique Moyenne = Médiane = Mode Mo=Me=\(\bar{x}\) Asymétrie droite (queue longue à droite) Mode < Médiane < Moyenne Mo Me \(\bar{x}\) Utiliser : Mode → valeur la plus probable / taille de vêtement la plus vendue Médiane → revenus, prix immobiliers (données asymétriques) Moyenne → notes, températures (données symétriques, pas d'outliers)

Gauche : distribution symétrique — les trois mesures coïncident. Droite : distribution asymétrique à droite — les trois mesures divergent.

Attention aux moyennes trompeuses : "Le revenu moyen au Burkina Faso est X FCFA" peut être très éloigné du revenu de la majorité si quelques très riches tirent la moyenne vers le haut. Le revenu médian est plus représentatif du niveau de vie typique. De même, une moyenne de température peut masquer des extrêmes dangereux pour l'agriculture.

VII. Exemples travaillés

Exemple 1 — Moyenne, médiane et mode d'une série discrète

Les notes d'un devoir de 15 élèves d'un lycée de Ouagadougou sont :

6, 8, 12, 14, 10, 12, 16, 8, 12, 18, 10, 14, 12, 6, 10


Tableau récapitulatif :

Valeur \(x_i\)Effectif \(n_i\)\(n_i x_i\)
6212
8216
10330
12448
14228
16116
18118
Total15168

Moyenne :

\(\bar{x} = \dfrac{168}{15} = 11{,}2\)

Mode : la valeur 12 a l'effectif maximal (\(n=4\)) → \(\text{Mo} = 12\)

Médiane : \(N=15\) impair → médiane = \(x_{(8)}\) (la 8ème valeur dans la série ordonnée).

Série ordonnée : 6,6,8,8,10,10,10,12,12,12,12,14,14,16,18

La 8ème valeur est 12 → \(\text{Me}=12\)

\(\bar{x}=11{,}2\)  |  \(\text{Me}=12\)  |  \(\text{Mo}=12\)
Exemple 2 — Moyenne sur données groupées (précipitations)

Utiliser le tableau de précipitations de la Leçon 1 pour estimer la moyenne.


ClasseCentre \(c_i\)Effectif \(n_i\)\(n_i c_i\)
[400;500[45041 800
[500;700[60084 800
[700;900[800108 000
[900;1100[100066 000
[1100;1300[120022 400
Total3023 000

\(\bar{x} = \dfrac{23\,000}{30} \approx \mathbf{766{,}7}\) mm

La médiane était 760 mm (Leçon 1). La moyenne est légèrement supérieure, ce qui indique une légère asymétrie à droite dans les données de précipitations.

\(\bar{x} \approx 766{,}7\) mm — légèrement supérieure à la médiane (760 mm)
Exemple 3 — Propriété de linéarité (changement de variable)

Les températures moyennes mensuelles (en °C) à Ouagadougou sur un an sont :

27,4 ; 30,1 ; 33,8 ; 36,2 ; 35,4 ; 32,1 ; 29,5 ; 28,8 ; 30,6 ; 32,0 ; 29,7 ; 27,1

Calculer la moyenne en posant \(d_i = x_i - 30\).


Déviations \(d_i = x_i-30\) : −2,6 ; 0,1 ; 3,8 ; 6,2 ; 5,4 ; 2,1 ; −0,5 ; −1,2 ; 0,6 ; 2,0 ; −0,3 ; −2,9

\(\sum d_i = -2{,}6+0{,}1+3{,}8+6{,}2+5{,}4+2{,}1-0{,}5-1{,}2+0{,}6+2{,}0-0{,}3-2{,}9 = 12{,}7\)

\(\bar{d} = \dfrac{12{,}7}{12} \approx 1{,}058\)

\(\bar{x} = 30 + \bar{d} \approx 30 + 1{,}058 = \mathbf{31{,}06}°C\)

La température moyenne annuelle à Ouagadougou est d'environ 31,1°C.

\(\bar{x} \approx 31{,}1°C\) — calculé efficacement par le changement de variable
Exemple 4 — Moyenne pondérée (combinaison de groupes)

Dans un lycée de Bobo-Dioulasso, deux classes passent l'examen :

Classe A : 32 élèves, moyenne 13,5 sur 20.

Classe B : 28 élèves, moyenne 11,8 sur 20.

Calculer la moyenne générale des deux classes réunies.


\(\bar{x}_{\text{total}} = \dfrac{32\times13{,}5+28\times11{,}8}{32+28} = \dfrac{432+330{,}4}{60} = \dfrac{762{,}4}{60} \approx \mathbf{12{,}71}\)

Erreur fréquente : \(\frac{13{,}5+11{,}8}{2} = 12{,}65\) ≠ 12,71. On ne peut pas faire la moyenne des moyennes si les groupes n'ont pas le même effectif !

\(\bar{x}_{\text{total}} \approx 12{,}71\) — il faut pondérer par les effectifs

VIII. Application concrète ⭐

⭐ Situation concrète Revenus des ménages dans deux quartiers de Ouagadougou

Une enquête compare les revenus mensuels (en milliers de FCFA) dans deux quartiers :

Quartier Gounghin (quartier populaire) — 10 ménages :
45, 52, 48, 60, 55, 47, 51, 58, 53, 49

Quartier Ouaga 2000 (quartier aisé) — 10 ménages :
85, 120, 95, 850, 110, 78, 92, 105, 88, 97

  • a) Calculer la moyenne et la médiane de chaque quartier.
  • b) Laquelle des deux mesures représente mieux le "revenu typique" dans chaque cas ? Pourquoi ?
  • c) Si on fusionne les deux quartiers en un seul échantillon, calculer la moyenne globale.
  • d) Le mode existe-t-il dans ces deux séries ? Que nous dit cette absence ?
Exemple 5 — Revenus des deux quartiers

a) Gounghin :

\(\bar{x}_G = \frac{45+52+48+60+55+47+51+58+53+49}{10} = \frac{518}{10} = \mathbf{51{,}8}\) mille FCFA

Série ordonnée : 45,47,48,49,51,52,53,55,58,60. \(N=10\) pair :

\(\text{Me}_G = \frac{51+52}{2} = \mathbf{51{,}5}\) mille FCFA ≈ moyenne. Distribution symétrique.


Ouaga 2000 :

\(\bar{x}_O = \frac{85+120+95+850+110+78+92+105+88+97}{10} = \frac{1720}{10} = \mathbf{172}\) mille FCFA

Série ordonnée : 78,85,88,92,95,97,105,110,120,850.

\(\text{Me}_O = \frac{95+97}{2} = \mathbf{96}\) mille FCFA


b) Analyse :

Pour Gounghin : moyenne ≈ médiane → les deux sont bonnes. La distribution est symétrique.

Pour Ouaga 2000 : la moyenne (172) est tirée vers le haut par le ménage à 850 000 FCFA. La médiane (96) représente mieux le revenu typique — 9 ménages sur 10 gagnent moins de 120 000 FCFA.


c) Moyenne globale (20 ménages) :

\(\bar{x}_{\text{total}} = \frac{N_G\bar{x}_G+N_O\bar{x}_O}{N_G+N_O} = \frac{10\times51{,}8+10\times172}{20} = \frac{518+1720}{20} = \frac{2238}{20} = \mathbf{111{,}9}\)


d) Mode : Aucune valeur ne se répète dans les deux séries → pas de mode. Cela est typique des données continues ou des petits échantillons. L'absence de mode n'est pas un problème — simplement, aucune valeur n'est "typique" au sens de la répétition.

Gounghin : \(\bar{x}=51{,}8\), \(\text{Me}=51{,}5\)  |  Ouaga 2000 : \(\bar{x}=172\), \(\text{Me}=96\) (médiane préférable !)

✏️ Exercices d'application

Exercice 1 — Calculs directs

Pour la série de données suivante (nombre de sacs de mil par ménage dans un village du Sahel) :

3, 5, 2, 7, 4, 5, 3, 8, 5, 4, 6, 3, 5, 2, 9, 4, 5, 3, 6, 4

  • a) Construire le tableau effectifs/fréquences.
  • b) Calculer la moyenne, la médiane et le mode.
  • c) Vérifier que la somme des écarts à la moyenne est nulle.
a) Valeurs : 2→2, 3→4, 4→4, 5→5, 6→2, 7→1, 8→1, 9→1. Total : 20.

b) \(\sum n_i x_i=4+12+16+25+12+7+8+9=93\). \(\bar{x}=93/20=4{,}65\).
Série ordonnée, \(N=20\) pair : Me = moy. 10ème et 11ème valeurs. Les 10 premières : 2,2,3,3,3,3,4,4,4,4 → 10ème = 4, 11ème = 5. Me \(=(4+5)/2=4{,}5\).
Mode : 5 (effectif 5, le maximum). Mo = 5.

c) \(\sum n_i(x_i-4{,}65)=2(-2{,}65)+4(-1{,}65)+4(-0{,}65)+5(0{,}35)+2(1{,}35)+1(2{,}35)+1(3{,}35)+1(4{,}35)\)
\(=-5{,}3-6{,}6-2{,}6+1{,}75+2{,}7+2{,}35+3{,}35+4{,}35=0\) ✓
Exercice 2 — Données groupées — Rendement du coton

La production de coton (en kg/ha) dans 40 exploitations des Hauts-Bassins :

Classe [kg/ha][600;800[[800;1000[[1000;1200[[1200;1400[[1400;1600]
Effectif5121472
  • a) Calculer la moyenne par les centres de classes.
  • b) Calculer la médiane par interpolation.
  • c) Identifier la classe modale et estimer le mode.
Centres : 700, 900, 1100, 1300, 1500.
\(\sum n_i c_i = 5\times700+12\times900+14\times1100+7\times1300+2\times1500=3500+10800+15400+9100+3000=41800\).
\(\bar{x}=41800/40=\mathbf{1045}\) kg/ha.

b) Fréquences cum : 0,125 ; 0,425 ; 0,775 ; 0,950 ; 1,000. Classe médiane : [1000;1200[ (F de 0,425 à 0,775).
Me = \(1000+\frac{0{,}5-0{,}425}{0{,}35}\times200=1000+\frac{0{,}075}{0{,}35}\times200=1000+42{,}9\approx\mathbf{1043}\) kg/ha.

c) Classe modale : [1000;1200[ (\(n=14\)). Mode estimé ≈ centre = \(\mathbf{1100}\) kg/ha.
Exercice 3 — Propriété de la moyenne
  • a) Une classe de 25 élèves a une moyenne de 12,4 au premier devoir. Deux élèves absents ont des notes de 8 et 15 au deuxième passage. Quelle est la nouvelle moyenne des 27 élèves ?
  • b) Les salaires mensuels (en milliers FCFA) de 5 employés d'une entreprise de Koudougou sont 95, 110, 85, 125, 130. Si le patron accorde une augmentation de 8 000 FCFA à tous, quelle est la nouvelle moyenne ?
  • c) Si à la place il accorde une augmentation de 5 % à tous, quelle est la nouvelle moyenne ?
a) Somme actuelle : \(25\times12{,}4=310\). Nouvelle somme : \(310+8+15=333\). Nouvelle moyenne : \(333/27\approx\mathbf{12{,}33}\).

b) Moyenne actuelle : \((95+110+85+125+130)/5=545/5=109\) mille FCFA. Augmentation de 8 000 FCFA = 8 mille FCFA à chacun → nouvelle moyenne = \(109+8=\mathbf{117}\) mille FCFA. (Propriété : \(\overline{x+b}=\bar{x}+b\).)

c) Augmentation de 5 % : \(y=1{,}05x\). Nouvelle moyenne = \(1{,}05\times109=\mathbf{114{,}45}\) mille FCFA. (Propriété : \(\overline{ax}=a\bar{x}\).)
Exercice 4 — Distribution asymétrique — Prix des pagnes

Au marché central de Ouagadougou, les prix (en FCFA) de 12 pagnes traditionnels sont :

2500, 3000, 2800, 4500, 2600, 3200, 15000, 2900, 3100, 2700, 3300, 2750

  • a) Calculer la moyenne et la médiane.
  • b) Le pagne à 15 000 FCFA est un article de luxe exceptionnel. Que se passe-t-il si on le retire ? Recalculer les deux mesures.
  • c) Quelle mesure recommandez-vous pour indiquer le "prix typique" d'un pagne ?
a) Somme = 2500+3000+2800+4500+2600+3200+15000+2900+3100+2700+3300+2750 = 48350.
\(\bar{x}=48350/12\approx\mathbf{4029}\) FCFA.
Série ordonnée : 2500,2600,2700,2750,2800,2900,3000,3100,3200,3300,4500,15000.
Me = \((2900+3000)/2=\mathbf{2950}\) FCFA.

b) Sans le pagne de luxe : somme = 48350-15000 = 33350, \(\bar{x}=33350/11\approx\mathbf{3032}\) FCFA.
Médiane : série ordonnée de 11 → 6ème valeur = 2900. Me = \(\mathbf{2900}\) FCFA.
La moyenne change de 4029 à 3032 (−25 %), la médiane change peu (2950→2900).

c) La médiane (≈ 2950 FCFA) est recommandée : elle est robuste à la valeur extrême de 15 000 FCFA et représente mieux le prix habituel.
Exercice 5 — Bilan nutritionnel à Dori ⭐

Une étude nutritionnelle dans la ville de Dori (Sahel) analyse la consommation de céréales (en kg/personne/mois) dans 30 ménages :

Classe [kg][5;10[[10;15[[15;20[[20;25[[25;30]
Effectif491142
  • a) Calculer la consommation moyenne par personne par mois.
  • b) Calculer la médiane par interpolation et interpréter.
  • c) Le seuil minimal recommandé est de 15 kg/personne/mois. Quel pourcentage de ménages n'atteint pas ce seuil ?
  • d) Si la consommation de chaque ménage augmente de 20 % grâce à un programme alimentaire, quelle sera la nouvelle moyenne ?
a) Centres : 7,5 ; 12,5 ; 17,5 ; 22,5 ; 27,5.
\(\sum n_i c_i=4(7{,}5)+9(12{,}5)+11(17{,}5)+4(22{,}5)+2(27{,}5)=30+112{,}5+192{,}5+90+55=480\).
\(\bar{x}=480/30=\mathbf{16}\) kg/pers./mois.

b) f : 0,133 ; 0,300 ; 0,367 ; 0,133 ; 0,067. F : 0,133 ; 0,433 ; 0,800 ; 0,933 ; 1,000.
Classe médiane : [15;20[ (F de 0,433 à 0,800).
Me = \(15+\frac{0{,}5-0{,}433}{0{,}367}\times5=15+\frac{0{,}067}{0{,}367}\times5\approx15+0{,}91=\mathbf{15{,}9}\) kg/pers./mois.
La moitié des ménages consomment moins de 15,9 kg par mois.

c) Ménages sous 15 kg : classes [5;10[ et [10;15[ → \(4+9=13\) ménages sur 30 = 43,3 %.

d) Augmentation de 20 % : \(\bar{y}=1{,}20\times\bar{x}=1{,}20\times16=\mathbf{19{,}2}\) kg/pers./mois.
mascotte

À retenir

  • Moyenne : \(\bar{x}=\frac{\sum n_i x_i}{N}\) — centre de gravité, minimise \(\sum(x_i-c)^2\), sensible aux outliers.
  • Médiane : valeur centrale de la série ordonnée — minimise \(\sum|x_i-c|\), robuste aux outliers.
  • Mode : valeur ou classe la plus fréquente — peut être multiple ou absent.
  • Distribution symétrique : Moyenne = Médiane = Mode. Asymétrique droite : Mode < Médiane < Moyenne.
  • Linéarité : \(\overline{ax+b}=a\bar{x}+b\) — utiliser un pivot pour simplifier les calculs.
  • Moyenne pondérée : \(\bar{x}=\frac{N_1\bar{x}_1+N_2\bar{x}_2}{N_1+N_2}\) — ne jamais faire la moyenne des moyennes sans pondérer par les effectifs !
  • Données groupées : utiliser les centres de classes pour la moyenne.
  • Choisir la bonne mesure : médiane pour revenus/prix (données asymétriques), moyenne pour notes/températures (données symétriques).

Supports Vidéo