2nd – cours – Statistiques

Statistiques

I Révisions (Vocabulaire)

Dans notre société, de nombreuses données sont collectées. Elles peuvent concerner par exemple des objets (taille, poids, qualité,…), des végétaux (taille, nombre de pétales, rendement,…), des animaux (nombre d’individus, poids,…), …

Ce qu’on étudie dans une population d’individus donnés (au sens large) s’appelle un caractère.

Définition 1 : On appelle série statistique d’un caractère un ensemble de données relevées concernant ce caractère.

L’effectif d’une valeur du caractère correspond au nombre de fois que l’on rencontre cette valeur dans la série de statistique étudiée.

L’effectif total d’une série statistique correspond au nombre total d’individus présents dans la population étudiée.

 Définition 2 : On appelle fréquence, souvent notée $f$, d’une valeur du caractère le quotient de l’effectif de la valeur sur l’effectif total.

$$ f= \dfrac{\text{effectif de la valeur}}{\text{effectif total}}$$

Exemple : Voici les notes relevées lors d’une interrogation dans une classe.
$$\begin{array}{|l|c|c|c|c|c|c|}
\hline
\text{Note} & \phantom{1}8 & 10 & 12 & 15 & 16 & 20 \\
\hline
\text{Effectif} & 4 & 8 & 10 & 5 & 2 & 1\\
\hline
\end{array}$$
L’effectif total est : $ 4 + 8 + 10 + 5 + 2 + 1 = 30$

La fréquence de la note $8$ est $\dfrac{4}{30} = \dfrac{2}{15}$

On obtient ainsi le tableau suivant :
$$\begin{array}{|l|c|c|c|c|c|c|}
\hline
\text{Note} & \phantom{1}8 & 10 & 12 & 15 & 16 & 20 \\
\hline
\text{Effectif} & 4 & 8 & 10 & 5 & 2 & 1\\
\hline
\text{Fréquence} & \dfrac{2}{15} & \dfrac{4}{15} & \dfrac{1}{3} & \dfrac{1}{6} & \dfrac{1}{15} & \dfrac{1}{30} \\\\
\hline
\end{array}$$

Définition 3 : L’effectif cumulé croissant (respectivement décroissant) d’une valeur est la somme des effectifs dont le caractère étudié à une valeur inférieure (respectivement supérieure) ou égale à la valeur.

La fréquence cumulée croissante (respectivement décroissante) correspond au quotient de l’effectif cumulé croissant (respectivement décroissant) sur l’effectif total.

Remarque : On peut aussi calculer les fréquences cumulées à l’aide de la somme des fréquences.

Exemple : En reprenant le tableau de l’exemple précédent, on obtient ce nouveau tableau :

$$\begin{array}{|l|c|c|c|c|c|c|}
\hline
\text{Note} & \phantom{1}8 & 10 & 12 & 15 & 16 & 20 \\
\hline
\text{Effectif} & 4 & 8 & \color{red}{10} & 5 & 2 & 1\\
\hline
\begin{array}{l}\text{Effectif} \\ \text{cumulé} \\ \text{croissant} \end{array} & 4 & \color{red}{12} & \color{red}{22} & 27 & 29 & 30 \\
\hline
\end{array}$$

Pour obtenir l’effectif cumulé croissant de la note $12$, il suffit de faire le calcul : $12 + 10 = 22$.
Cet effectif cumulé croissant signifie que $22$ élèves ont obtenu une note inférieure ou égale à $12$.

$$\begin{array}{|l|c|c|c|c|c|c|}
\hline
\text{Note} & \phantom{1}8 & 10 & 12 & 15 & 16 & 20 \\
\hline
\text{Effectif} & 4 & 8 & \color{red}{10} & 5 & 2 & 1\\
\hline
\begin{array}{l}\text{Effectif} \\ \text{cumulé} \\ \text{décroissant} \end{array} & 30 & 26 & \color{red}{18} & \color{red}{8} & 3 & 1 \\
\hline
\end{array}$$

Pour obtenir l’effectif cumulé décroissant de la note $12$, il suffit de faire le calcul $ 8 + 10 = 18$.
Cet effectif cumulé décroissant signifie que $18$ élèves ont obtenu une note supérieure ou égale à $12$.

On obtient également les tableaux de fréquences cumulées suivants :

$$\begin{array}{|l|c|c|c|c|c|c|}
\hline
\text{Note} & \phantom{1}8 & 10 & 12 & 15 & 16 & 20 \\
\hline
\text{Effectif} & 4 & 8 & \color{red}{10} & 5 & 2 & 1\\
\hline
\begin{array}{l}\text{Effectifs} \\ \text{cumulés} \\ \text{croissant} \end{array} & 4 & \color{red}{12} & \color{red}{22} & 27 & 29 & 30 \\
\hline
\begin{array}{l}\text{Fréquence} \\ \text{cumulée} \\ \text{croissante} \end{array} & \dfrac{4}{30} & \dfrac{12}{30} & \color{red}{\dfrac{22}{30}} & \dfrac{27}{30} & \dfrac{29}{30} & 1 \\
\hline
\end{array}$$

On obtient ainsi le tableau suivant :
$$\begin{array}{|l|c|c|c|c|c|c|}
\hline
\text{Note} & \phantom{1}8 & 10 & 12 & 15 & 16 & 20 \\
\hline
\text{Effectif} & 4 & 8 & 10 & 5 & 2 & 1\\
\hline
\text{Fréquence} & \dfrac{4}{30} & \dfrac{8}{30} & \color{red}{\dfrac{10}{30}} & \dfrac{5}{30} & \dfrac{2}{30} & \dfrac{1}{30} \\\\
\hline
\begin{array}{l}\text{Fréquence} \\ \text{cumulée} \\ \text{décroissante} \end{array} & 1 & \dfrac{26}{30} & \color{red}{\dfrac{18}{30}} & \color{red}{\dfrac{8}{30}} & \dfrac{3}{30} & \dfrac{1}{30} \\
\hline
\end{array}$$

Quand on détermine les fréquences cumulées à partir du tableau des fréquences, il est plus facile d’utiliser des fractions non simplifiées. Le calcul des cumuls se fait de la même manière que pour les effectifs : $ \dfrac{8}{30} + \dfrac{10}{30} = \dfrac{18}{30}$.

 Propriété 1 : La somme des fréquences est toujours égale à $1$.

II Moyenne et Médiane

 Définition 4 : On considère une série statistique dont les valeurs du caractère étudié sont $x_1$, $x_2$, $\ldots$, $x_p$ pour lesquels les effectifs respectifs sont $n_1$, $n_1$, $\ldots$, $n_p$.
La moyenne de cette série statistique, notée $\overline{x}$, est :
$$\overline{x} = \dfrac{n_1x_1 + n_2x_2+\ldots + x_pn_p}{n_1 + n_2 + \ldots + n_p}$$

Exemple : En reprenant le tableau de l’exemple précédent
$$\begin{array}{|l|c|c|c|c|c|c|}
\hline
\text{Note} & \phantom{1}8 & 10 & 12 & 15 & 16 & 20 \\
\hline
\text{Effectif} & 4 & 8 & 10 & 5 & 2 & 1\\
\hline
\end{array}$$
la moyenne est $$\begin{align*} \overline{x} &= \dfrac{8 \times 4 + 10 \times 8 + \ldots + 20 \times 1}{4 + 8 + \ldots + 1} \\\\
&= \dfrac{359}{30}
\end{align*}$$

Propriété 2 : Si on appelle $f_i$ la fréquence associée à la valeur $x_i$ alors on a : $$\overline{x} = f_1x_1 + f_2x_2 + \ldots + f_px_p.$$
 Définition 5 : On appelle médiane, souvent notée $M_e$, d’une série statistique la valeur qui sépare la série en deux séries de même effectif.
Cela signifie donc que $50\%$ des valeurs de la série ont une valeur inférieure ou égale à $M_e$ et $50\%$ des valeurs de la série ont une valeur supérieure ou égale à $M_e$.

Remarque 1 : Pour pouvoir déterminer la médiane d’une série, il faut avant toute chose, ranger les valeurs dans l’ordre croissant.

Remarque 2 : La médiane n’appartient pas nécessairement à la série statistique initiale.

Exemple 1 : (effectif total pair) On considère la série statistique suivante (qui a été rangée dans le bon ordre préalablement) :
$$ 5 – 8 – 9 – 9 – 10 – 11 – 13 – 15$$
Cette série comporte $8$ valeurs. $\dfrac{8}{2}  =4$. On va donc pouvoir constituer deux séries de $4$ valeurs.
La première $ 5-8-9-\color{red}{9}$ et la seconde $ \color{red}{10}-11-13-15$.
La médiane est alors la moyenne de la $4^{\text{ème}}$ (la dernière valeur de la première série) et de la $5^{\text{ème}}$ (la première valeur de la seconde série) valeur.
Ainsi $M_e = \dfrac{9 + 10}{2} = 9,5$.

Exemple 2 : (effectif total impair) On considère la série statistique suivante (qui a été dans le bon ordre préalablement) :
$$4-6-7-9-10-12-13$$
Cette série comporte $7$ valeur. $\dfrac{7}{2} = 3,5$. On va donc pouvoir constituer deux séries de $3$ valeurs :
$$\left[4-6-7\right]-\color{red}{9}-\left[10-12-13\right]$$
La médiane est donc $9$.

Les données sont parfois fournies sous forme de classe. Cela permet d’avoir un tableau plus synthétique (intéressant quand on a beaucoup de valeurs) mais en contrepartie on perd en précision.

Exemple : On considère la série statistique suivante :

$$\begin{array}{|l|c|c|c|c|}
\hline
\text{Classe de notes} & ]8;10] & ]10;12] & ]12;14] & ]14;16] \\
\hline
\text{Effectif} & 4 & 14 & 10 & 8\\
\hline
\end{array}$$
Pour pouvoir calculer une valeur approchée de la moyenne, on va faire apparaître le centre de chacune des classes, c’est-à-dire le milieu des intervalles.

$$\begin{array}{|l|c|c|c|c|}
\hline
\text{Classe de notes} & ]8;10] & ]10;12] & ]12;14] & ]14;16] \\
\hline
\text{Centre}& 9 & 11 & 13 & 15 \\
\hline
\text{Effectif} & 4 & 14 & 10 & 8\\
\hline
\end{array}$$

Ainsi :
$$\begin{align*} \overline{x} &\approx \dfrac{9 \times 4 + 11 \times 14 + 13 \times 10 + 15 \times 8}{4 + 14 + 10 + 8} \\\\
& \approx \dfrac{440}{36}
\end{align*}$$

Remarque : La moyenne et la médiane sont des indicateurs de position de la série.

III Quartiles et étendue

 Définition 6 : On considère une série statistique rangée dans l’ordre croissant.
On appelle premier quartile de cette série, noté $Q_1$, la plus petite valeur de la série telle qu’au moins $25\%$ des données soient inférieures ou égales à $Q_1$.
On appelle troisième quartile de cette série, noté $Q_3$, la plus petite valeur de la série telle qu’au moins $75\%$ des données soient inférieures ou égales à $Q_3$.

Remarque : Comme l’indique leur définition, $Q_1$ et $Q_3$ appartiennent nécessairement à la série étudiée.

Exemple 1 : On considère la série suivante :
$$ 4-8-9-11-12-13-14-16-17$$
Cette série contient $9$ valeurs.
$\dfrac{9}{4} = 2,25$. Par conséquent $Q_1$ sera la troisième valeur de la série, soit $Q_1 = 9$.
$\dfrac{9 \times 3}{4} = 6,75$. Par conséquent $Q_3$ sera la septième valeur de la série, soit $Q_3 = 14$.

Exemple 2 : On considère la série suivante :
$$ 1-3-4-5-9-12-14-16$$
Cette série contient $8$ valeurs.
$\dfrac{8}{4} = 2$. Par conséquent $Q_1$ sera la deuxième valeur de la série, c’est-à-dire $Q_1 = 3$.
$\dfrac{8 \times 3}{4} = 6$. Par conséquent $Q_3$ sera la sixième valeur de la série, c’est-à-dire $Q_3 = 12$.

 Définition 7 : On appelle écart inter-quartile d’une série statistique la différence $Q_3-Q_1$.

Dans le dernier exemple, l’écart inter-quartile vaut $12 – 3 = 9$.

 Définition 8 : On appelle étendue d’une série statistique, la différence entre la plus grande et la plus petite valeur de la série.

Ainsi, en reprenant la dernière série, l’étendue vaut $16-1 = 15$.

On résume souvent une série statistique à l’aide d’un diagramme en boîte (ou boîte à moustaches) sur lequel figurent :

  • le minimum
  • $Q_1$
  • la médiane
  • $Q_3$
  • le maximum

Exemple :

2nd - cours - statistiques - fig1

Remarque : Les quartiles et étendue sont des indicateurs de dispersion de la série.

IV Quelques représentations graphiques

Il existe de nombreuses façons de représenter une série statistique. Selon le type de données étudiées on sera amené à utiliser telle ou telle représentation graphique. Voici quelques exemples de ce qu’on peut rencontrer.

Le nuage de points

2nd - cours - statistiques - fig2

Le diagramme en bâtons

2nd - cours - statistiques - fig3

Diagramme circulaire

2nd - cours - statistiques - fig4

Histogramme

2nd - cours - statistiques - fig5

 

Les autres cours de 2nd sont ici.