La statistique descriptive
Plan Distribution de fréquences Distribution de fréquences cumulatives Mesures de la tendance centrale Mesures de variabilité
Distribution des fréquences Définition: C’est une liste de valeurs dans un échantillon. Exemple: x= {60, 38, 41, 45, 40, 75, 31, 35, 45, 46, 55, 61, 40, 15, 58, 71, 46, 53, 65, 54, 41, 56, 45, 65, 69, 50, 54, 41, 57, 44, 75, 30, 44, 30, 63, 44, 58, 34, 33, 66, 49, 42, 58, 70, 28, 49, 47, 47, 58, 38} Habituellement, pour des fins de visualisation, la liste est regroupée en classe.
Distribution des fréquences Largeur des classes = 1
Distribution des fréquences Largeur des classes = 5
Distribution des fréquences Largeur des classes = 10
Distribution des fréquences Largeur des classes = 20
Transformation des fréquences absolues en fréquences relatives
Formes des distributions de fréquences II III IV V VI VII Modalité Courbure (kurtosis) Symétrie - unimodale : I, IV,V, VI, VII - Mesokurtique : I, II - symétrique : I, II, III, V, VI - bimodale : II - Platykurtique : V - asymétrique : IV, VII - Rectangulaire : III - Leptokurtique : IV,VI,VII
Fréquences cumulées Largeur des classes = 10
Fréquences cumulées Largeur des classes = 10 0,96 80
Mesures de tendances centrales Tendance centrale: Score typique qui représente les données. 3 mesures sont habituellement utilisées: Mode: la valeur qui apparaît le plus souvent dans la série de données Médiane: la valeur qui divise la série de données en 2 parties égales (50%/50%) Moyenne: « Le centre de gravité », le poids des valeurs au dessus de la moyenne balance les valeurs en dessous. Moyenne
Mesures de tendances centrales et de variabilités Exemple: x={0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4}; n=20 Mode = 1 Médiane = 1 Moyenne = (Où, x représente le score et n, le nombre de sujets.) =(0+0+0+0+0+0+1+1+1+1+ 1+1+1+2+2+2+2+3+3+4)/20=1, 25
Calcul de la moyenne pour des données groupées Nb d’enfants Fréquence 6 1 7 2 4 3 Où f représente la fréquence
Calcul de la moyenne des moyennes 30 77 20 83 25 80 Où k représente le groupe
Relations entre les mesures de tendances centrales Symétrique Asymétrie positive Asymétrie négative Mode Mode Mode Médiane Médiane Médiane Moyenne Moyenne Moyenne
Mesures de variabilité
Mesures de variabilités L’étendue: distance de la distribution Exemple: x={0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4} n=20 L’étendue: Max(x)-Min(x) = 4 – 0 = 4
Mesures de variabilités La variance: distance (déviation) quadratique moyenne par rapport à la moyenne Exemple: x={13,19,11,17}; Moyenne=60/4=15 Somme des distances moyennes quadratiques Distance quadratique moyenne par rapport à la moyenne Somme des distances moyennes
Mesures de variabilités L’écart-type: distance (déviation) moyenne par rapport à la moyenne Exemple: x={13,19,11,17}; Moyenne=60/4=15 Distance moyenne par rapport à la moyenne
Degrés de liberté Population = {1, 2, 3} Moyenne = 2 Écart-type = 0.6667
Mesures de variabilités Résumé et notations Degrés de liberté Échantillon Population Variance Écart-type