Chapitre 5. Description numérique d’une variable statistique. Ce chapitre s’intéressera principalement à quatre types de paramètres: Les paramètres de tendance centrale, les paramètres de dispersion, les paramètres de concentration, et les paramètres de forme 5.1 Les principaux paramètres de location. Un paramètre de location, de position ou de tendance centrale pour une variable x est un nombre qui indique l’ordre de grandeur habituel de x. Il existe trois principaux paramètres de location qui sont: la médiane, le mode et la moyenne arithmétique.
5.1.1 La médiane. La médiane d’une variable statistique est la valeur de cette variable qui partage les effectifs supposés rangés par ordre de valeur croissante (ou décroissante) de la variable, en deux effectifs égaux. Autrement dit la médiane de x notée Med(x) est le nombre qui occupe le milieu de la distribution statistique; elle correspond à la valeur pour laquelle la fréquence relative cumulée est égale à ½ ou 50% des observations. La médiane peut être déterminée par graphique et/ou par interpolation linéaire. N.B. Le mode de calcul de la médiane diffère selon la nature de la distribution statistique.
4.1.2 Le mode. Le mode d’une variable statistique est la valeur qui correspond au maximum du diagramme différentiel (diagramme en bâtonnets ou histogramme suivant le cas). Le mode est la valeur la plus fréquente ou dominante de la variable statistique. Lorsque la variable statistique est discrète, le mode correspond au bâtonnet le plus long. Si plusieurs valeurs sont ex aequo, alors la variable statistique considérée a plusieurs modes. Si la variable est continue, on ne peut que définir la classe modale qui correspond au maximum de la fréquence moyenne par unité d’amplitude.
5.1.3 La moyenne arithmétique. La moyenne arithmétique de la variable x notée x barre ou (lettre grecque « mu ») est la valeur moyenne que prendraient les valeurs de x Deux cas peuvent se présenter: Si on a une série statistique comportant n observations dont les valeurs respectives sont (x1,x2,x3,..., xn); alors la moyenne arithmétique de la variable x est égale à la somme des valeurs prises par cette variable divisée par le nombre des observations; il s’agit de cas à grandeurs additives.
Cette expression algébrique définissant la moyenne a ensuite été étendue aux variables statistiques quelconques additives ou non; La moyenne d’une variable statistique est la moyenne arithmétique pondérée de ses valeurs possibles par les fréquences correspondantes ou ce qui revient au même par les effectifs correspondants:
La moyenne arithmétique pondérée s’obtient en effectuant la somme de tous les produits de xi par les effectifs ou les fréquences relatives correspondants.
A.Cas discret exemple:1. Le rendement scolaire de deux classes ayant le même professeur enseignant la même matière se présente comme suit: Classe A. 2;2;2;2;10;18;18;18;18. Classe B. 9;9;9;9;10;11;11;11;11. 1) déterminer les fréquences relatives et cumulées pour chaque classe. 2) faire les représentations graphiques 3) calculer et extrapoler les paramètres de location.
i) médiane. la série A est impaire donc: 2n+1=9 2n = 8 n = 4 ( quatrième terme), la médiane correspond à la valeur au n+1 terme i.e 4+1= 5 terme d’ou Med(xA) = 10; Med(xB) =10 ii) moyenne de xA = 10.... (4*2)+(10*1)+(18*4)/9 = 90/9 = 10 moyenne de xB = 10 iii) mode de xA = bimodale 2 et 18 mode de xB = bimodale 9 et 11 Exemple 2.Dans une école primaire rurale; les notes sur 20 de 10 élèves se présentent ainsi: 17;14;15;13;11;6;5;8;9;10 1) calculer et extrapoler les paramètres de location. i) médiane de x n = 10 2n = 10 n = 5ième terme med(x) = [(nième) + (n+1)]/2 = (10 +11 )/2 = 21/2 = 10.5 indéterminée 5;6;8;9;10;11;13;14;15;17 faire les graphiques ii) mode = multimodale iii) moyenne de x = 9.8