Comparaison de deux séries Les paramètres connus pour comparer deux séries peuvent parfois être défaillants. On peut prendre l’exemple de deux élèves ayant pour notes au cours d’un trimestre : Élève 1 : 0 – 10 – 20 Élève 2 : 9 – 10- 11 . Les deux ont même moyenne et même médiane et pourtant ces deux relevés de notes se démarquent par leurs valeurs extrêmes. Cet exemple peut s’étendre à des exemples économiques.
Etudions les revenus de deux populations. Pour comparer ces résultats, on peut être amené à rechercher : Moyenne Médiane Déciles Coefficient de Gini …
Des indicateurs déficients Malheureusement on constate qu’il ne pourra pas y avoir de comparaison utilisant ces indicateurs. Aucun de ces paramètres ne diffère. Alors comment peut-on expliquer la différence entre les deux séries ?
Les causes de cette déficience Tous ces paramètres ne tiennent pas compte des valeurs extrêmes. Pour la moyenne, on effectue le calcul suivant : Pour la population 1, les dix dernières valeurs compensent les dix premières. Pour la médiane, D1 et D9, seuls comptent les résultats obtenus aux positions respectives 50, 10 et 90. Ainsi les valeurs extrêmes ne sont pas prises en compte. Pour le coefficient de Gini, la formule est : Or, on constate que l’aire de la courbe verte et proche de celle de la courbe bleu. Les écarts se compensent une fois de plus.
Une représentation graphique pour comprendre : les strobiloïdes En partant de nos données discrètes et grâce à un lissage, on obtient : α ≈ 3 pour la population 1 Ainsi on peut tracer la fonction de répartition et la densité approximatives.
Une représentation graphique pour comprendre : les strobiloïdes En faisant de même pour la population 2, on obtient un coefficient α ≈ 4.
La comparaison des 2 strobiloïdes Cette représentation permet de visualiser les différences en termes de répartition de ces deux populations. La population 2 est plus concentrée autour de la médiane alors que la population 1 est beaucoup plus inégalitaire avec des très pauvres et des très riches. 2 3 4 1 x Revenu médianisé Population 1 Population 2 Part de la population 1 1
Des indicateurs statistiques efficients Ce sont des indicateurs qui vont tenir compte des valeurs extrêmes de la série : Le rapport entre le revenu moyen du premier et le dernier dixième de la population L’écart type
Le rapport D1/D10 On note ici d1, le revenu moyen des 10 % les plus pauvres et d10, le revenu moyen des 10 % les plus riches. On obtient pour notre exemple les résultats suivants :
L’écart type L’écart type correspond à l’écart à la moyenne de chaque valeur par rapport à la moyenne. Ainsi les valeurs extrêmes seront prises en compte sans phénomène d’élimination par rapport au calcul de la moyenne.