INF L14 Initiation aux statistiques INF L14 Initiation aux statistiques 6 – Variabilité En Technicolor
Introduction Problème : Problème : moyenne identique moyenne identique étalement différent des données étalement différent des données Nécessité de mesurer la variabilité, ou dispersion des données Nécessité de mesurer la variabilité, ou dispersion des données
Etendue Max - Min Max - Min Etendue = 17 –3 = 14 Prénoms étudiants
Etendue Mesure fragile Mesure fragile Sans Thérèse-Charlotte, étendue = 15 – 3 = 12...
Variance Variance : Variance : Moyenne des carrés des écarts à la moyenne Moyenne des carrés des écarts à la moyenne XX-M(X-M) 2 1-5,328,2 3-3,310,9 3-3,310,9 4-2,35,3 5-1,31,7 5-1,31,7 6-0,30,1 70,70,5 81,72,9 92,77,2 103,713,6 103,713,6 114,722,0 Moyenne0,09,1
Analogie mécanique Moyenne centre de gravité Moyenne centre de gravité Variance moment dinertie Variance moment dinertie
Tableur
Exemple SIMPLESCOMPOSES 6,811,4 2 2,33,4 Prénoms simples Prénoms composés
Problème La variance nest pas dans ma même unité que les données La variance nest pas dans ma même unité que les données m m 2 m m 2 kg kg 2 kg kg 2 nb caractères (nb caractères) 2 nb caractères (nb caractères) 2 parfois difficile à comprendre...
Ecart type Ecart-type : Ecart-type : racine carrée de la variance racine carrée de la variance même unité que les données même unité que les données m m 2 m m m 2 m kg kg 2 kg kg kg 2 kg nb caractères (nb caractères) 2 nb caractères nb caractères (nb caractères) 2 nb caractères Formule : Formule :
Exemple XX-M(X-M) 2 1-5,328,2 3-3,310,9 3-3,310,9 4-2,35,3 5-1,31,7 5-1,31,7 6-0,30,1 70,70,5 81,72,9 92,77,2 103,713,6 103,713,6 114,722,0 Moyenne0,09,14 3,02 variance écart-type
Tableur
Exemple (2) SIMPLESCOMPOSES 6,811,4 1,51,8 on peut visualiser lécart-type, car il sagit de la même échelle
Coefficient de variation Problème de comparaison... Problème de comparaison... Danseuses Danseuses écart-type de 5,2 kg écart-type de 5,2 kg Sumos Sumos écart-type de 10,8 k écart-type de 10,8 k Y a-t-il une variabilité plus grande chez les sumos? Y a-t-il une variabilité plus grande chez les sumos? Pas nécessairement, car la moyenne est plus élevée ! Pas nécessairement, car la moyenne est plus élevée !
Coefficient de variation Coefficient de variation Coefficient de variation expression de lécart-type en pourcentage de la moyenne expression de lécart-type en pourcentage de la moyenne
Exemple (1) DanseusesSumos 58,0206,6 48,9213,7 50,2210,7 44,1218,6 41,2199,2 49,9200,1 59,3187,9 51,3183,4 55,8201,7 47,6187,1 Moyenne50,6200,9 Ecart-type5,210,8 Coeff. var.10,3%5,4% Le poids des sumos varie moins que celui des danseuses !
Exemple (2) Fréquence des lettres Fréquence des lettres 853 pages web 853 pages web CV E9,6%2,3%24,4% Z0,1% 109,7% La variabilité de Z est bien plus forte que celle de E
Problème La variance et lécart-type sont très sensibles aux valeurs extrêmes La variance et lécart-type sont très sensibles aux valeurs extrêmes même problème que la moyenne même problème que la moyenne attention en linguistique (distributions très asymétriques) attention en linguistique (distributions très asymétriques)
Exemple Danseuses ADanseuses B 58,0 48,9 50,2 44,1 41,2 49,9 59,3 51,3 55,8 47,6235 Moyenne50,669,4 Ecart-type5,252,9 Coeff. var.10,3%76,3% Lécart- type est multiplié par 10 !
Termes à retenir Variabilité (ou dispersion) Etendue Variance Ecart-type Coefficient de variation