Stat-infoCM6a : 1 Rappels
Stat-infoCM6a : 2 Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un lien, on utilise le 2 2.Variables quantitatives : –Notes sur 20 –Performances sportives Pour comparer des moyennes, on utilise les intervalles de confiances (loi normale ou T de student, selon les cas)
Stat-infoCM6a : 3 Covariance
Stat-infoCM6a : 4 Problème Y a-t-il un lien entre : Note de français et note de math ? Temps de préparation et performance ? Poids et taille ? Taille et note de math ?
Stat-infoCM6a : 5 Exemple 1 Note de français et note de math : y a-t-il un lien ?
Stat-infoCM6a : 6 Exemple 1 Note de français et note de math : y a-t-il un lien ?
Stat-infoCM6a : 7 Exemple 1 Note de français et note de math : y a-t-il un lien ?
Stat-infoCM6a : 8 Exemple 1 Note de français et note de math : y a-t-il un lien ?
Stat-infoCM6a : 9 Exemple 1 Note de français et note de math : y a-t-il un lien ?
Stat-infoCM6a : 10 Exemple 2 Taille et note de math : y a-t-il un lien ? TailleMath
Stat-infoCM6a : 11 Exemple 3 Note de techno et note de français : y a-t-il un lien ? TechnoFrançais
Stat-infoCM6a : 12 Lien ou pas ? Oui, lien positif bonne note de math = bonne note de français Oui, lien négatif bonne note de math = mauvaise note de techno Non : Taille et note sont indépendants
Stat-infoCM6a : 13 Intuitivement Lien positif Lien négatif Positif Négatif
Stat-infoCM6a : 14 Intuitivement Pour chaque point, on va calculer un indice qui –sera positif si le point est dans un quartier positif –sera négatif si le point est dans un quartier positif Ensuite, on fera la moyenne des indices Indice positif Indice négatif
Stat-infoCM6a : 15 Intuitivement Beaucoup d’indices positifs La moyenne sera positive Beaucoup d’indices négatif La moyenne sera négative
Stat-infoCM6a : 16 En pratique Moyenne des X Moyenne des Y
Stat-infoCM6a : 17 En pratique Donc est négatif Donc est positif Donc est négatif Donc est positif
Stat-infoCM6a : 18 Exemple MathFrançais
Stat-infoCM6a : 19 Exemple MathFrançais ; +2 +5; +5 +2; +3 +3; -2 -2; -3 -6; -5
Stat-infoCM6a : 20 Exemple MathFrançais x 2 = - 4 → ↑ 3 x - 2 = - 6 ← 2 x 3 = x - 3 = 6 → ↑ - 6 x - 5 = 30 5 x 5 = 25 ↓
Stat-infoCM6a : 21 Définition La covariance est la moyenne des indices : Cov(X,Y)= Note : la covariance étant un estimateur biaisé, on divise par n-1 et non par n
Stat-infoCM6a : 22 Exemple MathFrançais x 2 = - 4 → ↑ 3 x - 2 = - 6 ← 2 x 3 = x - 3 = 6 → ↑ - 6 x - 5 = 30 5 x 5 = 25 ↓ =57 Cov(X,Y) = 11,4
Stat-infoCM6a : 23 En pratique La covariance précise le lien : –Si Cov(X,Y) est grand (en valeur absolu), il y a un lien –Si Cov(X,Y) est négative, le lien est négatif –Si Cov(X,Y) est positif, le lien est positif
Stat-infoCM6a : 24 Exemple Cov = 18 Cov = -14
Stat-infoCM6a : 25 Coefficient de corrélation
Stat-infoCM6a : 26 Problème La covariance dépend de la taille des données : MathFrançais MathFrançais Contrôle noté sur 20 Même contrôle, noté sur 100 Cov = 11,5Cov=285 … Elle dépend aussi de l’unité : poids vs taille ↔ Kg vs cm
Stat-infoCM6a : 27 Solution Coefficient de corrélation : –C’est une covariance « normé » –Varie entre -1 et 1 –Pas d’unité (ni Kg, ni note sur 20,…)
Stat-infoCM6a : 28 Propriétés r varie entre -1 et 1 Si |r|=1, le lien entre les variables est parfait Si r>0, le lien est positif Si r<0, le lien est négatif Si r=0, on ne peut rien dire. Exemple :
Stat-infoCM6a : 29 Exemple MathFrançais MathFrançais Note sur 20 Note sur 100 Cov = 11,4Cov=285 X =4,05 Y =3,90 X =20,25 Y =19,49 r XY =0,72
Stat-infoCM6a : 30 r est-il significatif ? Pour le savoir, on pose Puis on fait un test de Student classique avec N-2 DDL : –Si T Obs > T Th, le r est significativement différent de zéro Il y a un lien entre les variables –Si T Obs < T Th, le r n’est pas significativement différent de zéro On ne peut rien conclure