1 1 Licence Stat-info CM6 a 2004 V1Christophe Genolini Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un lien, on utilise le 2 2.Variables quantitatives : –Notes sur 20 –Performances sportives Pour comparer des moyennes, on utilise les intervalles de confiances (loi normale ou T de student, selon les cas) Pour déterminer s’il y a un lien, on utilise la corrélation
2 2 Licence Stat-info CM6 a 2004 V1Christophe Genolini Problème Y a-t-il un lien entre : Note de français et note de math ? Temps de préparation et performance ? Poids et taille ? Taille et note de math ?
3 3 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple 1 Note de français et note de math : y a-t-il un lien ?
4 4 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple 1 Note de français et note de math : y a-t-il un lien ?
5 5 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple 1 Note de français et note de math : y a-t-il un lien ?
6 6 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple 1 Note de français et note de math : y a-t-il un lien ?
7 7 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple 1 Note de français et note de math : y a-t-il un lien ?
8 8 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple 2 Taille et note de math : y a-t-il un lien ? TailleMath
9 9 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple 3 Note de techno et note de français : y a-t-il un lien ? TechnoFrançais
10 Licence Stat-info CM6 a 2004 V1Christophe Genolini Lien ou pas ? Oui, lien positif bonne note de math = bonne note de français Oui, lien négatif bonne note de math = mauvaise note de techno Non : Taille et note sont indépendants
11 Licence Stat-info CM6 a 2004 V1Christophe Genolini Intuitivement Lien positif Lien négatif Positif Négatif
12 Licence Stat-info CM6 a 2004 V1Christophe Genolini Pour chaque point, on va calculer un indice qui –sera positif si le point est dans un quartier positif –sera négatif si le point est dans un quartier positif Ensuite, on fera la moyenne des indices Indice positif Indice négatif
13 Licence Stat-info CM6 a 2004 V1Christophe Genolini Intuitivement Beaucoup d’indices positifs La moyenne sera positive Beaucoup d’indices négatif La moyenne sera négative
14 Licence Stat-info CM6 a 2004 V1Christophe Genolini En pratique Moyenne des X Moyenne des Y
15 Licence Stat-info CM6 a 2004 V1Christophe Genolini En pratique Donc est négatif Donc est positif Donc est négatif Donc est positif
16 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple MathFrançais
17 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple MathFrançais ; +2 +5; +5 +2; +3 +3; -2 -2; -3 -6; -5
18 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple MathFrançais x 2 = - 4 → ↑ 3 x - 2 = - 6 ← 2 x 3 = x - 3 = 6 → ↑ - 6 x - 5 = 30 5 x 5 = 25 ↓
19 Licence Stat-info CM6 a 2004 V1Christophe Genolini Définition La covariance est la moyenne des indices : Cov(X,Y)= Note : la covariance étant un estimateur biaisé, on divise par n-1 et non par n
20 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple MathFrançais x 2 = - 4 → ↑ 3 x - 2 = - 6 ← 2 x 3 = x - 3 = 6 → ↑ - 6 x - 5 = 30 5 x 5 = 25 ↓ =57 Cov(X,Y) = 11,4
21 Licence Stat-info CM6 a 2004 V1Christophe Genolini En pratique La covariance précise le lien : –Si Cov(X,Y) est grand (en valeur absolu), il y a un lien –Si Cov(X,Y) est négative, le lien est négatif –Si Cov(X,Y) est positif, le lien est positif
22 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple Cov = 18 Cov = -14
23 Licence Stat-info CM6 a 2004 V1Christophe Genolini Problème La covariance dépend de la taille des données : MathFrançais MathFrançais Contrôle noté sur 20 Même contrôle, noté sur 100 Cov = 11,5Cov=285 … Elle dépend aussi de l’unité : poids vs taille ↔ Kg vs cm
24 Licence Stat-info CM6 a 2004 V1Christophe Genolini Solution Coefficient de corrélation : –C’est une covariance « normé » –Varie entre -1 et 1 –Pas d’unité (ni Kg, ni note sur 20,…)
25 Licence Stat-info CM6 a 2004 V1Christophe Genolini Propriétés r varie entre -1 et 1 Si |r|=1, le lien entre les variables est parfait Si r>0, le lien est positif Si r<0, le lien est négatif Si r=0, on ne peut rien dire. Exemple :
26 Licence Stat-info CM6 a 2004 V1Christophe Genolini Exemple MathFrançais MathFrançais Note sur 20 Note sur 100 Cov = 11,4Cov=285 X =4,05 Y =3,90 X =20,25 Y =19,49 r XY =0,72
27 Licence Stat-info CM6 a 2004 V1Christophe Genolini r est-il significatif ? Pour le savoir, on pose Puis on fait un test de Student classique avec N-2 DDL : –Si T Obs > T Th, le r est significativement différent de zéro Il y a un lien entre les variables –Si T Obs < T Th, le r n’est pas significativement différent de zéro On ne peut rien conclure