La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Corrélation et régression linéaire simple 1.La corrélation 2.La régression linéaire simple.

Présentations similaires


Présentation au sujet: "Corrélation et régression linéaire simple 1.La corrélation 2.La régression linéaire simple."— Transcription de la présentation:

1 Corrélation et régression linéaire simple 1.La corrélation 2.La régression linéaire simple

2 Introduction Etude de la relation entre deux variables quantitatives: -description de lassociation linéaire: corrélation, régression linéaire simple - explication / prédiction dune variable à partir de lautre: modèle linéaire simple X Y Nuage de points:

3 La corrélation Statistique descriptive de la relation entre X et Y: variation conjointe 1. La covariance Dans léchantillon: Estimation pour la population:

4 Covariance et nuage de points Contribution > 0 > 0 < 0 La corrélation

5 2. Le coefficient de corrélation linéaire « de Pearson » Dans léchantillon: Estimation pour la population: La corrélation

6 2. Le coefficient de corrélation linéaire X1X1 X2X2 r = 0.9 X2X2 r = 0.5 X2X2 r = 0 r = -0.5 Indice de covariance absolu: -1 r 1 La corrélation r = -0.9 X2X2 X2X2 X2X2

7 3. Conditions dutilisation La loi de probabilité du couple (X,Y) f(x,y)dxdy = P(x X x+dx, y Y y+dy) est une loi normale à deux dimensions: Notamment, pour chaque valeur de X, les valeurs de Y sont normalement distribuées et vice-versa. r = 0.8 r = 0 La corrélation Normalité

8 Homoscédasticité La variance de Y est indépendante de X et vice- versa. Y X Y Homoscédasticité Hétéroscédasticité La corrélation 3. Conditions dutilisation

9 Linéarité La relation est linéaire Y Linéarité X Y Non-linéarité X La corrélation 3. Conditions dutilisation

10 Non respect des conditions dutilisation AGE FKLNGTH LAGE LFKL Relation âge - longueur chez lesturgeon: transformation log-log; Alternative: utiliser la corrélation non paramétrique La corrélation

11 4. Tests de la corrélation a. Distribution déchantillonnage du coefficient de corrélation linéaire Lorsque les conditions dutilisation (binormalité, homoscédasticité, linéarité) sont remplies, sous Ho: = 0: Attention, sous Ha: 0: distribution complexe (Student) La corrélation

12 b. Test de = 0 Absence de relation linéaire (mais pas absence de relation y compris causale) Sous Ho: Si H0 est rejetée: corrélation causalité 4. Tests de la corrélation La corrélation

13 La régression linéaire simple Y X Description de la relation entre X et Y: « courbes de niveau » du nuage de points. Si (X,Y) suit une loi binormale: ellipses.

14 Courbes de régression Description de la relation: densité de probabilité de Y conditionnellement à X: Y X Courbe de régression = E(Y/X) et E(X/Y) Si (X,Y) binormale alors les courbes de régression sont des droites E(Y/X) E(X/Y) - X et Y tiennent un rôle symétrique ! - Plusieurs courbes possibles La régression linéaire simple

15 1. Le modèle On suppose: y = f(x) = a + bx Modèle: Y i = a + bX i + e i avec, pour X = x i, Y i : N(a+bx i, ) X = variable explicative (« indépendante »), contrôlée Y = variable expliquée (dépendante ), aléatoire Y X Relation de causalité interdépendance La régression linéaire simple

16 2. Lestimation des paramètres a? b? Méthode destimation: les moindres carrés: Y X MiMi eiei MiMi xixi yiyi y = a+bx e i = y i - (a + bx i ) minimale La régression linéaire simple

17 Méthode des moindres carrés On cherche le minimum de 2. Lestimation des paramètres La régression linéaire simple

18 Méthode des moindres carrés 2. Lestimation des paramètres La régression linéaire simple

19 Si y = a+bx alors et On peut alors prédire y pour x compris dans lintervalle des valeurs de léchantillon: Méthode des moindres carrés 2. Lestimation des paramètres La régression linéaire simple

20 3. Qualité de lajustement On a supposé: Y i = a + bX i + e i avec pour X = x i, Y i : N(a+bx i, ) - distribution normale des erreurs - variance identique (homoscédasticité) - indépendance: - linéarité de la relation Test a posteriori : étude du nuage de points/ du graphe des résidus La régression linéaire simple

21 Normalité de lerreur Valeurs prédites Résidus Questions à se poser: structure de lerreur? Valeurs extrêmes: ont-elles un sens biologique? Influencent- elles lestimation des paramètres? La régression linéaire simple 3. Qualité de lajustement

22 Homoscédasticité Résidus Valeurs prédites Possibilité de transformation: attention aux transformations ad hoc La régression linéaire simple 3. Qualité de lajustement

23 Indépendance entre erreurs, linéarité Résidus Structure de lerreur? Relation non linéaire? La régression linéaire simple 3. Qualité de lajustement

24 Décomposition de la variation Quelle part de la variabilité de Y est expliquée par la relation linéaire avec X? Variabilité? Somme des Carrés des Ecarts SCE: La régression linéaire simple 4. Coefficient de détermination

25 SCE TotaleSCE reg.lin. (Expliquée)SCE hors reg.lin. (erreur) Y = + =+ Décomposition de la variation La régression linéaire simple 4. Coefficient de détermination

26 La décomposition de la SCE permet destimer la part de SCE de Y expliquée par la régression: Coefficient de détermination Relation avec r? 0 r 2 1 La régression linéaire simple

27 Relation entre r et r 2 Donc En particulier, r = 0 r 2 = 0 4. Coefficient de détermination La régression linéaire simple

28 5. Tests Test de la décomposition de la variation ou analyse de variance (ANOVA): H 0 : 2 = 0 NB: numériquement équivalent à La régression linéaire simple

29 Test sur la pente Ho: b = 0 Ici: Principe des tests sur les paramètres: NB: Les tests de nullité de b, r et r 2 sont numériquement équivalents La régression linéaire simple

30 Autres tests - comparaison de la pente à une valeur non nulle - comparaison de lordonnée à lorigine à une valeur quelconque - comparaison de pentes La régression linéaire simple

31 Bilan X et Y aléatoiresX contrôlée, Y aléatoire Y a-t-il un lien? Corrélation Quel lien? Régression Explication de Y par X: Modèle linéaire simple Question Modèle (X,Y) binormal => linéarité des régressions Dy/x : a, b Dx/y : c, d Y = a + bx + e Pour X = x i, Y i : N(a+bx i, ) La régression linéaire simple

32 X et Y aléatoiresX contrôlée, Y aléatoire r: paramètre de la distribution de (X,Y) R 2 : part de variation de Y expliquée par X Lien Tests - test de -Tests sur les pentes b et d - test de r 2 : ANOVA - test sur la pente Bilan La régression linéaire simple


Télécharger ppt "Corrélation et régression linéaire simple 1.La corrélation 2.La régression linéaire simple."

Présentations similaires


Annonces Google