La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

La corrélation et la régression. Mesure de la relation entre deux variables 2 variables sont prises en considération simultanément 2 variables sont prises.

Présentations similaires


Présentation au sujet: "La corrélation et la régression. Mesure de la relation entre deux variables 2 variables sont prises en considération simultanément 2 variables sont prises."— Transcription de la présentation:

1 La corrélation et la régression

2 Mesure de la relation entre deux variables 2 variables sont prises en considération simultanément 2 variables sont prises en considération simultanément Ex. Résultats en français et en mathématique Ex. Résultats en français et en mathématique Couleur dune auto et le nombre daccidents Couleur dune auto et le nombre daccidents Attention, ce nest jamais un indice de cause à effet Attention, ce nest jamais un indice de cause à effet -> manipulations expérimentales -> manipulations expérimentales La relation est décrite par le coefficient de corrélation (r) La relation est décrite par le coefficient de corrélation (r) Il varie entre -1 et 1: 1 (ou -1) = relation parfaite 0 = absence de relation Il varie entre -1 et 1: 1 (ou -1) = relation parfaite 0 = absence de relation Il existe donc trois cas possibles: Il existe donc trois cas possibles: Relation positive : x augmente; y augmente Relation positive : x augmente; y augmente Relation négative : x diminue; y augmente Relation négative : x diminue; y augmente Absence de relation: x augmente (ou diminue); y ne change pas Absence de relation: x augmente (ou diminue); y ne change pas

3 Exemples de relation

4

5 Exemple

6 Exemple Mesure la direction et la grandeur de la relation

7 Note

8 Exemple Comme on ne peut pas comparer des mesures de covariances entrent-elles, il faut la standardiser.

9 Coefficient de détermination xy xy xy Variance commune = 0 % Variance commune = 25 % Variance commune = 80 %

10 Exemple 77% de la variance en y peut être expliquée par la variance en x Exemple 2 (SAT) 36% de la variance de la réussite universitaire peut être expliquée par la variance du score au SAT

11 Coefficients de corrélation erronés Restriction de létendue: diminue la corrélation

12 Coefficients de corrélation erronés Utilisation de groupes extrêmes: augmente la corrélation L L L L L L L L L L H H H H H H H H H r = 0.75

13 Coefficients de corrélation erronés Utilisation de groupes extrêmes: augmente la corrélation L L L L L L L L L L H H H H H H H H H x x x x x x x x x x x xx x x x x x x x x x x x x x x x x x x x x x x x x x x r = 0.50

14 Coefficients de corrélation erronés Combiner des groupes: augmente ou diminue la corrélation r 1 = 0 r 2 = 0 r 1 > 0 r 2 > 0 r 1 > 0 r 2 > 0

15 Coefficients de corrélation erronés Score extrême: augmente ou diminue la corrélation x x x x x x x x x x x xx x x x x x x

16 Coefficients de corrélation erronés Relation non linéaire: diminue la corrélation

17 Note Même si le coefficient de corrélation est celui rapporté, il nest pas un estimateur non biaisé de la corrélation dans la population. Plus, léchantillon est petit, plus le biais sera grand. Pour corriger la situation, le coefficient de corrélation ajusté est calculé.

18 Inférence

19 Inférence Lhypothèse émise est que la corrélation entre x et y est nulle dans la population. Autrement dit, on cherche à savoir si x et y sont linéairement indépendants. Si on rejette cette hypothèse, alors cela indique que les populations ne sont pas indépendantes et quil existe une relation linéaire entre les deux. Ou

20 Exemple Comme le t obs >t crit (3.209>3.182) on rejette H 0 et on accepte H 1. Les 2 populations sont donc dépendantes.

21 Distribution F Degrés de liberté au numérateur Degrés de liberté au dénominateur 1-

22 Distribution F dl 1 =1 (2 groupes)

23 Exemple (F) Comme le F obs >F crit (10.37>10.13) on rejette H 0 et on accepte H 1. Les 2 populations sont donc dépendantes.

24 Régression linéaire

25 On veut une relation fonctionnelle entre 2 variables et non seulement un indice dassociation On veut une relation fonctionnelle entre 2 variables et non seulement un indice dassociation Autrement dit, on veut être en mesure de faire de la prédiction Autrement dit, on veut être en mesure de faire de la prédiction x1x1 y1y1 Rappel des caractérisiques (pente, constante) de léquation dune droite

26 Les paramètres de la droite de régression Si on remplace b 0

27 Note On sait que Si on remplace la covariance par sa valeur

28 Exemple 2

29

30 Prédiction À partir de léquation de régression, il est possible de faire des prédiction Ex. 1Si x = 7.5, que vaut ?

31 Prédiction De façon similaire on peut prédire x à partie de y Ex. 2Si y = 9.65, que vaut ?

32 Prédiction Enfin! Ex. 3Si x = 3, que vaut ? Or, (x,y) => (3,2). Donc, la prédiction commet une certaine erreur

33 Erreur type de la régression La différence entre la droite de régression constitue lerreur de prédiction à partir de x.

34 Note Pour des grands échantillons

35 Intervalles de confiance Lerreur type est un estimé de lerreur totale. Cependant il nest pas un bon estimé pour la prédiction dun x donné. En effet, lestimation de lerreur sera plus petite lorsque x est près de la moyenne et plus grande lorsquil est loin de la moyenne. Prédiction à partir dun nouveau score

36 Intervalles de confiance Exemple x new = 7.5 pour un IC de 95% Prédiction à partir dun nouveau score

37 Intervalles de confiance Il peut être intéressant de connaître la région de confiance pour lensemble de la droite de régression. Prédiction pour lensemble des données

38 Exemple

39 Exemple

40 Exemple

41 Relation entre le test t et la corrélation

42 Exemple (groupes indépendants) Test t

43 Exemple (groupes indépendants) Modèle général linéaire (corrélation) Lidée est de construire une variable indépendante qui permettra didentifier à quel groupe appartient la variable dépendante. Ex1: 1 = le premier groupe et 0 le deuxième Ex2: 1 = le premier groupe et -1 le deuxième

44 Exemple (groupes indépendants) 1 = le premier groupe et -1 = le deuxième

45 Exemple (groupes indépendants) Modèle général linéaire (corrélation) Donc, le test t (indépendant) est un cas particulier de la corrélation/régression

46 Exemple (groupes dépendants) Test t

47 Exemple (groupes dépendants) Modèle général linéaire (corrélation) Lidée est de décomposer la variabilité en deux parties. Ainsi, dans le schème à mesures répétées il y a une part de variabilité attribuable aux sujets et une autre à la condition (effet possible de traitement).

48 Exemple (groupes dépendants) Modèle général linéaire (corrélation) Variabilité des sujets Pour estimer cette variabilité on élimine leffet condition:

49 Exemple (groupes dépendants) Modèle général linéaire (corrélation) Variabilité des sujets Pour estimer cette variabilité on élimine leffet condition:

50 Exemple (groupes dépendants) Modèle général linéaire (corrélation) Variabilité de la condition Pour estimer cette variabilité on élimine leffet mesure répétée; on procède comme si les groupes étaient indépendants:

51 Exemple (groupes dépendants) Modèle général linéaire (corrélation) Test de signification

52 Exemple (groupes dépendants) Modèle général linéaire (corrélation) Donc, le test t (dépendant) est aussi un cas particulier de la corrélation/régression


Télécharger ppt "La corrélation et la régression. Mesure de la relation entre deux variables 2 variables sont prises en considération simultanément 2 variables sont prises."

Présentations similaires


Annonces Google