Objectifs du chapitre sur la corrélation Comprendre ce qu’est une corrélation Savoir représenter une corrélation à l’aide d’un diagramme de dispersion du coefficient de corrélation
2 façons de représenter une corrélation (1) Visuellement: tableau de contingence (données qualitatives) diagramme de dispersion (données quantitatives): coordonnées de 2 variables sur plan cartésien
2 façons de représenter une corrélation (2) Mathématiquement: coefficient de Bravais-Pearson Coefficient standardisé de covariance (données continues) variant entre –1 et +1 0 indique l’absence d’association indique la force et la direction de la relation autres: φ, Spearman, bisériel, etc.
L’équation du coefficient de corrélation de Bravais-Pearson La formule conceptuelle La formule de calcul
Mnémonique La formule conceptuelle … s’écrit aussi
Un exemple: calcul et interprétation: association ou cause-effet? # cigognes population 125 55000 150 55500 175 65000 200 67500 248 68000 250 70000 75000
Un exemple: calcul Cigo-gnes Popu-lation C2 P2 CxP 125 55000 15625 6875000 150 55500 22500 3.0802 x 109 8325000 175 65000 30625 4.2250 x 109 11375000 200 67500 40000 4.5562 x 109 13500000 248 68000 61504 4.6240 x 109 16864000 250 70000 62500 4.9000 x 109 17500000 75000 5.6250 x 109 18750000 1398 456000 295254 3.0035 x 1010 93189000
Exemple de calcul (1)
Exemple de calcul (2)
Problèmes 9.1-9.3 bébé fertile % nais. 6,1 43,0 9,2 7,1 55,3 12,0 7,4 48,5 10,4 6,3 38,8 9,8 6,5 46,2 5,7 39,9 7,7 6,6 43,1 10,9 8,1 9,5 40,0 11,6 6,9 56,7
Problèmes 9.1-9.3: calculs Y X1 X2 YX1 YX 2 Y2 X1 2 X22 X1X2 6,1 43,0 9,2 262,30 56,12 37,21 1849,00 84,64 395,60 7,1 55,3 12,0 392,63 85,20 50,41 3058,09 144,00 663,60 7,4 48,5 10,4 358,90 76,96 54,76 2352,25 108,16 504,40 6,3 38,8 9,8 244,44 61,74 39,69 1505,44 96,04 380,24 6,5 46,2 300,30 63,70 42,25 2134,44 452,76 5,7 39,9 7,7 227,43 43,89 32,49 1592,01 59,29 307,23 6,6 43,1 10,9 284,46 71,94 43,56 1857,61 118,81 469,79 8,1 9,5 392,85 76,95 65,61 90,25 460,75 40,0 11,6 252,00 73,08 1600,00 134,56 464,00 6,9 56,7 391,23 80,04 47,61 3214,89 657,72 67 460 102,5 3106,54 689,62 453,28 21516 1066,4 4756,09
Calcul 9.1
rxy en tant qu’estimateur de ρ biais: surévaluation solution: réduire l’indice correction mathématique: utilisation en régression, alors N-2 = N-p-1
Comment savoir si rxy égale 0 ou non? test t: avec N-2 comme dl règle de jugement à l’oeil: si le résultat de ce calcul est plus grand que 2, alors rxy est différent de 0
D’autres coefficients de corrélation (1) : corrélation pour 2 variables nominales rpb: corrélation entre une variable nominale et une variable à intervalles égaux = r
L’exemple des cigognes population 125 0 55000 0 150 0 55500 0 175 0 65000 0 200 0 67500 0 248 1 68000 1 250 1 70000 1 75000 1
4 3 Popu-lation < 67998 Popu-lation < 67999 # cigognes < 201 > 202 3
D’autres coefficients de corrélation (2) rb: corrélation pour une variable nominale en pratique mais continue en réalité : corrélation entre deux variables ordinales
Un exemple de calcul pour le r de Spearman (1) # cigo-gnes Rang cig. Popu-lation Rang popu. Diff. rangs 125 1 55000 150 2 55500 175 3 65000 200 4 67500 248 5 68000 250 6.5 70000 6 +0.5 75000 7 -0.5
Un exemple de calcul pour le r de Spearman (2)
Problèmes 9.1-9.3 bébé rb fertile rf Diff. D2 6,1 2 43,0 4 -2 7,1 8 55,3 9 -1 1 7,4 48,5 7,5 1,5 2,25 6,3 3,5 38,8 2,5 6,25 6,5 5 46,2 6 5,7 39,9 6,6 43,1 8,1 10 40,0 3 ,5 ,25 6,9 7 56,7
De la corrélation aux corrélations les tableaux de corrélation: relations multiple 2 x 2 savoir trouver les patrons à l’œil l’analyse factorielle: approche mathématique pour réduire les tableaux de corrélations en éléments principaux
Un exemple: calcul et interprétation: association ou cause-effet? # cigognes population 125 55000 150 55500 175 65000 200 67500 248 68000 250 70000 75000
Réflexion Cote 1 Cote 2 1 11 2 12 3 13 4 14 5 15 6 16 7 17