Télécharger la présentation
Publié parLemoine Charles Modifié depuis plus de 10 années
1
Corrélation Principe fondamental d’une analyse de corrélation
Mesure de la force d’une corrélation Conditions d’application Tests d’hypothèses et intervalles de confiance Comparaisons de corrélations Corrélations non-paramétriques La puissance d’une analyse de corrélation Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
2
Principe fondamental d’une analyse de corrélation
La corrélation mesure l’association linéaire entre deux variables continues Ce n’est pas une relation causale, il n’y a donc pas de distinction entre la variable dépendante et indépendante X2 X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
3
Utilisation de la corrélation
X2 Utiliser pour estimer le degré d’association entre deux variables Ne pas utiliser si on veut prédire la valeur de X pour un Y donné et vice versa. Corrélation X1 Y Régression X Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
4
Corrélation linéaire simple versus régression linéaire simple
les calculs sont les mêmes. dans l’analyse de corrélation, X et Y doivent être échantillonnés au hasard la corrélation mesure l’association (importance) la régression vise à quantifier l’effet d’une variable sur une autre (intensité) Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
5
Exemple: longueur et poids chez l’esturgeon
Les deux variables ne sont pas reliées (cause-effet), alors utiliser la corrélation afin de mesurer le degré d’association entre les deux variables. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 RDWGHT Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
6
Régression: longueur et âge chez l’esturgeon
Relation causale entre les deux. La relation entre les deux donne une estimation du taux de croissance... …et on peut se servir de cette relation afin de prédire la taille d’un esturgeon d’un âge donné. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 AGE Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
7
Mesure de la corrélation
Le coefficient de corrélation, r, entre deux variables avec n paires d’observations est calculé comme: X2 X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
8
Mesure de la corrélation
X2 r = 0.9 r = -0.9 r se situe toujours entre -1 et 1. r2 est le coefficient de détermination qui mesure la proportion de la variabilité d’une variable qui peut être “expliquée” par l’autre. X2 r = 0.5 r = -0.5 X2 r = 0 r = 0 X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
9
Hypothèses implicites I: distribution binormale
Pour chaque valeur de X1, les valeurs de X2 sont normalement disribuées et vice versa. r = 0.8 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
10
Hypothèses implicites II: Homoscédasticité
X2 La variance de X1 est indépendante de celle de X2 et vice versa. Mais les variances de X1 et X2 ne sont pas nécessairement égales. Homoscédastique X2 Hétéroscédastique X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
11
Hypothèses implicites III: Linéarité
X2 La relation entre X1 et X2 est linéaire. Linéaire X2 Non-linéaire X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
12
Violation des conditions d’application: longueur et âge chez l’esturgeon
La relation entre la longueur et l’âge semble non-linéaire. La variance de la longueur semble augmenter avec l’âge. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 AGE Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
13
Si les conditions d’application ne sont pas respectées...
Transformer les données (ex: log). Essayer une analyse de corrélation non-paramétrique. 1.8 1.7 1.6 LFKL 1.5 1.4 1.3 0.5 1.0 1.5 2.0 LAGE Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
14
Intervalles de confiance pour les coefficients de corrélation
X2 L’intervalle de confiance de la corrélation transformée (z) est calculée par: Convertir en unités standards par: Petit IC X2 X2 Grand IC X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
15
Tests d’hypothèses I X2 H0: r = 0
l’erreur-type du coefficient de corrélation : calculer … et comparer à la distribution du t de Student avec N - 2 dl Rejeter H0 X2 X2 Accepter H0 Observées Attendues X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
16
Tests d’hypothèses II X2 H0: r = r transformer r et r : calculer
… et comparer à la distribution Z avec N - 3 dl. Rejeter H0 X2 X2 Accepter H0 Observées Attendues X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
17
Comparaison de deux corrélations
H0: r1 = r2 transformer r1 et r2 : calculer … et comparer à la distribution Z. Rejeter H0 r1 r2 X2 X2 Accepter H0 X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
18
Comparaisons de plusieurs corrélations
X2 H0: ri = rj = rk= … avec ni, nj, nk…observations transformer tous les ri en zi et calculer … et comparer à la distribution de c2 avec dl = k -1. Rejeter H0 r1 r2 X2 X2 r3 Accepter H0 X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
19
Calcul d’une corrélation commune
X2 X2 r3 Si H0: ri = rj = rk= … est acceptée, alors, chaque ri estime le même coefficient r (population). Pour calculer r, on doit dabord calculer le score Z pondéré zw: Accepter H0 X1 Ensuite, retransformer afin d’obtenir r: Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
20
Corrélations non-paramétrques
X2 Rang X2 Utiliser si une ou plusieurs des conditions d’application ne sont pas respectées. C’est une corrélation de rang. La méthode la plus commune: corrélation de rang de Spearman. X1 Rang X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
21
La puissance et la taille de l’effectif
Si on veut tester H0: r = 0 avec une taille d’échantillon n, on peut déterminer 1 - b en utilisant la transformation Z pour les valeurs critiques (pour un a donné) pour r (za) de la vraie corrélation et r (zr) de la corrélation de l’échantillon. X2 X1 Zr Za r Z Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
22
La puissance et la taille de l’effectif
Une fois Zb(1) déterminé, on peut calculer la probabilité d’obtenir une valeur Z de cette taille ou plus grande, c’est-à-dire b. La puissance est 1-b. X2 X1 Zr Za r Z Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
23
La puissance et la taille de l’effectif: exemple
La corrélation entre la longueur des ailes et la longueur de la queue d’un échantillon de 12 oiseaux. alors 1 - b = .98 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
24
Taille de l’effectif minimum
Rejeter H0? X2 Pour une puissance 1 - b donnée, quelle est la taille de l’effectif requise afin de rejeter H0: r = 0 si elle est fausse avec un r0 spécifié Calculer: X2 X2 Rejecter H0? Observées Attendues X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
25
Taille d’effectif minimum: exemple
On veut rejeter H0: r = 0 99% des fois quand |r0| > 0.5 et a(2) = .05. Alors b(1) = .01 et pour r = .50, on a... Alors Alors, la taille de l’échantillon devra être supérieure ou égale à 64. Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
26
Puissance d’une comparaison de deux corrélations
Rejeter H0 La puissance d’un test de la différence entre deux coefficients de corrélation est 1- b, où b est une probabilité unilatérale: r1 r2 X2 X2 Accepter H0 X1 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
27
Exemple Quelle est la puissance de la comparaison de ces deux corrélations? On peut ensuite trouver dans un tableau de distribution normale : La puissance = 0.22 Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.