Corrélation Principe fondamental d’une analyse de corrélation Mesure de la force d’une corrélation Conditions d’application Tests d’hypothèses et intervalles de confiance Comparaisons de corrélations Corrélations non-paramétriques La puissance d’une analyse de corrélation Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Principe fondamental d’une analyse de corrélation La corrélation mesure l’association linéaire entre deux variables continues Ce n’est pas une relation causale, il n’y a donc pas de distinction entre la variable dépendante et indépendante X2 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Utilisation de la corrélation X2 Utiliser pour estimer le degré d’association entre deux variables Ne pas utiliser si on veut prédire la valeur de X pour un Y donné et vice versa. Corrélation X1 Y Régression X Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Corrélation linéaire simple versus régression linéaire simple les calculs sont les mêmes. dans l’analyse de corrélation, X et Y doivent être échantillonnés au hasard la corrélation mesure l’association (importance) la régression vise à quantifier l’effet d’une variable sur une autre (intensité) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Exemple: longueur et poids chez l’esturgeon Les deux variables ne sont pas reliées (cause-effet), alors utiliser la corrélation afin de mesurer le degré d’association entre les deux variables. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 RDWGHT Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Régression: longueur et âge chez l’esturgeon Relation causale entre les deux. La relation entre les deux donne une estimation du taux de croissance... …et on peut se servir de cette relation afin de prédire la taille d’un esturgeon d’un âge donné. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 AGE Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Mesure de la corrélation Le coefficient de corrélation, r, entre deux variables avec n paires d’observations est calculé comme: X2 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Mesure de la corrélation X2 r = 0.9 r = -0.9 r se situe toujours entre -1 et 1. r2 est le coefficient de détermination qui mesure la proportion de la variabilité d’une variable qui peut être “expliquée” par l’autre. X2 r = 0.5 r = -0.5 X2 r = 0 r = 0 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Hypothèses implicites I: distribution binormale Pour chaque valeur de X1, les valeurs de X2 sont normalement disribuées et vice versa. r = 0.8 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Hypothèses implicites II: Homoscédasticité X2 La variance de X1 est indépendante de celle de X2 et vice versa. Mais les variances de X1 et X2 ne sont pas nécessairement égales. Homoscédastique X2 Hétéroscédastique X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Hypothèses implicites III: Linéarité X2 La relation entre X1 et X2 est linéaire. Linéaire X2 Non-linéaire X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Violation des conditions d’application: longueur et âge chez l’esturgeon La relation entre la longueur et l’âge semble non-linéaire. La variance de la longueur semble augmenter avec l’âge. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 AGE Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Si les conditions d’application ne sont pas respectées... Transformer les données (ex: log). Essayer une analyse de corrélation non-paramétrique. 1.8 1.7 1.6 LFKL 1.5 1.4 1.3 0.5 1.0 1.5 2.0 LAGE Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Intervalles de confiance pour les coefficients de corrélation X2 L’intervalle de confiance de la corrélation transformée (z) est calculée par: Convertir en unités standards par: Petit IC X2 X2 Grand IC X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Tests d’hypothèses I X2 H0: r = 0 l’erreur-type du coefficient de corrélation : calculer … et comparer à la distribution du t de Student avec N - 2 dl Rejeter H0 X2 X2 Accepter H0 Observées Attendues X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Tests d’hypothèses II X2 H0: r = r transformer r et r : calculer … et comparer à la distribution Z avec N - 3 dl. Rejeter H0 X2 X2 Accepter H0 Observées Attendues X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Comparaison de deux corrélations H0: r1 = r2 transformer r1 et r2 : calculer … et comparer à la distribution Z. Rejeter H0 r1 r2 X2 X2 Accepter H0 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Comparaisons de plusieurs corrélations X2 H0: ri = rj = rk= … avec ni, nj, nk…observations transformer tous les ri en zi et calculer … et comparer à la distribution de c2 avec dl = k -1. Rejeter H0 r1 r2 X2 X2 r3 Accepter H0 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Calcul d’une corrélation commune X2 X2 r3 Si H0: ri = rj = rk= … est acceptée, alors, chaque ri estime le même coefficient r (population). Pour calculer r, on doit dabord calculer le score Z pondéré zw: Accepter H0 X1 Ensuite, retransformer afin d’obtenir r: Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Corrélations non-paramétrques X2 Rang X2 Utiliser si une ou plusieurs des conditions d’application ne sont pas respectées. C’est une corrélation de rang. La méthode la plus commune: corrélation de rang de Spearman. X1 Rang X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
La puissance et la taille de l’effectif Si on veut tester H0: r = 0 avec une taille d’échantillon n, on peut déterminer 1 - b en utilisant la transformation Z pour les valeurs critiques (pour un a donné) pour r (za) de la vraie corrélation et r (zr) de la corrélation de l’échantillon. X2 X1 Zr Za r Z Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
La puissance et la taille de l’effectif Une fois Zb(1) déterminé, on peut calculer la probabilité d’obtenir une valeur Z de cette taille ou plus grande, c’est-à-dire b. La puissance est 1-b. X2 X1 Zr Za r Z Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
La puissance et la taille de l’effectif: exemple La corrélation entre la longueur des ailes et la longueur de la queue d’un échantillon de 12 oiseaux. alors 1 - b = .98 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Taille de l’effectif minimum Rejeter H0? X2 Pour une puissance 1 - b donnée, quelle est la taille de l’effectif requise afin de rejeter H0: r = 0 si elle est fausse avec un r0 spécifié Calculer: X2 X2 Rejecter H0? Observées Attendues X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Taille d’effectif minimum: exemple On veut rejeter H0: r = 0 99% des fois quand |r0| > 0.5 et a(2) = .05. Alors b(1) = .01 et pour r = .50, on a... Alors Alors, la taille de l’échantillon devra être supérieure ou égale à 64. Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Puissance d’une comparaison de deux corrélations Rejeter H0 La puissance d’un test de la différence entre deux coefficients de corrélation est 1- b, où b est une probabilité unilatérale: r1 r2 X2 X2 Accepter H0 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05
Exemple Quelle est la puissance de la comparaison de ces deux corrélations? On peut ensuite trouver dans un tableau de distribution normale : La puissance = 0.22 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05