Corrélation Principe fondamental d’une analyse de corrélation

Slides:



Advertisements
Présentations similaires
Introduction à l’analyse
Advertisements

Introduction aux statistiques Intervalles de confiance
Comparaison d’une moyenne observée à une moyenne théorique
Corrélation Position du problème Définition covariance (X,Y) r =
Test statistique : principe
Les tests d’hypothèses (II)
Les tests d’hypothèses (I)
La régression logistique: fondements et conditions d’application
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Tests non paramétriques
Tests de comparaison de pourcentages
Les tests d’hypothèses
Estimation de la survie comparaison des courbes de survie FRT C3.
Régression -corrélation
Analyse de la variance à un facteur
1 Analyse de la variance multivariée Michel Tenenhaus.
Méthodes de Biostatistique

L’inférence statistique
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Paul-Marie Bernard Université Laval
L’Analyse de Covariance
Corrélation et régression linéaire simple
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
Modeles Lineaires.
La corrélation et la régression multiple
La corrélation et la régression
Le test t.
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les modèles linéaires (Generalized Linear Models, GLM)
Analyse de variance à un critère de classification (ANOVA)
Comparaison de deux échantillons
ANOVA à critères multiples
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
ANOVA à critères multiples
Notre calendrier français MARS 2014
LES ERREURS DE PRÉVISION e t = X t - P t X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6…X1X2X3X4 X5 X6… P5P6P5P6P5P6P5P6 e5e6e5e6e5e6e5e6.
La régression multiple
ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES
1 - Programme de Seconde (juin 2009) Statistique et probabilités
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Rappels de statistiques descriptives
Régression linéaire simple
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
Concepts fondamentaux: statistiques et distributions
BIO 4518: Biostatistiques appliquées Le 25 octobre 2005 Laboratoire 6 Corrélation linéaire et régression linéaire simple.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
Tests d’ajustement à une distribution théorique
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :51 1 Messages 1er décembre: date limite pour.
L’erreur standard et les principes fondamentaux du test de t
Analyse de variance à un critère de classification (ANOVA)
Révision des concepts fondamentaux
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
Quelques commentaires sur les tests statistiques
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :36 1 Tableaux de contingence et modèles log-
Analyse de variance à un critère de classification (ANOVA)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 1 GLM Exemples.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Comparaison de deux échantillons Principes.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :37 1 Régression linéaire simple et corrélation.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :46 1 Devoir 3 (aa) on vous demande de déterminer.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 13/08/2015 6:59 PM Bootstrap et permutations.
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Introduction aux statistiques Intervalles de confiance
Transcription de la présentation:

Corrélation Principe fondamental d’une analyse de corrélation Mesure de la force d’une corrélation Conditions d’application Tests d’hypothèses et intervalles de confiance Comparaisons de corrélations Corrélations non-paramétriques La puissance d’une analyse de corrélation Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Principe fondamental d’une analyse de corrélation La corrélation mesure l’association linéaire entre deux variables continues Ce n’est pas une relation causale, il n’y a donc pas de distinction entre la variable dépendante et indépendante X2 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Utilisation de la corrélation X2 Utiliser pour estimer le degré d’association entre deux variables Ne pas utiliser si on veut prédire la valeur de X pour un Y donné et vice versa. Corrélation X1 Y Régression X Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Corrélation linéaire simple versus régression linéaire simple les calculs sont les mêmes. dans l’analyse de corrélation, X et Y doivent être échantillonnés au hasard la corrélation mesure l’association (importance) la régression vise à quantifier l’effet d’une variable sur une autre (intensité) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Exemple: longueur et poids chez l’esturgeon Les deux variables ne sont pas reliées (cause-effet), alors utiliser la corrélation afin de mesurer le degré d’association entre les deux variables. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 RDWGHT Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Régression: longueur et âge chez l’esturgeon Relation causale entre les deux. La relation entre les deux donne une estimation du taux de croissance... …et on peut se servir de cette relation afin de prédire la taille d’un esturgeon d’un âge donné. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 AGE Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Mesure de la corrélation Le coefficient de corrélation, r, entre deux variables avec n paires d’observations est calculé comme: X2 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Mesure de la corrélation X2 r = 0.9 r = -0.9 r se situe toujours entre -1 et 1. r2 est le coefficient de détermination qui mesure la proportion de la variabilité d’une variable qui peut être “expliquée” par l’autre. X2 r = 0.5 r = -0.5 X2 r = 0 r = 0 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Hypothèses implicites I: distribution binormale Pour chaque valeur de X1, les valeurs de X2 sont normalement disribuées et vice versa. r = 0.8 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Hypothèses implicites II: Homoscédasticité X2 La variance de X1 est indépendante de celle de X2 et vice versa. Mais les variances de X1 et X2 ne sont pas nécessairement égales. Homoscédastique X2 Hétéroscédastique X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Hypothèses implicites III: Linéarité X2 La relation entre X1 et X2 est linéaire. Linéaire X2 Non-linéaire X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Violation des conditions d’application: longueur et âge chez l’esturgeon La relation entre la longueur et l’âge semble non-linéaire. La variance de la longueur semble augmenter avec l’âge. 60 50 FKLNGTH 40 30 20 10 20 30 40 50 AGE Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Si les conditions d’application ne sont pas respectées... Transformer les données (ex: log). Essayer une analyse de corrélation non-paramétrique. 1.8 1.7 1.6 LFKL 1.5 1.4 1.3 0.5 1.0 1.5 2.0 LAGE Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Intervalles de confiance pour les coefficients de corrélation X2 L’intervalle de confiance de la corrélation transformée (z) est calculée par: Convertir en unités standards par: Petit IC X2 X2 Grand IC X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Tests d’hypothèses I X2 H0: r = 0 l’erreur-type du coefficient de corrélation : calculer … et comparer à la distribution du t de Student avec N - 2 dl Rejeter H0 X2 X2 Accepter H0 Observées Attendues X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Tests d’hypothèses II X2 H0: r = r transformer r et r : calculer … et comparer à la distribution Z avec N - 3 dl. Rejeter H0 X2 X2 Accepter H0 Observées Attendues X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Comparaison de deux corrélations H0: r1 = r2 transformer r1 et r2 : calculer … et comparer à la distribution Z. Rejeter H0 r1 r2 X2 X2 Accepter H0 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Comparaisons de plusieurs corrélations X2 H0: ri = rj = rk= … avec ni, nj, nk…observations transformer tous les ri en zi et calculer … et comparer à la distribution de c2 avec dl = k -1. Rejeter H0 r1 r2 X2 X2 r3 Accepter H0 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Calcul d’une corrélation commune X2 X2 r3 Si H0: ri = rj = rk= … est acceptée, alors, chaque ri estime le même coefficient r (population). Pour calculer r, on doit dabord calculer le score Z pondéré zw: Accepter H0 X1 Ensuite, retransformer afin d’obtenir r: Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Corrélations non-paramétrques X2 Rang X2 Utiliser si une ou plusieurs des conditions d’application ne sont pas respectées. C’est une corrélation de rang. La méthode la plus commune: corrélation de rang de Spearman. X1 Rang X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

La puissance et la taille de l’effectif Si on veut tester H0: r = 0 avec une taille d’échantillon n, on peut déterminer 1 - b en utilisant la transformation Z pour les valeurs critiques (pour un a donné) pour r (za) de la vraie corrélation et r (zr) de la corrélation de l’échantillon. X2 X1 Zr Za r Z Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

La puissance et la taille de l’effectif Une fois Zb(1) déterminé, on peut calculer la probabilité d’obtenir une valeur Z de cette taille ou plus grande, c’est-à-dire b. La puissance est 1-b. X2 X1 Zr Za r Z Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

La puissance et la taille de l’effectif: exemple La corrélation entre la longueur des ailes et la longueur de la queue d’un échantillon de 12 oiseaux. alors 1 - b = .98 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Taille de l’effectif minimum Rejeter H0? X2 Pour une puissance 1 - b donnée, quelle est la taille de l’effectif requise afin de rejeter H0: r = 0 si elle est fausse avec un r0 spécifié Calculer: X2 X2 Rejecter H0? Observées Attendues X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Taille d’effectif minimum: exemple On veut rejeter H0: r = 0 99% des fois quand |r0| > 0.5 et a(2) = .05. Alors b(1) = .01 et pour r = .50, on a... Alors Alors, la taille de l’échantillon devra être supérieure ou égale à 64. Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Puissance d’une comparaison de deux corrélations Rejeter H0 La puissance d’un test de la différence entre deux coefficients de corrélation est 1- b, où b est une probabilité unilatérale: r1 r2 X2 X2 Accepter H0 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05

Exemple Quelle est la puissance de la comparaison de ces deux corrélations? On peut ensuite trouver dans un tableau de distribution normale : La puissance = 0.22 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2017-04-01 07:05