L’Analyse de Covariance

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
La régression logistique: fondements et conditions d’application
Inférence statistique
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Inférence statistique
Comparaison de plusieurs moyennes observées
Régression ou corrélation
Régression -corrélation
Laboratoire Inter-universitaire de Psychologie
Analyse de la variance à un facteur
Vérification des données
Chapitre 2 Les indices.

La Régression Multiple
Analyse de la variance : ANOVA à un facteur
Régression linéaire simple
Corrélation et régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
Analyse de la covariance
Toutes les variables étaient mesurées au niveau intervalle et sans erreur Toutes les variables étaient mesurées au niveau intervalle et sans erreur ->
La corrélation et la régression multiple
La corrélation et la régression
Le test t.
Lanalyse de la covariance. X y ANOVA Lanalyse de la covariance y X ANOVA.
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Analyse de variance à un critère de classification (ANOVA)
Corrélation Principe fondamental d’une analyse de corrélation
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :08 1 Régression multiple Quand et pourquoi on.
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
ANOVA à critères multiples
Le comportement des coûts Chapitre 3
Analyse factorielle de variance: Principes d’expérimentation
La régression multiple
Régression linéaire multiple : hypothèses & interprétation
Régression linéaire multiple : hypothèses & tests. Partie 3.
Méthodes de Biostatistique
La régression simple Michel Tenenhaus
Séance 8 30 novembre 2005 N. Yamaguchi
Probabilités et Statistiques Année 2010/2011
Un exemple d’ANOVA Pour étudier l'influence du milieu sur la DL50 de daphnies (heure), on a mesuré cette durée de vie pour deux clones de daphnies en fonction.
Régression linéaire Jonathan Lenoir (MCU),
On souhaite analyser les concentrations de mercure (ppm) dans les chaires de poissons carnivores des lacs de l'est de Etats- Unis. On espère trouver une.
1 BIO 4518: Biostatistiques appliquées Le 1er novembre 2005 Laboratoire 7 ANCOVAs (Analyse de covariance)
BIO 4518: Biostatistiques appliquées Les 11 et 18 octobre 2005 Laboratoire 4 et 5 ANOVA à critères multiples.
BIO 4518: Biostatistiques appliquées Le 25 octobre 2005 Laboratoire 6 Corrélation linéaire et régression linéaire simple.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Analyse de variance à un critère de classification (ANOVA)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :57 1.
ETUDE DE 2 VARIABLES QUANTITATIVES
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :36 1 Tableaux de contingence et modèles log-
Modèle linéaire Relation entre une variable expliquée Y (par exemple le salaire), et p variables explicatives X j, j = 1, …, p (par exemple, p = 5, X 1.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 1 GLM Exemples.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Comparaison de deux échantillons Principes.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :26 1 Régression multiple Quand et pourquoi on.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 13/08/2015 6:59 PM Bootstrap et permutations.
Régression linéaire (STT-2400)
BIO 4518: Biostatistiques appliquées Le 8 novembre 2005 Laboratoire 8 Regressions multiples.
MENU 1 Hypothèses du modèle linéaire YO = YT + e 2 blocs d’hypothèses -Sur les relations entre les variables -Sur le comportement de la variable aléatoire.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
Comparaison de plusieurs moyennes observées
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
Corrélation et régression linéaire Mars Modèles de régression  Réponses aux questions du type: ‘Quelle est la nature de la relation entre les variables?’
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Les modèles linéaires (Generalized Linear Models, GLM)
Transcription de la présentation:

L’Analyse de Covariance Modèle complet Le modèle d’ANCOVA Le modèle de la régression commune

Modèles linéaires simples L’Analyse de Covariance Modèles linéaires simples

Utilisation de l’ANCOVA L’Analyse de Covariance Utilisation de l’ANCOVA Taille Masse Afin de comparer une relation entre une variable dépendante (Y) et une variable indépendante (X1) pour différents niveaux d’une variable discrète (X2) ex: la relation entre le poids (Y) et la taille (X1) pour différents groupes taxonomiques (oiseaux et mammifères, X2)

Utilisation de l’ANCOVA L’Analyse de Covariance Utilisation de l’ANCOVA X1 Y Modèles qualitativement différents similaires Lorsque l’on fait ces comparaisons, on suppose que les modèles sont qualitativement similaires pour tous les niveaux de la variable discrète... …autrement ce serait comme comparer des pommes et des oranges!

Le modèle de la régression simple L’Analyse de Covariance Le modèle de la régression simple Le modèle de la régression: toutes les régressions simples sont décrites par 2 paramètres: l’ordonnée à l’origine (a) et la pente (b) X DX DY b = DY/DX (pente) a (ordonnée à l’origine) ei Xi Yi Observées Prédites

L’Analyse de Covariance a & b diffèrent même a, différents b X1 X1 Y Y a diffèrent même b même a, même b X1 X1

L’Analyse de Covariance Ajustement au modèle Commencer par un modèle d’ordre supérieur en incluant le plus de termes possible. Ajuster un modèle réduit Tester la signification du terme exclus Modèle d’ordre supérieur réduit F Terme exclus (p > .05) Terme inclus (p < .05)

L’Analyse de Covariance Le modèle complet Niveau 1 de la variable X2 Niveau 2 de la variable X2 m Le modèle complet bi est la pente de la régression de Y sur X1 estimée pour le niveau i de la variable discrète X2 ai est la différence entre les moyennes de la variable discrète X2 pour chaque niveau i et la moyenne générale.

L’Analyse de Covariance Le modèle complet Niveau 1 de la variable X2 Niveau 2 de la variable X2 m hypothèses nulles Pour le modèle complet contenant 2 variables indépendantes, on a 3 hypothèses nulles:

L’Analyse de Covariance Le modèle complet Y Y Y

Conditions d’application L’Analyse de Covariance Le modèle complet Conditions d’application Les résidus sont indépendants et distribués normalement La variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discontinue (homoscedasticité) pas d’erreur sur les variables indépendantes

L’Analyse de Covariance Le modèle complet Niveau 1 de la variable X2 Niveau 2 de la variable X2 X1 Y ANCOVA Régressions séparées H02 acceptée H02 rejetéee Ajuster le modèle complet, tester la différence entre les pentes Si H02 est rejetée, faire des régressions séparées pour chaque niveau de la variable catégorique Si H02 est acceptée, ajuster le modèle d’ ANCOVA.

L’Analyse de Covariance Le modèle complet Mâles Exemple age, sexe et longueur de l’esturgeon Femelles Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes?

Q2: l’ordonnée à l’origine est-elle la même? L’Analyse de Covariance Le modèle complet Exemple Dep Var: LFKL N: 92 Multiple R: 0.835 Squared multiple R: 0.697 Analysis of Variance Source Sum-of-Squares df Mean-Square F-ratio P LAGE 0.143 1 0.143 176.650 0.000 SEX$ 0.000 1 0.000 0.504 0.479 SEX$*LAGE 0.000 1 0.000 0.337 0.563 Error 0.071 88 0.001 Conclusion 1: la pente est la même pour les deux sexes (accepter H02 ) p(SEX$*LAGE) > 0.05 Q2: l’ordonnée à l’origine est-elle la même?

Décomposition de la variation L’Analyse de Covariance Le modèle complet Décomposition de la variation (n-2) (différence des ordonnées à l’origine) Interaction A et B (non parallélisme des droites) Résidus autour des droites Totale (n-1) 1 Effet facteur B/A (var continue A) Hors régression Sources de variation Modèle linéaire simple SCE ddl (p-1) (n-2p)

L’Analyse de Covariance Le modèle additif m Le modèle: b est la pente de la régression de Y sur X1 regroupée pour tous les niveaux de la variable catégorique X2. ai est la différence entre la moyenne pour chaque niveau i et la moyenne générale

L’Analyse de Covariance Le modèle additif Niveau 1 de la variable X2 Niveau 2 de la variable X2 m hypothèses nulles Pour une ANCOVA avec 2 variables indépendantes, deux hypothèses nulles:

L’Analyse de Covariance Le modèle additif Y Y Y

Conditions d’application du modèle additif L’Analyse de Covariance Le modèle additif Conditions d’application du modèle additif les résidus sont indépendants et distribués normalement la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité) les pentes des régressions de Y sur X sont les mêmes pour tous les niveaux de la variable catégorique (ce n’est pas une condition d’application du modèle complet!!)

L’Analyse de Covariance Le modèle additif Niveau 1 de la variable X2 Niveau 2 de la variable X2 X1 Y Régression commune Régressions séparées H01 acceptée H01 rejetée Procédure Ajuster le modèle d’ANCOVA, tester: Si H01 est rejetée, séparer les régressions pour chaque niveau de la variable discontinue Si H01 est acceptée, ajuster une régression commune.

L’Analyse de Covariance Le modèle additif Exemple LAGE 0.143 1 0.143 178.163 0.000 Dep Var: LFKL N: 92 Multiple R: 0.834 Squared multiple R: 0.696 Analysis of Variance Source Sum-of-Squares df Mean-Square F-ratio P SEX$ 0.001 1 0.001 1.851 0.177 Error 0.072 89 0.001 Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H01 est acceptée. p(SEX$ > .05), le meilleur modèle est la régression commune. la réduction du R2 est négligeable (.697 to .696).

Le modèle à droites confondues L’Analyse de Covariance Le modèle à droites confondues Niveau 1 de la variable X2 Niveau 2 de la variable X2 a m Le modèle: b est la pente de la régression de Y sur X1 , regroupée pour tous les niveaux de la variable discrète X2. est la moyenne groupée de X1.

Le modèle à droites confondues L’Analyse de Covariance Le modèle à droites confondues Niveau 1 de la variable X2 Niveau 2 de la variable X2 a m hypothèses nulles On a deux hypothèses nulles pour la régression commune:

Le modèle à droites confondues L’Analyse de Covariance Le modèle à droites confondues Exemple Dep Var: LFKL N: 92 Multiple R: 0.830 Squared multiple R: 0.690 Adjusted squared multiple R: 0.686 Standard error of estimate: 0.029 Effect Coefficient Std Error Std Coef Tolerance t P(2 Tail) CONSTANT 1.211 0.031 0.0 . 39.191 0.000 LAGE 0.336 0.024 0.830 1.000 14.144 0.000

Conditions d’application du modèle à droites confondues L’Analyse de Covariance Le modèle à droites confondues Conditions d’application du modèle à droites confondues Les résidus sont indépendants et distribués normalement la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discrète (homoscédasticité)

L’Analyse de Covariance Conclusion Aller du modèle complexe au modèle simple Donc choisir a priori les variables explicatives