Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-20 06:15 1 GLM Exemples.

Slides:



Advertisements
Présentations similaires
C1 Bio-statistiques F. KOHLER
Advertisements

Statistiques descriptives Répartition des communes par département Côtes dArmor Finistère Ile et Vilaine Morbihan Répartition de la population par département.
Analyse de la variance à un facteur
Chapitre 2 Les indices.
La Régression Multiple
NOTION DE METAPOPULATION
L’Analyse de Covariance
La corrélation et la régression multiple
La corrélation et la régression
La puissance statistique
La puissance statistique
La régression logistique
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les modèles linéaires (Generalized Linear Models, GLM)
Analyse de variance à un critère de classification (ANOVA)
Corrélation Principe fondamental d’une analyse de corrélation
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :08 1 Régression multiple Quand et pourquoi on.
Comparaison de deux échantillons
ANOVA à critères multiples
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
ANOVA à critères multiples
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
La régression multiple
Méthodes de Biostatistique
Séance 8 30 novembre 2005 N. Yamaguchi
Statistique Cours #4 Régression linéaire simple et multiple
Probabilités et Statistiques Année 2010/2011
Régression linéaire simple
Un exemple d’ANOVA Pour étudier l'influence du milieu sur la DL50 de daphnies (heure), on a mesuré cette durée de vie pour deux clones de daphnies en fonction.
Régression linéaire Jonathan Lenoir (MCU),
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
Un exemple de régression poissoniènne
On souhaite analyser les concentrations de mercure (ppm) dans les chaires de poissons carnivores des lacs de l'est de Etats- Unis. On espère trouver une.
Régréssion linéaire simple
Concepts fondamentaux: statistiques et distributions
1 BIO 4518: Biostatistiques appliquées Le 1er novembre 2005 Laboratoire 7 ANCOVAs (Analyse de covariance)
BIO 4518: Biostatistiques appliquées Les 11 et 18 octobre 2005 Laboratoire 4 et 5 ANOVA à critères multiples.
BIO 4518: Biostatistiques appliquées Le 25 octobre 2005 Laboratoire 6 Corrélation linéaire et régression linéaire simple.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
Tests d’ajustement à une distribution théorique
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :51 1 Messages 1er décembre: date limite pour.
L’erreur standard et les principes fondamentaux du test de t
Analyse de variance à un critère de classification (ANOVA)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :05 Asymétrie fluctuante.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :44 1 Epistémologie, méthode scientifique et.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :57 1.
Révision des concepts fondamentaux
ETUDE DE 2 VARIABLES QUANTITATIVES
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :46 1 Régression logistique.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :18 Bootstrap et permutations.
Quelques commentaires sur les tests statistiques
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :36 1 Tableaux de contingence et modèles log-
Analyse de variance à un critère de classification (ANOVA)
PROGRAMMATION SCIENTIFIQUE EN C PRO Approximation de fonctions et régression u Introduction –Analyse de la corrélation –Régression et méthode des.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Comparaison de deux échantillons Principes.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :37 1 Régression linéaire simple et corrélation.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :46 1 Devoir 3 (aa) on vous demande de déterminer.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :26 1 Régression multiple Quand et pourquoi on.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 24/07/2015 2:29 PM Bootstrap et permutations.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :26 1 Programme Devoir 1 Proposition travail.
University of Ottawa - Bio 4118 – Applied Biostatistics © Antoine Morin and Scott Findlay 13/08/2015 6:59 PM Bootstrap et permutations.
Analyse des données. Plan Lien entre les statistiques et l’analyse des données Propagation des erreurs Ajustement de fonctions.
BIO 4518: Biostatistiques appliquées Le 8 novembre 2005 Laboratoire 8 Regressions multiples.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
E CONOMÉTRIE A PPLIQUÉE AVEC R (P ART 03) R. Aloui 2015/2016 Disponible sur
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Les modèles linéaires (Generalized Linear Models, GLM)
Transcription de la présentation:

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 1 GLM Exemples

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 2 Effets du sexe et de l’âge sur les esturgeons de The Pas

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 3 Analyse Log(forklength)(LFKL) est la variable dépendante, log(age) (LAGE) est la variable indépendante continue, et sex (SEX) est la variable discontinue (2 niveaux) Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes?

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 4 Effets du sexe et de l’âge sur les esturgeons de The Pas Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) SEX LAGE SEX:LAGE Residuals Conclusion 1: la pente est la même pour les deux sexes (accepter H 03 ) p(SEX:LAGE) >.05 Q2: l’ordonnée à l’origine est-elle la même?

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 5 Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) LAGE SEX Residuals Effets du sexe et de l’âge sur les esturgeons de The Pas (modèle d’ANCOVA) Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H 02 est acceptée. p(SEX >.05), le meilleur modèle est la régression commune. Notez que CM (Résidus) a diminué ( à ). Le terme LAGE:SEX n’est donc pas utile.

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 6 Coefficients: Value Std. Error t value Pr(>|t|) (Intercept) LAGE Residual standard error: on 90 degrees of freedom Multiple R-Squared: F-statistic: on 1 and 90 degrees of freedom, the p-value is 0 Effets du sexe et de l’âge sur les esturgeons de The Pas (régression commune)

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 7 Effets du site et de l’âge sur la taille des esturgeons

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 8 Analyse Log(forklength)(LFKL) est la variable dépendante, log(age) (LAGE) est la variable indépendante continue, et le site la variable indépendante discontinue (2 sites) Q1: la pente de la relation de LFKL sur LAGE varie- t-elle entre les sites?

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 9 Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) LAGE LOCATE LAGE:LOCATE Effets du site et de l’âge sur la taille des esturgeons Conclusion 1: la pente et les ordonnées à l’origine varient entre les sites p(LAGE:LOCATE) et p (LOCATE) <.05 On devrait ajuster des régressions séparées pour chaque site.

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 10 Same work, same pay: Are women professors treated fairly at UofO?

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 11 Salary=Sex R2=0.109, p<0.001

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 12 Age=Sex p<0.001

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 13 Salary=NMS R2=0.882

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 14 Salary=Sex+NMS+Sex*NMS R2=0.884 Dep Var: TAUX98 N: 722 Multiple R: Squared multiple R: Analysis of Variance SourceSum-of-SquaresdfMean-SquareF-ratioP SEX$ E E NMS E E SEX$*NMS E E Error E E+07

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 15 Salary=Sex+NMS+Sex*NMS R2=0.884

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 16 Salary=NMS+Department R2=0.924

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 17 Salary=NMS+dept+sex+nms*dept+sex* dpt R2=0.926 Dep Var: TAUX98 N: 722 Multiple R: Squared multiple R: Analysis of Variance SourceSum-of-SquaresdfMean-SquareF-ratioP NMS E E SORG$ E E SEX$ E E SORG$*NMS E E SEX$*NMS E E Error E E+07

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 18 R 2 total et partiel Le R 2 total (R 2 YB ) est la proportion de la variance de Y expliquée par toutes les variables indépendantes formant l ’ensemble B Le R 2 partiel (R 2 YA,B - R 2 YA ) est la proportion de la variance expliquée par l ’ensemble B lorsque l’effet des autres facteurs est enlevé. Proportion de la variance expliquée par A et B (R 2 YA,B ) Proportion de la variance expliquée par A (R 2 YA )(R 2 total de A) Proportion de la variance expliquée par B mais pas par A (R 2 YA,B - R 2 YA ) (R 2 partiel de B)

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 19 Le R 2 total (R 2 YB ) pour l’ensemble B est égal au R 2 partiel (R 2 YA,B - R 2 YA ) si (1) le R 2 total pour l’ensemble A (R 2 YA ) est 0 ou (2) si A et B sont indépendants (et alors R 2 YA,B = R 2 YA + R 2 YB ) Proportion de la variance expliquée par B (R 2 YB )(R 2 t otal) Proportion de la variance inexpliquée par A (R 2 YA,B - R 2 YA ) (R 2 partiel) A Y B A Égal si R 2 total et partiel

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 20 Définition de la taille de l’effet en GLM La taille de l’effet, f 2 est calculée par le rapport du R 2 facteur sur 1 moins R 2 erreur. Note: R 2 facteur et R 2 erreur dépendent de l’hypothèse nulle

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 21 Définition de la taille de l’effet en GLM: Exemple 1 Un ensemble B est relié à Y, et le R 2 total (R 2 YB ) est estimé Le R 2 erreur est alors: 1- R 2 YB H 0 : R 2 YB = 0 Exemple: effet de l’âge B ={LAGE}

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 22 Définition de la taille de l’effet en GLM: Exemple 2 Cas 2: la proportion de la variance de Y dûe à B mais pas à A est déterminée (R 2 YA,B - R 2 YA ) Le R 2 erreur est alors 1- R 2 YA,B H 0 : R 2 YA,B - R 2 YA = 0 Exemple: effet de SEX$*LAGE B ={SEX$*LAGE}, A,B = {SEX$, LAGE, SEX$*LAGE}

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 23 Exemple: effet du pH et des éléments nutritifs sur le taux de croissance de l’achigan Échantillon de 35 lacs 3 niveauxde pH : acide, neutre, basique Taux de croissance estimé pour chaque lac Quelle est la probabilité de détecter un effet partiel du pH de la taille de celui mesuré pour  =.05?

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 24 Taille de l ’effet f 2 pour pH =.14 1 = 2  2 = = 29 Puissance=0.453 Exemple: effet du pH et des éléments nutritifs sur le taux de croissance de l’achigan

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 25 Devoir

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 26 Biogéographie des îles Richesse spécifique augmente avec surface de l’île Richesse augmente avec proximité du continent Richesse proportionnelle à capacité de coloniser (mouches noirtes et rats sont bons colonisateurs, lézards sont de mauvais colonisateurs)

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 27 Données 52 îles du Pacifique sud Surface (km2) Distance du continent (km) nsimulium, nmurid, nlizard Q: Données supportent-elles théorie de biogéographie des îles?

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 28 Generalized least squares fit by REML Model: logrichness ~ taxa + logdis + logarea + logdis * logarea + taxa * logdis + taxa * logarea + taxa * logdis * logarea Data: islandbiogeography2bis Log-restricted-likelihood: Coefficients: (Intercept) taxa1 taxa2 logdis logarea logdis:logarea taxa1logdis taxa2logdis taxa1logarea taxa2logarea logdis:logareataxa1 logdis:logareataxa Degrees of freedom: 156 total; 144 residual Residual standard error: Analysis of Variance Table Denom. DF: 144 numDF F-value p-value (Intercept) <.0001 taxa <.0001 logdis <.0001 logarea <.0001 logdis:logarea <.0001 taxa:logdis taxa:logarea taxa:logdis:logarea

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 29

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 30

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 31

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 32

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 33 Generalized least squares fit by REML Model: logrichness ~ taxa + logdis + logarea + logdis * logarea + taxa * logdis Data: islandbiogeography2bis Log-restricted-likelihood: Coefficients: (Intercept) taxa1 taxa2 logdis logarea logdis:logarea taxa1logdis taxa2logdis Degrees of freedom: 156 total; 148 residual Residual standard error: Analysis of Variance Table Denom. DF: 148 numDF F-value p-value (Intercept) <.0001 taxa <.0001 logdis <.0001 logarea <.0001 logdis:logarea <.0001 taxa:logdis

Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 34 VariableModel for simulModel for muridModel for lizard Intercept Logarea Logdis Logarea:logdis