Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 1 GLM Exemples
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 2 Effets du sexe et de l’âge sur les esturgeons de The Pas
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 3 Analyse Log(forklength)(LFKL) est la variable dépendante, log(age) (LAGE) est la variable indépendante continue, et sex (SEX) est la variable discontinue (2 niveaux) Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes?
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 4 Effets du sexe et de l’âge sur les esturgeons de The Pas Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) SEX LAGE SEX:LAGE Residuals Conclusion 1: la pente est la même pour les deux sexes (accepter H 03 ) p(SEX:LAGE) >.05 Q2: l’ordonnée à l’origine est-elle la même?
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 5 Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) LAGE SEX Residuals Effets du sexe et de l’âge sur les esturgeons de The Pas (modèle d’ANCOVA) Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H 02 est acceptée. p(SEX >.05), le meilleur modèle est la régression commune. Notez que CM (Résidus) a diminué ( à ). Le terme LAGE:SEX n’est donc pas utile.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 6 Coefficients: Value Std. Error t value Pr(>|t|) (Intercept) LAGE Residual standard error: on 90 degrees of freedom Multiple R-Squared: F-statistic: on 1 and 90 degrees of freedom, the p-value is 0 Effets du sexe et de l’âge sur les esturgeons de The Pas (régression commune)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 7 Effets du site et de l’âge sur la taille des esturgeons
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 8 Analyse Log(forklength)(LFKL) est la variable dépendante, log(age) (LAGE) est la variable indépendante continue, et le site la variable indépendante discontinue (2 sites) Q1: la pente de la relation de LFKL sur LAGE varie- t-elle entre les sites?
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 9 Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) LAGE LOCATE LAGE:LOCATE Effets du site et de l’âge sur la taille des esturgeons Conclusion 1: la pente et les ordonnées à l’origine varient entre les sites p(LAGE:LOCATE) et p (LOCATE) <.05 On devrait ajuster des régressions séparées pour chaque site.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 10 Same work, same pay: Are women professors treated fairly at UofO?
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 11 Salary=Sex R2=0.109, p<0.001
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 12 Age=Sex p<0.001
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 13 Salary=NMS R2=0.882
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 14 Salary=Sex+NMS+Sex*NMS R2=0.884 Dep Var: TAUX98 N: 722 Multiple R: Squared multiple R: Analysis of Variance SourceSum-of-SquaresdfMean-SquareF-ratioP SEX$ E E NMS E E SEX$*NMS E E Error E E+07
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 15 Salary=Sex+NMS+Sex*NMS R2=0.884
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 16 Salary=NMS+Department R2=0.924
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 17 Salary=NMS+dept+sex+nms*dept+sex* dpt R2=0.926 Dep Var: TAUX98 N: 722 Multiple R: Squared multiple R: Analysis of Variance SourceSum-of-SquaresdfMean-SquareF-ratioP NMS E E SORG$ E E SEX$ E E SORG$*NMS E E SEX$*NMS E E Error E E+07
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 18 R 2 total et partiel Le R 2 total (R 2 YB ) est la proportion de la variance de Y expliquée par toutes les variables indépendantes formant l ’ensemble B Le R 2 partiel (R 2 YA,B - R 2 YA ) est la proportion de la variance expliquée par l ’ensemble B lorsque l’effet des autres facteurs est enlevé. Proportion de la variance expliquée par A et B (R 2 YA,B ) Proportion de la variance expliquée par A (R 2 YA )(R 2 total de A) Proportion de la variance expliquée par B mais pas par A (R 2 YA,B - R 2 YA ) (R 2 partiel de B)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 19 Le R 2 total (R 2 YB ) pour l’ensemble B est égal au R 2 partiel (R 2 YA,B - R 2 YA ) si (1) le R 2 total pour l’ensemble A (R 2 YA ) est 0 ou (2) si A et B sont indépendants (et alors R 2 YA,B = R 2 YA + R 2 YB ) Proportion de la variance expliquée par B (R 2 YB )(R 2 t otal) Proportion de la variance inexpliquée par A (R 2 YA,B - R 2 YA ) (R 2 partiel) A Y B A Égal si R 2 total et partiel
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 20 Définition de la taille de l’effet en GLM La taille de l’effet, f 2 est calculée par le rapport du R 2 facteur sur 1 moins R 2 erreur. Note: R 2 facteur et R 2 erreur dépendent de l’hypothèse nulle
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 21 Définition de la taille de l’effet en GLM: Exemple 1 Un ensemble B est relié à Y, et le R 2 total (R 2 YB ) est estimé Le R 2 erreur est alors: 1- R 2 YB H 0 : R 2 YB = 0 Exemple: effet de l’âge B ={LAGE}
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 22 Définition de la taille de l’effet en GLM: Exemple 2 Cas 2: la proportion de la variance de Y dûe à B mais pas à A est déterminée (R 2 YA,B - R 2 YA ) Le R 2 erreur est alors 1- R 2 YA,B H 0 : R 2 YA,B - R 2 YA = 0 Exemple: effet de SEX$*LAGE B ={SEX$*LAGE}, A,B = {SEX$, LAGE, SEX$*LAGE}
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 23 Exemple: effet du pH et des éléments nutritifs sur le taux de croissance de l’achigan Échantillon de 35 lacs 3 niveauxde pH : acide, neutre, basique Taux de croissance estimé pour chaque lac Quelle est la probabilité de détecter un effet partiel du pH de la taille de celui mesuré pour =.05?
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 24 Taille de l ’effet f 2 pour pH =.14 1 = 2 2 = = 29 Puissance=0.453 Exemple: effet du pH et des éléments nutritifs sur le taux de croissance de l’achigan
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 25 Devoir
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 26 Biogéographie des îles Richesse spécifique augmente avec surface de l’île Richesse augmente avec proximité du continent Richesse proportionnelle à capacité de coloniser (mouches noirtes et rats sont bons colonisateurs, lézards sont de mauvais colonisateurs)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 27 Données 52 îles du Pacifique sud Surface (km2) Distance du continent (km) nsimulium, nmurid, nlizard Q: Données supportent-elles théorie de biogéographie des îles?
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 28 Generalized least squares fit by REML Model: logrichness ~ taxa + logdis + logarea + logdis * logarea + taxa * logdis + taxa * logarea + taxa * logdis * logarea Data: islandbiogeography2bis Log-restricted-likelihood: Coefficients: (Intercept) taxa1 taxa2 logdis logarea logdis:logarea taxa1logdis taxa2logdis taxa1logarea taxa2logarea logdis:logareataxa1 logdis:logareataxa Degrees of freedom: 156 total; 144 residual Residual standard error: Analysis of Variance Table Denom. DF: 144 numDF F-value p-value (Intercept) <.0001 taxa <.0001 logdis <.0001 logarea <.0001 logdis:logarea <.0001 taxa:logdis taxa:logarea taxa:logdis:logarea
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 29
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 30
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 31
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 32
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 33 Generalized least squares fit by REML Model: logrichness ~ taxa + logdis + logarea + logdis * logarea + taxa * logdis Data: islandbiogeography2bis Log-restricted-likelihood: Coefficients: (Intercept) taxa1 taxa2 logdis logarea logdis:logarea taxa1logdis taxa2logdis Degrees of freedom: 156 total; 148 residual Residual standard error: Analysis of Variance Table Denom. DF: 148 numDF F-value p-value (Intercept) <.0001 taxa <.0001 logdis <.0001 logarea <.0001 logdis:logarea <.0001 taxa:logdis
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 34 VariableModel for simulModel for muridModel for lizard Intercept Logarea Logdis Logarea:logdis