Les modèles linéaires (Generalized Linear Models, GLM)

Slides:



Advertisements
Présentations similaires
L’Analyse de Covariance
Advertisements

Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Comparaison de deux échantillons
ANOVA à critères multiples
ANOVA à critères multiples
La régression multiple
Probabilités et Statistiques Année 2010/2011
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
On souhaite analyser les concentrations de mercure (ppm) dans les chaires de poissons carnivores des lacs de l'est de Etats- Unis. On espère trouver une.
1 BIO 4518: Biostatistiques appliquées Le 1er novembre 2005 Laboratoire 7 ANCOVAs (Analyse de covariance)
BIO 4518: Biostatistiques appliquées Les 11 et 18 octobre 2005 Laboratoire 4 et 5 ANOVA à critères multiples.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
Tests d’ajustement à une distribution théorique
L’erreur standard et les principes fondamentaux du test de t
Analyse de variance à un critère de classification (ANOVA)
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :57 1.
Test de signification d’une ANOVA à deux critères de classification: sans réplication, modèle I, plan factoriel Tester CMeffet sur CMerreur... … mais,
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :36 1 Tableaux de contingence et modèles log-
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :15 1 GLM Exemples.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Comparaison de deux échantillons Principes.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :37 1 Régression linéaire simple et corrélation.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :26 1 Régression multiple Quand et pourquoi on.
Outils Statistiques Damien Van Gysel CHU de Nice
Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)
Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
Suites ordonnées ou mettre de l’ordre
Corrélation et régression linéaire simple
Les Observations.
Analyse, Classification,Indexation des Données ACID
Comparaison de deux pourcentages.
Cours d’Econométrie de la Finance (STA202 – IV 4-5)
Les inégalités et les inéquations
Loi Normale (Laplace-Gauss)
4°) Intervalle de fluctuation :
Fonctions affines.
La Conclusion.
Projet de recherche L’homéostasie du corps humains
Plans d’experiences : plans de melanges
et discussion de l'article 2
Technologies de l’intelligence d’affaires Séance 11
Objectifs du chapitre 5: Plans corrélationnels
Technologies de l’intelligence d’affaires Séance 12
Révision et preparation à l’examen
République Algérienne Démocratique et Populaire Ministère de l'Enseignement Supérieur et de la Recherche Scientifique Université Saad.
4.3 Estimation d’une proportion
4.5 Tests D’hypothèses sur une proportion
Statistiques industrielles – Exemple d’application
4.4 Tests D’hypothèses sur une moyenne
Méthode Taguchy Analyse de la variance Anavar
Analyse de la variance et de la covariance Analyse de la variance à 1 facteur ANOVA à 2 facteurs Conditions d’utilisation.
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
 1____Probabilité  2______variables aléatoires discrètes et continues  3______loi de probabilités d’une v a  4_______les moyens et les moyens centraux.
CHAPITRE 5: Méthodes multivariables
Statistique descriptive Bivariée
2.4 La loi de vitesse d’une réaction chimique
Comment analyser en fonction du genre et du sexe?
On lance 100 fois de suite une pièce de monnaie.
La démarche scientifique
Programme d’appui à la gestion publique et aux statistiques
PROGRAMMATION SCIENTIFIQUE EN C
Utiliser le modèle log-linéaire pour mettre au jour la structure du lien entre les deux variables d’un tableau de contingence : un exemple d’application.
Les méthodes quantitatives en éducation
CHAPITRE IV : AMPLIFICATEUR DIFFERENTIEL Electronique Analogique A. Aouaj.
Tests d’hypothèses paramétriques 1 Cours Statistiques Chapitre 9.
Impact Evaluation 4 Peace March 2014, Lisbon, Portugal 1 Echantillonage pour une Evaluation d’Impact Latin America and the Caribbean’s Citizen Security.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Couche limite atmosphérique
Partie 1 Retour aux sources (Back to basics).
Transcription de la présentation:

Les modèles linéaires (Generalized Linear Models, GLM) Ce qu’ils sont Quand les utiliser? Modèle complet Le modèle d’ANCOVA Le modèle de la régression commune Le principe de la somme des carrés additionnelles Hypothèses implicites Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Définition des GLM Les GLM sont des modèles de la forme suivante: Y est un vecteur des variables dépendantes, b est un vecteur des estimés des coefficients, X est un vecteur des variables indépendantes et e représente les termes d’erreur. Modèles multivariés Régression linéaire simple Régression multiple Analyse de variance (ANOVA) Analyse de covariance (ANCOVA) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Quelques procédures GLM *peuvent être discontinues ou traitées comme discontinues Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Utilisation de l’ANCOVA Afin de comparer une relation entre une variable dépendante (Y) et une variable indépendante (X1) pour différents niveaux d’une variable discontinue (X2) ex: la relation entre le poids (Y) et la taille (X1) pour différents groupes taxonomiques (oiseaux et mammifères, X2) Taille Masse Taille Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Utilisation de l’ANCOVA Y Lorsque l’on fait ces comparaison, on assume que les modèles sont qualitativement similaires pour tous les niveaux de la variable discontinue... …autrement ce serait comme comparer des pommes et des oranges! Modèles qualitativement similaires Y Modèles qualitativement différents Niveau 1 de X2 Niveau 2 de X2 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Utilisation de l’ANCOVA Y ANCOVA est utilisée afin de comparer des modèles linéaires. …certains modèles non-linéaires peuvent être comparés avec des ANCOVA modifiées Modèles linéaires X1 Y Modèles non-linéaires Niveau 1 de X2 Niveau 2 de X2 X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Le modèle de la régression simple alors, toutes les régressions simples sont décrites par 2 paramètres: l’ordonnée à l’origine (a) et la pente (b) ei Yi DY a (ordonnée à l’origine) X DX Xi b = DY/DX (pente) Observées Prédites Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

GLM simples Deux modèles linéaires peuvent varier de plusieurs façons: Les ordonnées à l’origine (a) et les pentes (b) sont différentes Les ordonnées à l’origine sont différents mais les pentes sont les mêmes (modèle d’ANCOVA) Y a & b diffèrent X1 Y a diffèrent même b X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

GLM simples Deux modèles linéaires peuvent aussi être différents: mêmes ordonnée à l’origine (a) mais les pentes (b) sont différentes mêmes pentes et mêmes ordonnées à l’origine (modéle de la régression commune) Y Mêmes a, différents b X1 Y Mêmes a, mêmes b X1 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Ajustement des GLM L’analyse se fait par étape en commençant avec le modéle le plus complexe Déterminer la signification de chaque terme en ajustant deux modèles: un contenant le terme et l’autre qui l’exclut Tester les changements dans l’ajustement (D G ou F) associés à l’exclusion du terme en question. Modèle A (terme inclus) D G ou F (ex: D RMS) Modèle B (terme enlevé) Inclure le terme (grand D) Enlever le terme (petit D) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Ajustement au modèle: détermination de la signification des termes du modèle Commencer par un modèle d’ordre supérieur (mos) en incluant le plus de termes possible. Noter SCrésidus et CMrésidus Ajuster un modèle réduit (mr) et noter SCrésidus Tester la signification du terme exclus en calculant: Modèle d’ordre supérieur F Modèle réduit Terme inclus (p < .05) Terme exclus (p > .05) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Modèle complet avec 2 variables indépendantes Le modèle complet bi est la pente de la régression de Y sur X1 estimée pour le niveau i de la variable catégorique X2 ai est la différence entre les moyennes de la variable catégorique X2 pour chaque niveau i et la moyenne générale. m Niveau 1 de la variable X2 Niveau 2 de la variable X2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Le modèle complet: hypothèses nulles Pour le modèle complet contenant 2 variables indépendantes, on note 3 hypothèses nulles: m Niveau 1 de la variable X2 Niveau 2 de la variable X2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Y Y Y Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Conditions d’application Les résidus sont indépendants et distribués normalement La variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discontinue (homoscedasticité) pas d’erreur sur les variables indépendantes linéarité Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Procédure Y Ajuster le modèle complet, tester pour la différence entre les pentes Si H02 est rejetée, faire des régressions séparées pour chaque niveau de la variable catégorique Si H02 est acceptée, ajuster le modèle d’ ANCOVA. X1 H02 acceptée H02 rejetéee ANCOVA Régressions séparées Niveau 1 de la variable X2 Niveau 2 de la variable X2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Le modèle d’ANCOVA avec 2 variables indépendantes Le modèle complet: b est la pente de la régression de Y sur X1 regroupée pour tous les niveaux de la variable catégorique X2. ai est la différence entre la moyenne pour chaque niveau i et la moyenne générale m Niveau 1 de la variable X2 Niveau 2 de la variable X2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Le modèle d’ANCOVA: hypothèses nulles Pour une ANCOVA avec 2 variables indépendantes, on note deux hypothèses nulles: Niveau 1 de la variable X2 Niveau 2 de la variable X2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Y Y Y Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Conditions d’application du modèle d’ANCOVA les résidus sont indépendants et distribués normalement la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité) pas d’erreur sur les variables indépendantes linéarité les pentes des régressions de Y sur X sont les mêmes pour tous les niveaux de la variable catégorique (ce n’est pas une condition d’application du modèle complet!!) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Procédure Y Ajuster le modèle d’ANCOVA, tester pour les différences entre les pentes. Si H01 est rejetée, séparer les régressions pour chaque niveau de la variable discontinue Si H01 est acceptée, ajuster une régression commune. X1 H01 acceptée H01 rejetée Régression commune Régressions séparées Niveau 1 de la variable X2 Niveau 2 de la variable X2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Le modèle de la régression commune avec 2 variables indépendantes b est la pente de la régression de Y sur X1 , regroupée pour tous les niveaux de la variable catégorique X2. est la moyenne regroupée de X1. a Niveau 1 de la variable X2 Niveau 2 de la variable X2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

La régression commune: hypothèses nulles On a deux hypothèses nulles pour la régression commune: a Niveau 1 de la variable X2 Niveau 2 de la variable X2 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Conditions d’application de la régression commune Les résidus sont indépendants et distribués normalement la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité) pas d’erreur sur les variables indépendantes linéarité Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effets du sexe et de l’âge sur les esturgeons de The Pas Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Analyse Log(forklength)(LFKL) est la variable dépendante, log(age) (LAGE) est la variable indépendante continue, et sex (SEX) est la variable discontinue (2 niveaux) Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes? Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effets du sexe et de l’âge sur les esturgeons de The Pas Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) SEX 1 0.0004089 0.0004089 0.5043 0.4794836 LAGE 1 0.1432274 0.1432274 176.6501 0.0000000 SEX:LAGE 1 0.0002730 0.0002730 0.3367 0.5632277 Residuals 88 0.0713501 0.0008108 Conclusion 1: la pente est la même pour les deux sexes (accepter H03 ) p(SEX:LAGE) > .05 Q2: l’ordonnée à l’origine est-elle la même? Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effets du sexe et de l’âge sur les esturgeons de The Pas (modèle d’ANCOVA) Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) LAGE 1 0.1433772 0.1433772 178.1627 0.0000000 SEX 1 0.0014899 0.0014899 1.8513 0.1770653 Residuals 89 0.0716231 0.0008048 Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H02 est acceptée. p(SEX > .05), le meilleur modèle est la régression commune. Notez que CM (Résidus) a diminué (0.00081 à 0.00080). Le terme LAGE:SEX n’est donc pas utile. Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effets du sexe et de l’âge sur les esturgeons de The Pas (régression commune) Coefficients: Value Std. Error t value Pr(>|t|) (Intercept) 1.2106 0.0309 39.1910 0.0000 LAGE 0.3361 0.0238 14.1439 0.0000 Residual standard error: 0.0285 on 90 degrees of freedom Multiple R-Squared: 0.6897 F-statistic: 200.1 on 1 and 90 degrees of freedom, the p-value is 0 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effets du site et de l’âge sur la taille des esturgeons Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Analyse Log(forklength)(LFKL) est la variable dépendante, log(age) (LAGE) est la variable indépendante continue, et le site la variable indépendante discontinue (2 sites) Q1: la pente de la relation de LFKL sur LAGE varie-t-elle entre les sites? Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effets du site et de l’âge sur la taille des esturgeons Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) LAGE 1 0.07795090 0.07795090 133.5655 0.0000000000 LOCATE 1 0.00968260 0.00968260 16.5907 0.0001011931 LAGE:LOCATE 1 0.00909005 0.00909005 15.5754 0.0001591604 Conclusion 1: la pente varie entre les sites (rejeter H03 ) p(LAGE:LOCATE) < .05 On devrait ajuster des régressions séparées pour chaque site. Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Que faire si? La variable discontinue a plus de deux niveaux? Suivre les mêmes étapes. Si on rejette l’hypothèse d’égalité des pentes (H03 ) on compare les pentes deux à deux. Si on accepte H03 mais rejette H02 (égalité des intercepts), comparer les intercepts deux à deux. Ajuster niveau a.... Y X Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Que faire si? L ’hypothèse biologique est unilatérale? Suivre les mêmes étapes. Si on rejette l’hypothèse d’égalité des pentes (H03 ) on compare les pentes deux à deux (test unilatéral). Si on accepte H03 mais rejette H02 (égalité des intercepts), comparer les intercepts deux à deux (test unilatéral). Y X Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Analyse de puissance Pour les modèles linéaires, les épreuves d’hypothèses utilisent un test de F. Attention: SCerreur et dlerreur dépendent du type d ’analyse et de l ’hypothèse éprouvée. Si on connait F, on peut calculer R2, la proportion de la variance totale de la variable dépendante expliquée par le facteur (variable) considéré. Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Proportion de la variance R2 total et partiel Proportion de la variance expliquée par A et B (R2Y•A,B) Le R2 total (R2Y•B) est la proportion de la variance de Y expliquée par toutes les variables indépendantes formant l ’ensemble B Le R2 partiel (R2Y•A,B- R2Y•A ) est la proportion de la variance expliquée par l ’ensemble B lorsque l’effet des autres facteurs est enlevé. Proportion de la variance expliquée par A (R2Y•A)(R2 total) Proportion de la variance expliquée par B mais pas par A (R2Y•A,B- R2Y•A ) (R2 partiel) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

R2 total et partiel Proportion de la variance expliquée par B (R2Y•B)(R2 total) Proportion de la variance inexpliquée par A (R2Y•A,B- R2Y•A ) (R2 partiel) Le R2 total (R2Y•B) pour l’ensemble B est égal au R2 partiel (R2Y•A,B- R2Y•A ) si (1) le R2 total pour l’ensemble A (R2Y•A) est 0 ou (2) si A et B sont indépendants (et alors R2Y•A,B= R2Y•A + R2Y•B) Égal si Y A A B Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

R2 total et partiel Y En régression simple et ANOVA à un critère de classification, il n’y a qu’une variable indépendante X (continue ou discontinue) X 0.20 0.16 Growth rate l (cm/day) 0.12 0.08 0.04 0.00 16 20 24 28 Water temperature (C) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

R2 total et partiel Y En ANCOVA, il y a plusieurs variables indépendantes Le R2 partiel peut différer du R2 total X1 0.20 0.16 0.12 Taux de croissance l (cm/jour) 0.08 0.04 pH = 6.5 pH = 4.5 0.00 16 20 24 28 Temperature (C) Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Définition de la taille de l’effet en GLM La taille de l’effet, f2 est calculée par le rapport du R2facteur sur 1 moins R2erreur. Note: R2facteur et R2erreur dépendent de l’hypothèse nulle Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effet du sexe et de l’âge sur la taille des esturgeons à The Pas (régression commune) Coefficients: Value Std. Error t value Pr(>|t|) (Intercept) 1.2106 0.0309 39.1910 0.0000 LAGE 0.3361 0.0238 14.1439 0.0000 Residual standard error: 0.0285 on 90 degrees of freedom Multiple R-Squared: 0.6897 F-statistic: 200.1 on 1 and 90 degrees of freedom, the p-value is 0 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Définition de la taille de l’effet en GLM: Exemple 1 Un ensemble B est relié à Y, et le R2 total (R2Y•B) est estimé Le R2erreur est alors: 1- R2Y•B H0: R2Y•B = 0 Exemple: effet de l’âge B ={LAGE} Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effet du sexe et de l’âge sur la taille des esturgeons de The Pas Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) SEX 1 0.0004089 0.0004089 0.5043 0.4794836 LAGE 1 0.1432274 0.1432274 176.6501 0.0000000 SEX:LAGE 1 0.0002730 0.0002730 0.3367 0.5632277 Residuals 88 0.0713501 0.0008108 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Effet du sexe et de l’âge sur la taille des esturgeons de The Pas (modèle ANCOVA) Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) LAGE 1 0.1433772 0.1433772 178.1627 0.0000000 SEX 1 0.0014899 0.0014899 1.8513 0.1770653 Residuals 89 0.0716231 0.0008048 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Définition de la taille de l’effet en GLM: Exemple 2 Cas 2: la proportion de la variance de Y dûe à B mais pas à A est déterminée (R2Y•A,B- R2Y•A ) Le R2erreur est alors 1- R2Y•A,B H0: R2Y•A,B- R2Y•A = 0 Exemple: effet de SEX$*LAGE B ={SEX$*LAGE}, A,B = {SEX$, LAGE, SEX$*LAGE} Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Exemple: effet du pH et des éléments nutritifs sur le taux de croissance de l’achigan Échantillon de 35 lacs 3 niveauxde pH : acide, neutre, basique Taux de croissance estimé pour chaque lac Quelle est la probabilité de détecter un effet partiel du pH de la taille de celui mesuré pour a = .05? Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Exemple: effet du pH et des éléments nutritifs sur le taux de croissance de l’achigan Taille de l ’effet f2 pour pH = .14 n1 = 2 n2 = 35 - 2 - 2- 1 - 1 = 29 Puissance=0.453 Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2018-08-25 10:00