Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parFlorent Bilodeau Modifié depuis plus de 9 années
1
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 1 Régression logistique
2
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 2 Régression logistique famille des GLM variable dépendante a distribution binaire (0,1) (vivant, mort) (menacé, non-menacé)
3
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 3 Problèmes cardiaques vs age Régression linéaire Hummm... résidus pas normaux hétéroscédastiques valeurs prédites impossibles
4
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 4 Problèmes cardiaques vs age Lowess
5
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 5 Régression logistique *** Generalized Linear Model *** Call: glm(formula = cardiaque ~ age, family = binomial(link = logit), data = SDF12, na.action = na.exclude, control = list(epsilon = 0.0001, maxit = 50, trace = F)) Deviance Residuals: Min 1Q Median 3Q Max -1.545637 -0.5732664 -0.272312 -0.1404323 2.679875 Coefficients: Value Std. Error t value (Intercept) -7.76838060 0.376403465 -20.63844 age 0.09557905 0.005097055 18.75182 (Dispersion Parameter for Binomial family taken to be 1 ) Null Deviance: 2050.515 on 1999 degrees of freedom Residual Deviance: 1490.001 on 1998 degrees of freedom Number of Fisher Scoring Iterations: 4
6
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 6 Variable dépendante: logit(p) -4-2024 logit 0 20 40 60 80 100 p
7
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 7 Cardiaque vs age
8
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 8 Comment les paramètres sont-ils estimés? En maximisant la vraisemblance (Maximum Likelihood) –calculer la probabilité d’observer les résultats obtenus pour différentes valeurs des paramètres –choisir les valeurs qui maximisent cette probabilité (la vraisemblance) ou minimisent - LogL Méthode itérative
9
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 9 Algorithmes Recherchent minimum (maximum) en suivant les gradients Il n’y a pas de garantie d’obtenir les meilleurs estimés dans tous les cas. Paramètre SS R ou - log L Paramètre SS R ou - log L
10
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 10 Estimation des paramètres Valeurs initiales Itérations jusqu’à ce que la vraisemblance (ou la déviance) soit maximisée (minimisée) Critère de convergence Limite au nombre d’itérations Call: glm(formula = cardiaque ~ age, family = binomial(link = logit), data = SDF12, na.action = na.exclude, control = list(epsilon = 0.0001, maxit = 50, trace = F))
11
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 11 Tests d’hypothèses test de Z sur coefficients –asymptotiquement corrects (i.e pour gros échantillons) –règle d’usage: nombre d’observations où y=0 ET y=1 sont au moins 5X le nombre de variables indépendantes.
12
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 12 Test d’hypothèses Vraisemblance –Déviance=-2L –est approximativement distribué comme Chi-Carré –Mesure de la variabilité inexpliquée de la variable dépendante (similaire à la somme des carrés des écarts) Comparaison de modèles –Changement de déviance lorsque des termes sont ajoutés (ou enlevés) est également distribué approximativement comme Chi-carré
13
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 13 Conditions d’application indépendance linéarité variable dépendante a une distribution binomiale Pas d’erreur de mesure sur les variables indépendantes
14
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 14 Régression logistique *** Generalized Linear Model *** Call: glm(formula = cardiaque ~ age, family = binomial(link = logit), data = SDF12, na.action = na.exclude, control = list(epsilon = 0.0001, maxit = 50, trace = F)) Deviance Residuals: Min 1Q Median 3Q Max -1.545637 -0.5732664 -0.272312 -0.1404323 2.679875 Coefficients: Value Std. Error t value (Intercept) -7.76838060 0.376403465 -20.63844 age 0.09557905 0.005097055 18.75182 (Dispersion Parameter for Binomial family taken to be 1 ) Null Deviance: 2050.515 on 1999 degrees of freedom Residual Deviance: 1490.001 on 1998 degrees of freedom Number of Fisher Scoring Iterations: 4
15
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 15 Modèles possibles Variable indépendantes discontinues (modèle de type ANOVA) Avec interactions Mélange de variables continues et discontinues (type ANCOVA) Polynomes Bref, la seule différence c’est la distribution des résidus (variable dépendante)
16
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 16 Autre GLMs Approche similaire pour variable dépendantes ayant d’autres distributions –Multinomiale (plusieurs catégories) –Poisson –Binomiale négative
17
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 17 Sieving as a compromise The good side: –Coarse sieves reduce amount of work The bad side: –Coarse sieves retain only a fraction of organisms present What fraction? Objective: quantify retention probabilities to develop correction factors for coarse sieves
18
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 18 Methods Collect replicate samples from 3 different rivers Sieve samples through a stack of sieves Measure and identify organisms retained in each sieves 3 sites*3 operators*3 replicates each=27 samples
19
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 19 Perfect spheres, perfect sieve, perfect benthologist
20
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 20 Diameter (mm) Retention probability 0.1 0.2 0.3 0.5 0.6 1.0 0.11.010.0 0.0 0.4 0.7 0.8 0.9 Perfect spheres, perfect sieve, perfect benthologist 10mm sieve
21
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 21 Body length (mm) 0.11.010.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Retention probability Sieving invertebrates 1mm sieve
22
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 22 The fitted model (Overall equation) ln(p/[1 – p])= -2.8 + 5.8 log 10 (RL) –3.2 log 10 (RL) log 10 (M) n=25,383 Rho squared=0.75 90% of individuals retained in the predicted sieve (Relatively) big things are retained 10X longer than mesh size are virtually ALL retained
23
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 23 Body length (mm) 0.11.010.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Retention probability Oligochaeta Chironomidae Amphipoda Gastropoda Differences among taxa 1mm sieve Explained by shape
24
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 24 Correcting for organisms lost 1 mm-mesh sieve retains only 20% of organisms measuring 2mm long (p=0.2) Suppose you retain R=22 invertebrates of 2mm body length in your 1mm sieve. Q: What is the likely total number of 2mm-long organisms, including those NOT retained? A: R/p(R)=22/0.2=110
25
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 25 Smallest sieve used (mm) 0.01 0.1 1 10 Biomass or Density Biomass (corrected) Biomass Density (corrected) Density 0.0630.125 0.25 0.5 12481632 Unbiased estimates can be obtained up to 4- mm mesh
26
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 26 Size spectra obtained with coarse sieves can be corrected
27
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2015-07-18 22:46 27 Conclusions Retention probability is predictable Sieves retain virtually all organisms with a body length 10X mesh opening Probability of retention can be used to correct for organisms lost through coarse sieves Unbiased estimates of density, biomass, and size distributions can be obtained by measuring the minority of organisms retained in coarse sieves.
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.