BIO 4518: Biostatistiques appliquées Le 8 novembre 2005 Laboratoire 8 Regressions multiples
Les différentes analyses… La régression multiple permet de quantifier l’effet de plusieurs variables indépendantes continues sur une variable dépendante continue
Les conditions d’application (que vous devriez normalement faire….) Les résidus sont indépendants (visuel) Les résidus sont homoscédastiques (visuel) Linéarité des relations entre Y et tous les X (visuel) Pas d’erreur de mesure sur les variables indépendantes (expérience) Les résidus sont distribués normalement (test de KS)
Attention à la multicolinéarité Lorsque les variables indépendantes sont corrélées Pour détecter la multicolinéarité vous pouvez commencer par faire des matrices de corrélation entre vos variables indépendantes
(Densité des routes) (Forêts près des marais) Variable dépendante (Superficie) Exemple de multicolinéarité:
Construction des modèles: Manuellement (p ) Pas à pas (stepwise) (p.235) Agglomérative (forward): ajout de variable une à une (p. 236) Rétrograde (Backward): retrait de variable une à une (p.238) Utilisent la statistique Cp. Si un terme a un Cp plus bas que le modèle de départ, le terme est enlevé. Petit détail technique: Page 233: Écrire la commande Mregdat$ en minuscules et non en majuscules tel qu’indiqué dans le manuel