Méthodes de Biostatistique Chapitre 7 Analyse de la Variance ANOVA
1. Définition L’Analyse de la Variance, dite ANOVA, est utilisée pour tester l’égalité de plus de deux moyennes de populations. Spécifiquement, les hypothèses sont données par: Les moyennes ne sont pas égales où k = le nombre de populations considérées. Les conditions pour que l’application de l’ANOVA soit valide: k populations indépendantes. Échantillons aléatoires de chaque population. Des tailles échantillonnales sup. à 30 ou population normale. Les variances des populations sont égales.
Considérons les k traitements suivants: où : la i ème observation du j ème traitement.
On définit aussi les quantités suivantes: = La moyenne échantillonnale du j ème traitement. = La moyenne échantillonnale de toutes les données. = Le nombre de traitements. = Taille échantillonnale total , En utilisant ces quantités, on peut définir une règle de décision, donnée par la table suivante:
La table d’ANOVA: Intra Inter Total ANOVA: Source de Variation Somme des carrés Degrés de liberté Moyenne des carrés F Intra Inter Total
3. Évaluation de l’effet du traitement Si on utilise une ANOVA pour démontrer la différence des moyennes existe (i.e. on a rejeté ), on peut alors mesurer la magnitude de l’effet des traitements. La statistique suivante, dite « eta-carré », est le ratio de la variation due aux traitements ( ) par rapport à la variation totale ( ): On a :
4. Procédures des comparaisons multiples. En ANOVA, quand on rejette l’hypothèse nulle, il est souvent utile de tester des hypothèses spécifiques pour comparer certains traitements. Parmi les méthodes de comparaisons existantes, on trouve la méthode de SCHEFFE. Les hypothèses sont les suivantes: où et sont deux moyennes des k traitements.
La statistique du test est donnée par: La règle de décision est: Rejeter si :