ANOVA à un facteur (Rehailia) Objet : Comparaison de plusieurs moyennes de populations gaussiennes
Aspect pratique On dispose d’un tableau de données de la forme : .1. .2. … ..i.. …. ..I. X11 : : X1n1 X21 X2n2 Xi1 Xij Xini ….. XI1 XInI
Terminologie Chacune des colonnes du tableau précédent est assimilée à un groupe expérimental. La ligne 1 du tableau est constitué de I entrées appelées traitements ou variantes. L’ensemble des traitements constitue un facteur. On dit qu’on a un problème d’ANOVA à un facteur constitué de I niveaux Terminologie:
Conditions théoriques On suppose que chaque groupe (colonne) est un échantillon aléatoire prélevé d’une population gaussienne de moyenne i. Les I groupes sont indépendants Les variances des populations mères (i2) égales (homoscédasticité).
Modèle théorique Les conditions précédentes peuvent regroupées dans une écrite mathématique concise, appelée modèle, sous la forme : Modèle 1. Xij = i + ij où i = moyenne de la population i et ij = erreur de la jème observation du groupe i
Ecriture des hypothèses avec le modèle 1 H0 : les I moyennes (de populations) sont égales, i.e. H0 : 1 = 2 = … = I. contre H1 : au moins une moyenne est différentes des autres moyennes.
Modèle 2 Xij = + i + ij où = moyenne commune (à toutes les populations) i = effet du traitement i et ij = erreur de la jème observation du groupe i
Ecriture des hypothèses dans le modèle 2 H0 : 1 = 2 = … = I = 0 (pas d’effet de traitement) contre H1 : au moins un i 0 (au moins un traitement produit un effet).
Comment tester H0 contre H1 ? Idée fausse : faire une série de tests t de Student de comparaisons de moyennes 2 à 2 et en faire la synthèse. Pourquoi ? - Inflation du risque de 1ère espèce. - risque de conclusions contradictoires.
Le test F de Fisher Utiliser différents estimateurs de la variance pour comparer les moyennes : - Variance inter-groupes et - Variance intra-groupes
Dans quel cas peut rejeter H0 plus facilement ? Pourquoi ? Ensemble 1 de données Ensemble 2 de données A B C 8 9 10 7,5 8,5 9,5 9,8 10,1 A B C 3 9 15 1,5 8,5 15,5 5,2 9,8 14,4
Estimations des différents paramètres est estimé par i est estimé par i est estimé par
Estimation de la variance 2 Au moins 3 façons de le faire. S.C.E.inter-groupes = S.C.E.intra-groupes = S.C.E.totale = De plus, on a SCE inter + SCEintra = SCEtotale
Table d’ANOVA On regroupe toutes les sommes des carrés des écarts précédentes avec leurs degrés de liberté respectifs dans un tableau appelé table d’ANOVA.
Table d’ANOVA F= Source d.d.l. S.C.E. C.M.E Fobservé Inter-gps I – 1 SCEinter CMEinter= F= Intra-gps N – I SCEintra CMEintra= Totale N - 1 SCEtotale
Règles de décision Au seuil rejeter H0 si F(table) > C (lue dans la table de la loi F de Fisher-Snedecor) Avec un logiciel rejeter H0 si : a-utilisateur > p-value.
Discussion des conditions théoriques Normalité : test F en général robuste. Indépendance : veiller à une bonne planification de l’expérience. Homoscédasticité : test F sensible à cette condition surtout lorsque le plan n’est pas équilibré et qu’il y a peu d’observations.
Et après ? Lorsque H0 est rejetée il reste une série de questions sans réponse puisque H1 dit seulement qu’au moins des moyennes diffère des autres. Il faut faire alors des comparaisons à posteriori des moyennes 2 à 2. Plusieurs méthodes existent (HSD, Tukey, Scheffé …etc). Aucune n’est exacte. Vous devez les utiliser seulement pour étoffer votre discussion.