Télécharger la présentation
1
ANOVA à un facteur (Rehailia)
Objet : Comparaison de plusieurs moyennes de populations gaussiennes
2
Aspect pratique On dispose d’un tableau de données de la forme : .1.
.2. … ..i.. …. ..I. X11 : : X1n1 X21 X2n2 Xi1 Xij Xini ….. XI1 XInI
3
Terminologie Chacune des colonnes du tableau précédent est assimilée à un groupe expérimental. La ligne 1 du tableau est constitué de I entrées appelées traitements ou variantes. L’ensemble des traitements constitue un facteur. On dit qu’on a un problème d’ANOVA à un facteur constitué de I niveaux Terminologie:
4
Conditions théoriques
On suppose que chaque groupe (colonne) est un échantillon aléatoire prélevé d’une population gaussienne de moyenne i. Les I groupes sont indépendants Les variances des populations mères (i2) égales (homoscédasticité).
5
Modèle théorique Les conditions précédentes peuvent regroupées dans une écrite mathématique concise, appelée modèle, sous la forme : Modèle 1. Xij = i + ij où i = moyenne de la population i et ij = erreur de la jème observation du groupe i
6
Ecriture des hypothèses avec le modèle 1
H0 : les I moyennes (de populations) sont égales, i.e. H0 : 1 = 2 = … = I. contre H1 : au moins une moyenne est différentes des autres moyennes.
7
Modèle 2 Xij = + i + ij où
= moyenne commune (à toutes les populations) i = effet du traitement i et ij = erreur de la jème observation du groupe i
8
Ecriture des hypothèses dans le modèle 2
H0 : 1 = 2 = … = I = 0 (pas d’effet de traitement) contre H1 : au moins un i 0 (au moins un traitement produit un effet).
9
Comment tester H0 contre H1 ?
Idée fausse : faire une série de tests t de Student de comparaisons de moyennes 2 à 2 et en faire la synthèse. Pourquoi ? - Inflation du risque de 1ère espèce. - risque de conclusions contradictoires.
10
Le test F de Fisher Utiliser différents estimateurs de la variance pour comparer les moyennes : - Variance inter-groupes et - Variance intra-groupes
11
Dans quel cas peut rejeter H0 plus facilement ? Pourquoi ?
Ensemble 1 de données Ensemble 2 de données A B C 8 9 10 7,5 8,5 9,5 9,8 10,1 A B C 3 9 15 1,5 8,5 15,5 5,2 9,8 14,4
12
Estimations des différents paramètres
est estimé par i est estimé par i est estimé par
13
Estimation de la variance 2
Au moins 3 façons de le faire. S.C.E.inter-groupes = S.C.E.intra-groupes = S.C.E.totale = De plus, on a SCE inter + SCEintra = SCEtotale
14
Table d’ANOVA On regroupe toutes les sommes des carrés des écarts précédentes avec leurs degrés de liberté respectifs dans un tableau appelé table d’ANOVA.
15
Table d’ANOVA F= Source d.d.l. S.C.E. C.M.E Fobservé Inter-gps I – 1
SCEinter CMEinter= F= Intra-gps N – I SCEintra CMEintra= Totale N - 1 SCEtotale
16
Règles de décision Au seuil rejeter H0 si F(table) > C (lue dans la table de la loi F de Fisher-Snedecor) Avec un logiciel rejeter H0 si : a-utilisateur > p-value.
17
Discussion des conditions théoriques
Normalité : test F en général robuste. Indépendance : veiller à une bonne planification de l’expérience. Homoscédasticité : test F sensible à cette condition surtout lorsque le plan n’est pas équilibré et qu’il y a peu d’observations.
18
Et après ? Lorsque H0 est rejetée il reste une série de questions sans réponse puisque H1 dit seulement qu’au moins des moyennes diffère des autres. Il faut faire alors des comparaisons à posteriori des moyennes 2 à 2. Plusieurs méthodes existent (HSD, Tukey, Scheffé …etc). Aucune n’est exacte. Vous devez les utiliser seulement pour étoffer votre discussion.
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.