L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques Conditions d’application de l’ANOVA Mesure de la décomposition de la SCE
Le modèle linéaire simple L’Analyse de Variance 1 1. Généralités Le modèle linéaire simple Projection : Y = a + bX1 + b2X2 +….+ ei X continue: régression linéaire simple X discrète: ANOVA Combinaisons: régression multiple, ANOVA2, ANCOVA Les erreurs suivent une distribution : normale centrée de variance constante et sont indépendantes
Quand utiliser l’ANOVA L’Analyse de Variance 1 1. Généralités Rendement Fréquence mC mN mN+P Quand utiliser l’ANOVA Pour tester l’effet d’une variable explicative discrète variable explicative = facteur et chaque facteur a plusieurs niveaux ou traitements l’ANOVA teste si toutes les moyennes sont égales Témoin Expérimental (N) Expérimental (N+P)
Possibilités et limites L’Analyse de Variance 1 1. Généralités Rendement Fréquence mC mN mN+P Possibilités et limites Permet de tester si toutes les moyennes sont égales (au niveau a)... …mais si on rejette H0, l’ANOVA ne dit pas lesquelles
L’Analyse de Variance 1 1. Généralités Types d’ANOVA Fixe : les traitements sont déterminés (manipulés) par le chercheur Aléatoires : les modalités sont choisies au hasard dans une population de modalités: on peut estimer l’effet du facteur pour d’autres modalités non étudiées Données identiques, modèles différents, calculs identiques mais seulement pour l’ANOVA à un critère de classification!
ANOVA fixe : rendement agricole L’Analyse de Variance 1 1. Généralités ANOVA fixe : rendement agricole ni = N = T
ANOVA aléatoire: poids de l’ours noir L’Analyse de Variance 1 1. Généralités ANOVA aléatoire: poids de l’ours noir 120 160 200 240 280 variable dépendante est le poids, facteur (X) = site, p=3 Question = effet site, au-delà des sites étudiés Poids (kg) Riding Kluane Algonquin Mountain
L’Analyse de Variance 1 2. Le modèle Les p moyennes sont-elles identiques? Les modalités de A influencent-elles Y? A1 A2 A3 A4 moyenne de Y effet de la ième modalité (constante). Ho : ai = 0 erreur aléatoire
L’Analyse de Variance 1 2. Le modèle Dans une ANOVA, la variance totale est répartie en deux composantes: intergroupe: variance des moyennes des différents groupes (traitements) intragroupe (erreur): variance des observations autour de la moyenne du groupe
Répartition de la somme des carrés totale L’Analyse de Variance 1 2. Le modèle Répartition de la somme des carrés totale m2 Y m m3 m1 SC Totale SC Modèle (Groupes) SC Erreur Groupe 1 Groupe 2 Groupe 3
L’Analyse de Variance 1 2. Le modèle Décomposition de la Somme des Carrés des Ecarts (SCE) Ho : les p moyennes sont égales Ha : au moins une moyenne diffère des autres SCET = SCEA + SCER(=E) = SCEinter + SCEintra = SCEB + SCEW
L’Analyse de Variance 1 å å ( Y - Y ) 2. Le modèle Tableau d’ANOVA å n Sources de variation Somme des carrés Degré de liberté (ddl) Carré moyen (CM) F k n i å å ( Y - Y ) 2 Totale n - 1 SCET/ddl ij i = 1 j = 1 CMA k Facteur å n ( Y - Y ) 2 p - 1 SCEA/ddl i i CMR i = 1 k n i å å ( - ) 2 Résidus Y Yi n - p SCER/ddl i j i = 1 j = 1
L’Analyse de Variance 1 2. Le modèle Rendement Frequence mC mN mN+P F plus petit F plus grand CMintergroupe mesure les différences moyennes au carré entre moyennes des groupes CMrésiduel est une mesure de la précision
L’Analyse de Variance 1 2. Le modèle L’hypothèse nulle Rendement Frequence mC mN mN+P F plus petit F plus grand L’hypothèse nulle H0: les moyennes de tous les groupes sont les mêmes, ou H0: il n’y a pas d’effet des groupes, ai =0 , ou H0: F = CMintergroupe/ CMerreur = 1 pour p groupes et pour un nombre d’observations N, on compare avec la distribution de F au niveau a avec p - 1 et N - p degrés de liberté
å å L’Analyse de Variance 1 3. Calculs pratiques SCE = - SCE = T n - N , or : 2 N T Y SCE ij - = å SCE A = T i . n 2 å - N SCE R = T - A
L’Analyse de Variance 1 3. Calculs pratiques Exemple = 264 = 186
L’Analyse de Variance 1 3. Calculs pratiques Exemple SV SCE ddl CM F A 186 2 93 7,15 R 78 6 13 T 264 8
4. Conditions d’application de l’ANOVA L’Analyse de Variance 1 4. Conditions d’application de l’ANOVA eij aléatoires = indépendants et chaque indépendants : plan d’expérience : modalités indépendantes individus indépendants : pas de double mesure, tirage au hasard de moyenne nulle : par construction de distribution normale : normalité de Y? étude graphique (TP) de même variance : homoscédasticité
4. Conditions d’application de l’ANOVA L’Analyse de Variance 1 4. Conditions d’application de l’ANOVA Ces conditions s’appliquent aux résidus et non aux données brutes …on doit tester les conditions d’application après que l’analyse soit faite et que les résidus soient obtenus
5. Mesure de la décomposition de la SCE L’Analyse de Variance 1 5. Mesure de la décomposition de la SCE Part de la variabilité de Y expliquée par l’ANOVA : NB : h2 inclue * SCET expliquée de façon linéaire : r2 * SCET expliquée de façon non linéaire : h2-r2 h2 ≥ r2
L’Analyse de Variance 1 5. Mesure de la décomposition de la SCE Exemple Part de la variabilité du rendement expliqué par le sol:
Démonstration SCET = SCER + SCEA + double produit , or : Le double produit est nul.