Télécharger la présentation
Publié parOdille Blondel Modifié depuis plus de 9 années
1
M2 Sciences des Procédés - Sciences des Aliments
ANALYSE DE VARIANCE M2 Sciences des Procédés - Sciences des Aliments
2
ANALYSE DE VARIANCE Exemple
Des forestiers ont réalisé des plantations d’arbres en 3 endroits. Plusieurs années plus tard ils souhaitent savoir si la hauteur des arbres est identique dans les trois forêts. Dans chaque forêt on tire un échantillon d’arbre et on mesure la hauteur de chaque arbre. L’analyse de variance (ANOVA) consiste à chercher si la variabilité des observations peut être en partie expliquée par les différences entre variantes d’un facteur (ici fôret) Forêt 1 Forêt 2 Forêt 3
3
OBJECTIF DE l’ANOVA Analyser des données qui dépendent de plusieurs types d’effets agissant simultanément, afin de quantifier ces effets = expliquer une variable quantitative par une ou des variables qualitatives (facteurs) En amont de l’ANOVA : plan expérimental (nombre d’expériences pour chaque niveau ou modalité, facteurs)
4
Analyse de la variance à 1 facteur
M’introduire : travaillé dans le privé en agro-alimentaire (Danone) et dans la Recherche publique à l’INRA Rendu compte de l’importance de la planification des expériences et de leur interprétation
5
Exemple Etude sur l’appréciation sensorielle de la texture de 3 viandes. Seul le caractère fibreux est considéré, noté sur une échelle de 15 points. 15 dégustateurs différents ont noté chacun une viande 13 11 7 8 10 5 3 6 C B A viande notes pour le caractère fibreux
6
Modèle de l’analyse de la variance à 1 facteur :
Exemple de la viande : texture fibreuse d’une viande caractère fibreux de la viande i caractère fibreux potentiel due à l’ensemble des autres causes qui déterminent la note fibreuse où est la variable à expliquer ……………… est l’effet du ième niveau du facteur …..... est l’effet moyen général ………………. est la variable aléatoire résiduelle ……… Hypothèses : les sont indépendants suit une loi
7
Décomposition de l’élément :
Exemple de la viande : Y = M + B W données globales moyenne générale écarts inter-colonnes intra-colonnes
8
Décomposition de la variabilité
En élevant au carré et en sommant, pour toutes les observations : Somme des carrés des écarts totaux Somme des carrés des écarts inter-niveaux Somme des carrés des écarts intra-niveaux = + SCETotale SCEInter SCEIntra Exemple de la viande : SCETotale = 140 SCEInter = 90 SCEIntra = 50
9
On souhaite tester les hypothèses :
H0 : " Il n’y a pas d’effet produit " càd les moyennes pour les différents produits (niveaux du facteur) sont égales contre H1 : " Il y a un effet produit " càd deux moyennes au moins sont différentes Il s’agit donc de comparer la variabilité inter-niveaux à la variabilité intra-niveaux du facteur
10
On définit le carré moyen inter-groupes :
Source de variation SCE ddl Inter-niveaux SCE Inter I-1 Intra-niveaux SCE Intra n-I Totale SCE Totale n-1 I nombre de niveaux On définit le carré moyen inter-groupes : et le carré moyen intra-groupes :
11
Pour tester H0 contre H1, on évalue la quantité :
Si l’hypothèse H0 est vraie, la valeur F est faible, sinon, en s’éloignant de cette hypothèse, le rapport F augmente à partir de quelle valeur observée de F rejette-t-on H0 ? Si les résidus du modèle de l’analyse de la variance suivent une loi normale, et si H0 est vraie, on sait que F est l’observation d’une variable qui suit la loi de Fisher ayant (I-1) ddl au numérateur et (n-I) ddl au dénominateur : notée F(I-1, n-I) H0 est rejetée si Fobs > F (I-1, n-I) pour un niveau de significativité donné α, c’est-à-dire si p-value < α (cf. table de Fisher)
12
Tables de la loi de Fisher : pour α = 5 %, Fα,2,12 = 3,88
Exemple de la viande : Tableau d’analyse de la variance Source de variation SCE ddl CM F p-value Type de viande 90 2 45 10,8 p < 0,01 Résiduelle (intra-produit) 50 12 4,17 Totale 140 14 Tables de la loi de Fisher : pour α = 5 %, Fα,2,12 = 3,88 pour α = 1 %, Fα,2,12 = 6,93 p-value = p(Fα,1, 2 > Fobs) H0 rejetée = il existe un effet type de viande significatif concernant le caractère fibreux
13
Analyse de la variance à 2 facteurs
M’introduire : travaillé dans le privé en agro-alimentaire (Danone) et dans la Recherche publique à l’INRA Rendu compte de l’importance de la planification des expériences et de leur interprétation
14
Dispositif complet sans répétition
Supposons maintenant que 5 juges aient évalué une série de 3 échantillons : notes pour le caractère fibreux viande juge A B C 1 2 3 4 5 6 10 8 7 13 11
15
III.2 – Dispositif complet sans répétition
Modèle de l’analyse de la variance à 2 facteurs sans interaction : Exemple de la viande : texture fibreuse d’une viande caractère fibreux de la viande i effet lié au juge j caractère fibreux potentiel due à l’ensemble des autres causes qui déterminent la note fibreuse où est la variable à expliquer ……………… est l’effet du ième niveau du facteur A ..... est l’effet du jème niveau du facteur B .... est l’effet moyen général ………………. est la variable aléatoire résiduelle ……… Hypothèses : les sont indépendants suit une loi
16
III.2 – Dispositif complet sans répétition
Equation de la décomposition de la variance : SCET = SCEA + SCEB + SCER soit : Source de variation SCE ddl Effet principal de A SCEA I-1 Effet principal de B SCEB J-1 Résiduelle SCER (I-1)(J-1) Totale SCET n-1
17
Tableau d’analyse de la variance
On teste chaque facteur Tableau d’analyse de la variance Source de variation SCE ddl CM F Type de viande 90,0 2 45,0 13,2 Effet juge 22,7 4 5,7 1,7 Résiduelle 27,3 8 3,4 Totale 140 14 1er test : Fobs = 13,2 >> Fα,2,8 = 4,5 avec α = 5 % H0 rejetée avec un risque de 5 % = il existe un effet produit significatif concernant le caractère fibreux 2ème test : Fobs = 1,7 < Fα,4,8 = 3,8 avec α = 5 % H0 non rejetée = il n’existe pas d’effet juge significatif
18
Dispositif complet avec répétitions
Comparaison de 3 types de sondes pédologiques pour 2 natures de sol Type de sol 1 2 Type de sonde 43 45 46 53 40 41 42 44 35 37 3 48 39
19
III.3 – Dispositif complet avec répétitions
Modèle de l’analyse de la variance à 2 facteurs avec interaction : où est la variable à expliquer est l’effet du ième niveau du facteur A est l’effet du jème niveau du facteur B est l’interaction des niveaux i et j des 2 facteurs est l’effet moyen général est la variable aléatoire résiduelle Hypothèses : les sont indépendants suit une loi
20
Avec répétition PAS D’INTERACTION D’INTERACTION Effet moyen
B3 B1 B2 D’INTERACTION Effet moyen A2 A1 B3 B1 B2
21
SCET = SCEA + SCEB + SCEAB + SCER
Equation de la décomposition de la variance : SCET = SCEA + SCEB + SCEAB + SCER soit : (I-1)(J-1) SCEAB Interaction A x B J-1 SCEB Effet principal de B n-1 SCET Totale IJK-IJ SCER Résiduelle I-1 SCEA Effet principal de A ddl SCE Source de variation 3 tests d’hypothèse
22
Tableau d’analyse de la variance
Type de sol 1 2 Type de sonde 43 45 46 53 40 41 42 44 35 37 3 48 39 Tableau d’analyse de la variance 0,789 0,24 1,5 2 3,0 Sol x sonde 3,92 29,04 F 0,039 24,5 49,0 Type de sonde < 0,01 p-value 23 346,0 Totale 6,2 18 112,5 Résiduelle 181,5 1 Type de sol CM ddl SCE Source de variation
23
Effet sol >> effet sonde
Effets sol et sonde significatifs pour α = 5 % Sonde Réponse 1 2 3 Sol 1 Sol 2 Pas d’effet d’interaction
24
Tests de comparaisons multiples
Si rejet de l’hypothèse testée : effet du facteur Le rejet signifie: il existe au moins 1 niveau différent des autres Le ou lesquels? Il existe des méthodes complémentaires : - test LSD (Least Significance Difference) de Fischer (ppds) test de Scheffe test de Dunnett test de Duncan …
25
ddl de la source de variation résiduelle
Tests de comparaisons multiples Pour chaque comparaison de 2 moyennes, on calcule une valeur seuil r (range), fonction du carré moyen résiduel de l’ANOVA Si , alors la différence est déclarée significative, au niveau de signification α Exemple : test LSD ddl de la source de variation résiduelle
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.