M2 Sciences des Procédés - Sciences des Aliments

Slides:



Advertisements
Présentations similaires
Corrélation Position du problème Définition covariance (X,Y) r =
Advertisements

ANOVA à un facteur (Rehailia)
Principe Exemple Utilisation d’une macro
Thomas G. Dietterich Approximate Statistical Tests for Comparing
Les tests d’hypothèses (I)
Inférence statistique
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Les TESTS STATISTIQUES
Régression ou corrélation
Tests de comparaison de pourcentages
Comparaison de plusieurs moyennes Analyse de variance
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Comparaison de plusieurs moyennes Analyse de variance
Régression -corrélation
Analyse de la variance à un facteur
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
Les liens entre les variables et les tests d’hypothèse
Plans à groupes indépendants: organisation
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Analyse de la variance : ANOVA à un facteur
Régression linéaire simple
L’Analyse de Variance 2 L’ANOVA 2 fixe à r répétitions
Corrélation et régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
L’analyse de variance factorielle
La corrélation et la régression multiple
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
L’analyse de variance.
La corrélation et la régression
ANOVA à critères multiples
Le comportement des coûts Chapitre 3
Analyse factorielle de variance: Principes d’expérimentation
TEST d’ADEQUATION A UNE LOI EQUIREPARTIE
La régression multiple
Méthodes de Biostatistique
ANOVA : introduction.
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Howell Chap. 11: ANOVA. Du monde connu au monde inconnu Du test t à l’analyse de varianceDu test t à l’analyse de variance Trouvez des nouveaux noms pour.
LA REGRESSION LINEAIRE
Séance 8 30 novembre 2005 N. Yamaguchi
STATISTIQUES – PROBABILITÉS
ANOVA à 1 facteur en groupes de mesure indépendants
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :35 1 Comparaisons multiples Ce qu’elles sont.
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :52 1 Comparaisons multiples Ce qu’elles sont.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Analyse de variance à un critère de classification (ANOVA)
ATELIERS STATISTIQUES
1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.
ou comment savoir si les différences observées sont significatives
Analyse des semis de point
Remise à niveau en statistique Eric Marcon – Module FTH 2006.
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Introduction aux statistiques Intervalles de confiance
Corrélation et régression linéaire Mars Modèles de régression  Réponses aux questions du type: ‘Quelle est la nature de la relation entre les variables?’
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
Chap. III Statistiques inférentielles
Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)
Transcription de la présentation:

M2 Sciences des Procédés - Sciences des Aliments ANALYSE DE VARIANCE M2 Sciences des Procédés - Sciences des Aliments 

ANALYSE DE VARIANCE Exemple Des forestiers ont réalisé des plantations d’arbres en 3 endroits. Plusieurs années plus tard ils souhaitent savoir si la hauteur des arbres est identique dans les trois forêts. Dans chaque forêt on tire un échantillon d’arbre et on mesure la hauteur de chaque arbre. L’analyse de variance (ANOVA) consiste à chercher si la variabilité des observations peut être en partie expliquée par les différences entre variantes d’un facteur (ici fôret) Forêt 1 Forêt 2 Forêt 3 23.4 24.4 24.6 24.9 25.0 26.2 18.9 21.1 21.1 22.1 22.5 23.5 24.5 22.5 22.9 23.7 24.0 24.0

OBJECTIF DE l’ANOVA Analyser des données qui dépendent de plusieurs types d’effets agissant simultanément, afin de quantifier ces effets = expliquer une variable quantitative par une ou des variables qualitatives (facteurs)  En amont de l’ANOVA : plan expérimental (nombre d’expériences pour chaque niveau ou modalité, facteurs)

Analyse de la variance à 1 facteur M’introduire : travaillé dans le privé en agro-alimentaire (Danone) et dans la Recherche publique à l’INRA Rendu compte de l’importance de la planification des expériences et de leur interprétation

Exemple Etude sur l’appréciation sensorielle de la texture de 3 viandes. Seul le caractère fibreux est considéré, noté sur une échelle de 15 points. 15 dégustateurs différents ont noté chacun une viande 13 11 7 8 10 5 3 6 C B A viande notes pour le caractère fibreux

Modèle de l’analyse de la variance à 1 facteur : Exemple de la viande : texture fibreuse d’une viande caractère fibreux de la viande i caractère fibreux potentiel due à l’ensemble des autres causes qui déterminent la note fibreuse où est la variable à expliquer ……………… est l’effet du ième niveau du facteur …..... est l’effet moyen général ………………. est la variable aléatoire résiduelle ……… Hypothèses : les sont indépendants suit une loi

Décomposition de l’élément : Exemple de la viande : 3 10 13 5 8 11 6 5 7 3 7 11 3 5 8 Y = 7 7 7 M + -3 0 3 B -1 3 3 1 1 1 2 -2 -3 -1 0 1 -1 -2 -2 W données globales moyenne générale écarts inter-colonnes intra-colonnes

Décomposition de la variabilité En élevant au carré et en sommant, pour toutes les observations : Somme des carrés des écarts totaux Somme des carrés des écarts inter-niveaux Somme des carrés des écarts intra-niveaux = + SCETotale SCEInter SCEIntra Exemple de la viande : SCETotale = 140 SCEInter = 90 SCEIntra = 50

On souhaite tester les hypothèses : H0 : " Il n’y a pas d’effet produit " càd les moyennes pour les différents produits (niveaux du facteur) sont égales contre H1 : " Il y a un effet produit " càd deux moyennes au moins sont différentes  Il s’agit donc de comparer la variabilité inter-niveaux à la variabilité intra-niveaux du facteur

On définit le carré moyen inter-groupes : Source de variation SCE ddl Inter-niveaux SCE Inter I-1 Intra-niveaux SCE Intra n-I Totale SCE Totale n-1 I nombre de niveaux On définit le carré moyen inter-groupes : et le carré moyen intra-groupes :

Pour tester H0 contre H1, on évalue la quantité : Si l’hypothèse H0 est vraie, la valeur F est faible, sinon, en s’éloignant de cette hypothèse, le rapport F augmente  à partir de quelle valeur observée de F rejette-t-on H0 ?  Si les résidus du modèle de l’analyse de la variance suivent une loi normale, et si H0 est vraie, on sait que F est l’observation d’une variable qui suit la loi de Fisher ayant (I-1) ddl au numérateur et (n-I) ddl au dénominateur : notée F(I-1, n-I) H0 est rejetée si Fobs > F (I-1, n-I) pour un niveau de significativité donné α, c’est-à-dire si p-value < α (cf. table de Fisher)

 Tables de la loi de Fisher : pour α = 5 %, Fα,2,12 = 3,88 Exemple de la viande : Tableau d’analyse de la variance Source de variation SCE ddl CM F p-value Type de viande 90 2 45 10,8 p < 0,01 Résiduelle (intra-produit) 50 12 4,17 Totale 140 14  Tables de la loi de Fisher : pour α = 5 %, Fα,2,12 = 3,88 pour α = 1 %, Fα,2,12 = 6,93 p-value = p(Fα,1, 2 > Fobs)  H0 rejetée = il existe un effet type de viande significatif concernant le caractère fibreux

Analyse de la variance à 2 facteurs M’introduire : travaillé dans le privé en agro-alimentaire (Danone) et dans la Recherche publique à l’INRA Rendu compte de l’importance de la planification des expériences et de leur interprétation

Dispositif complet sans répétition Supposons maintenant que 5 juges aient évalué une série de 3 échantillons : notes pour le caractère fibreux viande juge A B C 1 2 3 4 5 6 10 8 7 13 11

III.2 – Dispositif complet sans répétition Modèle de l’analyse de la variance à 2 facteurs sans interaction : Exemple de la viande : texture fibreuse d’une viande caractère fibreux de la viande i effet lié au juge j caractère fibreux potentiel due à l’ensemble des autres causes qui déterminent la note fibreuse où est la variable à expliquer ……………… est l’effet du ième niveau du facteur A ..... est l’effet du jème niveau du facteur B .... est l’effet moyen général ………………. est la variable aléatoire résiduelle ……… Hypothèses : les sont indépendants suit une loi

III.2 – Dispositif complet sans répétition Equation de la décomposition de la variance : SCET = SCEA + SCEB + SCER soit : Source de variation SCE ddl Effet principal de A SCEA I-1 Effet principal de B SCEB J-1 Résiduelle SCER (I-1)(J-1) Totale SCET n-1

Tableau d’analyse de la variance On teste chaque facteur Tableau d’analyse de la variance Source de variation SCE ddl CM F Type de viande 90,0 2 45,0 13,2 Effet juge 22,7 4 5,7 1,7 Résiduelle 27,3 8 3,4 Totale 140 14  1er test : Fobs = 13,2 >> Fα,2,8 = 4,5 avec α = 5 %  H0 rejetée avec un risque de 5 % = il existe un effet produit significatif concernant le caractère fibreux  2ème test : Fobs = 1,7 < Fα,4,8 = 3,8 avec α = 5 %  H0 non rejetée = il n’existe pas d’effet juge significatif

Dispositif complet avec répétitions Comparaison de 3 types de sondes pédologiques pour 2 natures de sol Type de sol 1 2 Type de sonde 43 45 46 53 40 41 42 44 35 37 3 48 39

III.3 – Dispositif complet avec répétitions Modèle de l’analyse de la variance à 2 facteurs avec interaction : où est la variable à expliquer est l’effet du ième niveau du facteur A est l’effet du jème niveau du facteur B est l’interaction des niveaux i et j des 2 facteurs est l’effet moyen général est la variable aléatoire résiduelle Hypothèses : les sont indépendants suit une loi

Avec répétition PAS D’INTERACTION D’INTERACTION Effet moyen B3 B1 B2 D’INTERACTION Effet moyen A2 A1 B3 B1 B2

SCET = SCEA + SCEB + SCEAB + SCER Equation de la décomposition de la variance : SCET = SCEA + SCEB + SCEAB + SCER soit : (I-1)(J-1) SCEAB Interaction A x B J-1 SCEB Effet principal de B n-1 SCET Totale IJK-IJ SCER Résiduelle I-1 SCEA Effet principal de A ddl SCE Source de variation  3 tests d’hypothèse

Tableau d’analyse de la variance Type de sol 1 2 Type de sonde 43 45 46 53 40 41 42 44 35 37 3 48 39 Tableau d’analyse de la variance 0,789 0,24 1,5 2 3,0 Sol x sonde 3,92 29,04 F 0,039 24,5 49,0 Type de sonde < 0,01 p-value 23 346,0 Totale 6,2 18 112,5 Résiduelle 181,5 1 Type de sol CM ddl SCE Source de variation

 Effet sol >> effet sonde  Effets sol et sonde significatifs pour α = 5 % Sonde Réponse 1 2 3 Sol 1 Sol 2  Pas d’effet d’interaction

Tests de comparaisons multiples Si rejet de l’hypothèse testée : effet du facteur Le rejet signifie: il existe au moins 1 niveau différent des autres Le ou lesquels? Il existe des méthodes complémentaires : - test LSD (Least Significance Difference) de Fischer (ppds) test de Scheffe test de Dunnett test de Duncan …

ddl de la source de variation résiduelle Tests de comparaisons multiples Pour chaque comparaison de 2 moyennes, on calcule une valeur seuil r (range), fonction du carré moyen résiduel de l’ANOVA Si , alors la différence est déclarée significative, au niveau de signification α Exemple : test LSD ddl de la source de variation résiduelle