ANALYSE DE LA VARIANCE(ANOVA) SOUS STATA

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

ANOVA à un facteur (Rehailia)
Test statistique : principe
Introduction aux statistiques
Les tests d’hypothèses (II)
Les tests d’hypothèses (I)
La régression logistique: fondements et conditions d’application
Inférence statistique
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Situation du problème :
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Comparaison de plusieurs moyennes Analyse de variance
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Les tests d’hypothèses
Comparaison de plusieurs moyennes Analyse de variance
Analyse de la variance à un facteur
Vérification des données
Régression linéaire (STT-2400) Section 3 Tests dhypothèses et lhypothèse linéaire générale Version: 26 janvier 2007.
Tests de comparaison de moyennes
Méthodes de Biostatistique
Plans à groupes indépendants: organisation
La Régression Multiple
Etude longitudinale d’essais multilocaux: apports du modèle mixte
Analyse de la variance : ANOVA à un facteur
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Objectifs du chapitre 12: Interprétation des résultats
Faculté de Médecine Lyon-Sud Module Optionnel de préparation à la lecture critique d ’articles Interprétation des tests statistiques.
L’Analyse de Variance 2 L’ANOVA 2 fixe à r répétitions
L’Analyse de Covariance
Corrélation et régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
Méthodes de prévision (STT-3220)
Influences génétiques directe et maternelle sur la production en première lactation de quatre races de chèvres laitières.
L’analyse de variance factorielle
La corrélation et la régression multiple
Le test t.
La puissance statistique
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Analyse factorielle de variance: Principes d’expérimentation
Objectifs du chapitre 8: Puissance statistique
Régression linéaire (STT-2400)
La régression multiple
Tests d’hypothèses.
Régression linéaire (STT-2400)
ESTIMATION DES PARAMETRES GENETIQUES INFLUANCANT LA TAILLE DE LA PORTEE CHEZ DES PORCS DE RACE PURE LANDRACE ET PIETRAIN.
Régression linéaire multiple : hypothèses & tests. Partie 3.
Méthodologie expérimentale : l’analyse des données
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Howell Chap. 11: ANOVA. Du monde connu au monde inconnu Du test t à l’analyse de varianceDu test t à l’analyse de variance Trouvez des nouveaux noms pour.
M2 Sciences des Procédés - Sciences des Aliments
Séance 8 30 novembre 2005 N. Yamaguchi
Probabilités et Statistiques Année 2010/2011
BIO 4518: Biostatistiques appliquées Les 11 et 18 octobre 2005 Laboratoire 4 et 5 ANOVA à critères multiples.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
ATELIERS STATISTIQUES
Université d’Ottawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :34 1 Les modèles linéaires (Generalized Linear.
MENU 1 Modèles de choix.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Transcription de la présentation:

ANALYSE DE LA VARIANCE(ANOVA) SOUS STATA ENSAE-Sénégal ANALYSE DE LA VARIANCE(ANOVA) SOUS STATA FILIERE: ITS NIVEAU: 3 Réalisé par: Sous la supervision de: DJIMERA Ismaïla M. GUINDO Sidiki KALIVOGUI Pépé KHARMA Mamadou MAREGA Alassane SANOGO N’Kari YOUM Amadou (chef de groupe) Analyse de la variance_ITS3/ENSAE-Sénégal/2011

PLAN I.1.Principe I.2. Traitement et Résultats I. ANALYSE DE LA VARIANCE A UN FACTEUR(ANOVA1) I.1.Principe I.2. Traitement et Résultats II. ANALYSE DE LA VARIANCE A DEUX FACTEURS(ANOVA2) II.2. Modèle sans interactions II. 3. Modèle avec interactions Analyse de la variance_ITS3/ENSAE-Sénégal/2011

INTRODUCTION Le présent exposé s’inscrit dans le cadre de l’application des cours théoriques acquises en analyse de la variance. L’analyse de la variance consiste à expliquer une variable quantitative par un ensemble de variables qualitatives. Pour y arriver, il est nécessaire de formaliser un bon modèle afin d’obtenir des interprétations pertinentes. Plusieurs logiciels tels que STATA, R, SPSS,... sont utilisés pour faire l’analyse. Tout au long de ce travail, seules l’analyse de la variance à un facteur(ANOVA 1) et l’analyse de la variance à deux facteurs(ANOVA 2) seront développées. Le logiciel STATA qui fonctionne avec des lignes de commande tapées par l’utilisateur sera utilisé pour le traitement des données. Analyse de la variance_ITS3/ENSAE-Sénégal/2011

I. ANALYSE DE LA VARIANCE A UN FACTEUR I.1. Principe Considérons un éleveur de Podor qui souhaite savoir si la race de ses vaches a un effet sur sa production journalière de lait. Formalisation du modèle: Soit Y la quantité de lait produite, X la race des vaches. Le modèle s’écrit: Yik = a + bk +Uik où: a = Effet commun au niveau de production de toutes les vaches; bk = Effet du niveau de production spécifique à la race et commun pour chaque race; Uik = Effet perturbateur lié au niveau de production; Yik = Quantité de lait produite de la vache i appartenant à la race k. Analyse de la variance_ITS3/ENSAE-Sénégal/2011

а* =ȳ ; bk* = ȳk –ȳ; uik* = yik - ȳk Hypothèses fondamentales les résidus sont distribués suivant une loi normal centrée. la variance des résidus ne varie pas entre les traitements (Homoscédasticité). Hypothèse à tester H0 : b1 = b2 = b3 (la race choisie n’ a pas d’influence sur la quantité de lait produite) contre H1 : э(k, k’) / bk ≠bk’ (la race choisie a une influence sur la quantité de lait produite). La région critique du test est: Wα= {Yik /Fcalculé>Fthéorique } On rejette l’hypothèse nulle si Fcalculé>Fthéorique c’est – dire si p-value = P (Fcalculé>Fthéorique) < α Estimateurs а* =ȳ ; bk* = ȳk –ȳ; uik* = yik - ȳk Analyse de la variance_ITS3/ENSAE-Sénégal/2011

I.2. Traitement et Résultats Le traitement des données se fait sous le logiciel STATA et on prendra pour seuil α = 0.05. Test d’ANOVA 1 Procédure Analyse de la variance_ITS3/ENSAE-Sénégal/2011

On peut également utiliser la commande anova. Syntaxe: anova lait race Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Number of obs=34 R- squared = 0.9481 Résultats . anova lait race Number of obs=34 R- squared = 0.9481 Root MSE = 1.10881 Adj R- squared =0.9448 Commentaire: La p- value (0.0000) est inférieure à 0.05. On rejette donc l’hypothèse H0 c’est- à- dire que la race a une influence sur la quantité de lait produite. Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Regress (Estimation des paramètres du modèle) Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test de normalité des résidus On peut aussi utiliser la commande sktest Syntaxe: sktest lait race Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Skewness/kurtosis tests for normality Résultats Skewness/kurtosis tests for normality Commentaire: La probabilité de rejeter l’hypothèse de normalité des résidus est de 0.3480. On admet alors que les résidus suivent une loi normale centrée. Remarque: A partir de la commande ttest on peut vérifier que la moyenne des résidus est nulle. Syntaxe : ttest residu2 ==0, level (95) Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test d’homoscédasticité La commande utilisée pour ce test est hettest Syntaxe: hettest residu1 Résultats Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test d’égalité des variances Commentaire: Prob > Chi2 = 0.8437 est supérieure à 0.05. On accepte donc H0(C’est – à dire les erreurs sont homocédastiques) Test d’égalité des variances On peut directement utiliser la commande oneway Syntaxe: oneway lait race Résultats: Analysis of variance Analyse de la variance_ITS3/ENSAE-Sénégal/2011

II. ANALYSE DE LA VARIANCE A FACTEURS (ANOVA 2) L’Eleveur de Podor pense que le type d’exploitation peut aussi avoir une influence sur la quantité de lait produite. On considérera dans ce cas deux modèles selon l’existence ou non d’interaction entre la race et le type d’exploitation. II.1. Modèle sans interactions Le modèle s’écrit: Yijk = a + bj +Ck+Uijk où Ck est l’effet spécifique lié au type d’exploitation. Test d’anova On utilise la commande anova Syntaxe: anova lait race exploita Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Résultats Ce tableau représente le tableau d’analyse de la variance On utilise ensuite la commande regress pour estimer les paramètres. Syntaxe: regress Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Résultats Après les estimations du modèle, on extrait les résidus. Syntaxe: predictresidu, resid Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test de normalité des variances Syntaxe: sktest residu2 Résultats Commentaire: On rémarque que Prob > chi2 = 0.2808 est supérieur à 0.05. Donc on accepte l’hypothèse de normalité des résidus. Après la récupération des résidus, il sera question de tester si la moyenne des résidus est nulle; ensuite tester sur l’omission des variables explicatives pertinentes et en fin faire le test d’homoscédasticité. Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Résultats Analyse de la variance_ITS3/ENSAE-Sénégal/2011

II.2. Modèle avec interactions Le modèle s’écrit: Yijk = a + bj + ck + djk +Uijk où: a = Effet commun au niveau de production de toutes les vaches; bj = Effet spécifique lié à la race ck = Effet spécifique lié au type d’exploitation; d jk= Effet d’interaction entre le type d’exploitation et la race; Yijk = Quantité de lait produite de la vache i appartenant à la race j et au type d’exploitation k. Uijk = Effet perturbateur lié au niveau de production de lait. Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test d’ANOVA D’après les résultats ((Prob >F)=0.0006), on peut conclure qu’il existe un effet d’interaction entre la race et le type d’exploitation Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Regress (Estimation des paramètres du modèle) Les résultats sont présentés dans le tableau ci-dessous Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test de normalité des résidus L’hypothèse de normalité est vérifiée car (prob > chi2) = 0,0510 > 5% Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test sur la nullité de la moyenne des résidus A 99% la moyenne des résidus se situe entre -0,34 et +0,34, c’est –à dire on accepte l’hypothèse selon laquelle la moyenne des résidus est nulle. Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test d’omission de variables explicatives pertinentes Comme (Prob > F)=0,0006 < 5%, donc des variables explicatives ont été omises Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Test d’homoscédasticité Au vu de cet échantillon on ne peut pas conclure à l’égalité des variances des résidus. Analyse de la variance_ITS3/ENSAE-Sénégal/2011

CONCLUSION L’Analyse de la variance utilisée pour expliquer la production de lait par la race(ANOVA1) et en plus des exploitations (ANOVA2) nous permet de tirer les conclusions suivantes: L’ANOVA1 a permis de montrer que 94.81% de la production de lait peut être expliquée par les types de race. Pour l’ANOVA 2 sans interactions, on a vu que l’introduction de la variable exploitation a permis de mieux expliquer la production journalière de lait. Pour l’ANOVA2 avec interaction on constate que la production journalière est encore mieux expliquée par la race, les types d’exploitation et l’interaction entre les deux facteurs. Analyse de la variance_ITS3/ENSAE-Sénégal/2011

Cours d’Analyse de la variance, ITS3, ENSAE-Sénégal 2011 BIBILOGRAPHIE Cours d’Analyse de la variance, ITS3, ENSAE-Sénégal 2011 Doucouré Fodiyé Bakary, Introduction à l’économétrie, Edition Arima Manuel d’initiation à STATA(version8), Auteur Kangin KPODAR Manuel d’utilisation de STATA(version7), Auteurs V. LAUWERS, P. GROCLAUDE, M. WHITE-KONING Analyse de la variance_ITS3/ENSAE-Sénégal/2011