Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

ANOVA à un facteur (Rehailia)
Test statistique : principe
Comparaison de deux moyennes observées
Comparaison de plusieurs moyennes observées
Comparaison de plusieurs moyennes Analyse de variance
Comparaison de plusieurs moyennes Analyse de variance
Tests de comparaison de moyennes
Régression linéaire simple
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
L’analyse de variance.
Méthodes de Biostatistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Howell Chap. 11: ANOVA. Du monde connu au monde inconnu Du test t à l’analyse de varianceDu test t à l’analyse de variance Trouvez des nouveaux noms pour.
M2 Sciences des Procédés - Sciences des Aliments
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Outils Statistiques Damien Van Gysel CHU de Nice
Chapitre 6. Introduction à l’échantillonnage Les sondages Notions fondamentales Fluctuations d’échantillonnage d’une moyenne Théorème central limite C6-1.
Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
Notions de statistiques et d’analyse de données
Et maintenant, le mode : fastoche !
Suites ordonnées ou mettre de l’ordre
Corrélation et régression linéaire simple
Chapitre 1 Généralités sur les données
Statistiques descriptives univariées
Valeurs de toutes les différences observables sous H0
Les distributions en classes
Comparaison de deux pourcentages.
Élection québécoise du 2 décembre 1881.
Chapitre 1 Généralités sur les données
Loi Normale (Laplace-Gauss)
LES FRACTIONS Dans ce diaporama, nous allons revoir comment:
Présentation de l'objectif
Cours 8 Stat IV: Khi2 Désign experimental. BIO 3500 – Hiver 2017
et discussion de l'article 2
Technologies de l’intelligence d’affaires Séance 12
Révision et preparation à l’examen
Risque d’erreur de 1ère espèce : α
4.3 Estimation d’une proportion
Les modèles linéaires (Generalized Linear Models, GLM)
4.5 Tests D’hypothèses sur une proportion
L’I NSTRUCTION DE T EST A LTERNATIF Réalisé par : OUZEGGANE Redouane Département de Technologie Faculté de Technologie – Université A.Mira, Bejaia Année.
Statistiques industrielles – Exemple d’application
4.4 Tests D’hypothèses sur une moyenne
Méthode Taguchy Analyse de la variance Anavar
4.2 Estimation d’une moyenne
Introduction aux statistiques Intervalles de confiance
Statistique. Probabilite ou risque Le risque c’est le pourcentage des valeurs qu’on neglige plus le risqué augmente plus on neglige des valeurs Hypothese.
Statistique Cours #2 et #3 Avons-nous des conditions gagnantes? Prise de décision à partir d’inférence.
Analyse de la variance et de la covariance Analyse de la variance à 1 facteur ANOVA à 2 facteurs Conditions d’utilisation.
POL1803: Analyse des techniques quantitatives
© 2005, Michel Cloutier La gestion des stocks – La gestion de l’incertitude Calcul du stock de sécurité.
Fluctuations d’une fréquence selon les échantillons, Probabilités
Rappel (3): les étapes des tests statistiques
Chapitre 4: Caractéristiques de dispersion
On lance 100 fois de suite une pièce de monnaie.
Master spécialisé sciences de l ’ environnement en milieu urbain : EER  Etude statistique du Lake d ’ Everglades - ASSAKRAR M ’ HAND - BENBAASID HICHAM.
Programme d’appui à la gestion publique et aux statistiques
Utiliser le modèle log-linéaire pour mettre au jour la structure du lien entre les deux variables d’un tableau de contingence : un exemple d’application.
Matrices.
Les méthodes quantitatives en éducation
Tests d’hypothèses paramétriques 1 Cours Statistiques Chapitre 9.
Impact Evaluation 4 Peace March 2014, Lisbon, Portugal 1 Echantillonage pour une Evaluation d’Impact Latin America and the Caribbean’s Citizen Security.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Transcription de la présentation:

Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)

On compare  Une variable quantitative,  Une variable qualitative ( plus de 2 catégories – vrai aussi pour 2 catégories) Exemple : Impact du niveau d’instruction (variable qualitative ordinale) sur le revenu (variable quantitative). …On conclura, sous certaines conditions, qu’il existe une relation si les moyennes de revenus des gens ne sont pas les mêmes dans les différentes catégories

Primaire.Secondaire.1er cycle.> 1er cycle Prim.Second.1er cycle. > 1er cycle. Salaire à 10 ans en milliers d' € r

Les différences sont-elles causées par des erreurs d’échantillonnage ou reflètent-elles aussi des différences réelles dans les quatre populations. Hypothèse nulle : Les moyennes de revenus entre les groupes sont égales. (« proviennent de la même population ») Hypothèse alternative : elles sont différentes

Deux conditions pour conclure que les moyennes dans les populations sont différentes. Plus les différences entre les moyennes d’échantillon sont grandes, plus il est probable que les différences entre les moyennes des populations sont réelles. Dans le langage de l’analyse de variance cela signifie que : plus la variance entre les moyennes de groupes est grande, plus la probabilité est forte que les différences entre les moyennes de populations existent. D’autre part, on sera plus confiant que les différences entre les moyennes de populations sont réelles si la variation autour de ces moyennes est petite. Dans le langage de l’analyse de variance, cela revient à dire que plus la variance autour des moyennes de groupes est petite, plus la probabilité est forte que les différences entre les moyennes de populations existent.

Calcul variance inter et intra groupe (1) Calculons la variance intergroupe et la variance intragroupe. Imaginons que nous prenons 20 observations aléatoires (x 1, x 2,..., x 20 ) de la même population statistique de moyenne théorique 5.0 et l'écart type de 20. Ensuite, nous calculons la variance entre ces 20 observations: Variance totale: ou n=20

Anova (2) Ici, S 2 totale représente la variance de toutes les observations ("la grande variance") Maintenant, nous divisons nos 20 observations au hasard dans 4 groupes de 5 observations. Puisque toutes ces observations viennent de la même population statistique normale avec un seul  et un seul , les différences entre la variance mesurée à l’intérieur de chaque groupe sont dues seulement aux fluctuations d’échantillonnage. La variation entre les estimations des moyennes de chaque groupe est aussi due aux mêmes fluctuations d’échantillonnage. Le test de « F » est basé sur le fait que ces deux sortes de variances seront égales, sauf pour les fluctuations d’échantillonnage.

Anova (3) Pour mesurer ces deux sortes de variance, il faut décomposer la variance totale en variance intragroupe (à l’intérieur des groupes) et variance intergroupe (la variance entre les groupes). Décomposition de la variance totale Nous allons décomposer la variance totale en deux parties: une variance due aux différences à l'intérieur de chaque groupe (VARIANCE INTRAGROUPE) et une variance due aux différences entre les quatre moyennes des quatre groupes (VARIANCE INTERGROUPE).

VARIANCE INTRAGROUPE ou variance résiduelle 1 Ceci est la variation des observations dans chaque groupe autour de la moyenne de chaque groupe. Si nous voulions calculer ces variances indépendamment pour chaque groupe, nous pourrions calculer: groupe 1: groupe 2: groupe 3: groupe 4:

VARIANCE INTRAGROUPE ou variance résiduelle 2 Puisque nous voulons calculer la variance intragroupe simultanée, il faut utiliser la formule suivante: k= nombre de groupes On calcule les degrés de liberté pour la variance intragroupe qui est n-k.

VARIANCE INTERGROUPE La variance des moyennes de chaque groupe autour de la moyenne de toutes les observations ensemble. Ceci est la variance totale que nous aurions eu si la variance intragroupe était zéro. Les degrés de liberté pour la variance intergroupe sont k-1. Si les observations dans les différents groupes viennent toutes de la même population statistique, la variance intragroupe égale la variance intergroupe. Le ratio de ces deux variances (F) suit une distribution de Fisher, avec une moyenne théorique de 1.

Passage aux variances intra groupes et inter groupes N = nombre total d’observations k = nombre de catégories

Le test F : Hypothèse nulle : Les moyennes de revenus entre les groupes sont égales. Plus CMG est grand et CME petit, plus on aura tendance à penser que les moyennes de populations ne sont pas égales. F = Var inter / Var intra

F = variance intergroupe/ variance intra ou résiduelle On peut consulter la table des valeurs théoriques de F de Fisher. Degrés de liberté du numérateur: k-1 Degrés de liberté du dénominateur: N –k On peut de manière équivalente tester l’existence de la relation entre les deux variables en examinant la valeur p correspondant à F. Si cette valeur p est inférieure à 0,05, on rejette l'hypothèse nulle et on conclut que la relation existe..