et discussion de l'article 2

Slides:



Advertisements
Présentations similaires
ANOVA à un facteur (Rehailia)
Advertisements

Comparaison de deux moyennes observées
Comparaison de plusieurs moyennes observées
Tests de comparaison de pourcentages
Comparaison de plusieurs moyennes Analyse de variance
Tests de comparaison de moyennes
M2 Sciences des Procédés - Sciences des Aliments
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Introduction aux statistiques Intervalles de confiance
Outils Statistiques Damien Van Gysel CHU de Nice
Auteur : Patrice LEPISSIER Les probabilités  Notions de base Notions de base  Variable aléatoire Variable aléatoire  La loi Normale La loi Normale.
Chapitre 4: Variation dans le temps  Les données : audience totale en milliers (tableau 4.1, p. 47, extrait) o Origine : enquête sur les habitudes d’écoute.
Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)
Chapitre 6. Introduction à l’échantillonnage Les sondages Notions fondamentales Fluctuations d’échantillonnage d’une moyenne Théorème central limite C6-1.
Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
Suites ordonnées ou mettre de l’ordre
Corrélation et régression linéaire simple
Chapitre 4: Variation dans le temps
Outils de Recherche Opérationnelle en Génie MTH 8414
Statistiques descriptives univariées
Valeurs de toutes les différences observables sous H0
Deuxième partie : La courbe d’indifférence
Comparaison de deux pourcentages.
Chapitre 4: Variation dans le temps
Roberta Biava et Miguel Angel Gomez Rodriguez
4°) Intervalle de fluctuation :
Mesures de Variation, Coefficient Multiplicateur, Taux de Variation
chapitre : Les Probabilités
La Conclusion.
Plans d’expériences: Plans de mélanges
Cours 8 Stat IV: Khi2 Désign experimental. BIO 3500 – Hiver 2017
Technologies de l’intelligence d’affaires Séance 11
Cours 9 Autres types de Statistiques. Article 4 BIO 3500 – Hiver 2017
Technologies de l’intelligence d’affaires Séance 12
Révision et preparation à l’examen
Risque d’erreur de 1ère espèce : α
L’I NSTRUCTION DE T EST A LTERNATIF Réalisé par : OUZEGGANE Redouane Département de Technologie Faculté de Technologie – Université A.Mira, Bejaia Année.
Statistiques industrielles – Exemple d’application
4.4 Tests D’hypothèses sur une moyenne
3.3 loi discrète 1 cours 14.
Méthode Taguchy Analyse de la variance Anavar
4.2 Estimation d’une moyenne
La méthode du simplexe. 1) Algorithme du simplexe  Cet algorithme permet de déterminer la solution optimale, si elle existe, d’un problème de programmation.
Introduction aux statistiques Intervalles de confiance
Statistique. Probabilite ou risque Le risque c’est le pourcentage des valeurs qu’on neglige plus le risqué augmente plus on neglige des valeurs Hypothese.
Analyse de la variance et de la covariance Analyse de la variance à 1 facteur ANOVA à 2 facteurs Conditions d’utilisation.
Statistiques. Moyenne, Moyenne pondérée, Tableur et graphiques.
POL1803: Analyse des techniques quantitatives
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
 1____Probabilité  2______variables aléatoires discrètes et continues  3______loi de probabilités d’une v a  4_______les moyens et les moyens centraux.
Apports de la statistique spatialisée
Calcul de probabilités
Rappel (3): les étapes des tests statistiques
2.4 La loi de vitesse d’une réaction chimique
Test 2.
La puissance du transfert d’énergie électrique entre un générateur et un circuit constitué de conducteurs ohmiques dépend-elle de ces conducteurs ohmiques.
On lance 100 fois de suite une pièce de monnaie.
Position, dispersion, forme
Les erreurs de mesure Projet d’Appui au renforcement des capacités
Programme d’appui à la gestion publique et aux statistiques
PROGRAMMATION SCIENTIFIQUE EN C
Les méthodes quantitatives en éducation
Tests d’hypothèses paramétriques 1 Cours Statistiques Chapitre 9.
Impact Evaluation 4 Peace March 2014, Lisbon, Portugal 1 Echantillonage pour une Evaluation d’Impact Latin America and the Caribbean’s Citizen Security.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
TD Comment les économistes, les sociologues et les politistes travaillent-ils et raisonnent-ils ? M. Osenda.
Outils de Recherche Opérationnelle en Génie MTH 8414
Transcription de la présentation:

et discussion de l'article 2 Cours 5 Analyse de variance et discussion de l'article 2 6 février BIO 3500 – Hiver 2017

Préambule Que signifie α?

Préambule Que signifie p? La probabilité que H0 soit vrai si on rejette H0 Autrement dit: la probabilité de se tromper en rejetant H0

Préambule Deux types d’erreurs lors d’une décision statistique Réalité (inconnu) Décision Ho vrai Ho fausse Rejet de Ho Erreur de première espèce (type I) P=α Décision correcte Puissance statistique Non-rejet de Ho Décision correcte P=1- α Erreur de seconde espèce (type II) Deux types d’erreurs lors d’une décision statistique

Préambule Si la valeur de p est supérieure à α, on rejette ou on ne rejette pas H0?

Préambule Si la valeur de p est supérieure à α, on rejette ou on ne rejette pas H0? On rejette!

Préambule Lorsqu’on pose une hypothèse, la partie mathématique doit être écrite: H0: μ1=μ2 H1: μ1≠μ2 pas ->H0: x1=x2 et H1: x1≠x2 Pourquoi à votre avis?

Préambule Lorsqu’on pose une hypothèse, la partie mathématique doit être écrite: H0: μ1=μ2 H1: μ1≠μ2 pas ->H0: x1=x2 et H1: x1≠x2 Pourquoi à votre avis? On veut inférer l’état de la population! On sait déjà si nos échantillons diffèrent.

Préambule Des questions sur le test de t et les autres éléments du cours?

Plan Discussion de l'article #2 ANOVA

Article # 2 Cézilly, F. and Boyd, V. 1989. Ajustement postural et capture des proies chez l'aigrette garzette, Egretta garzetta. Revue d'Écologie : Terre et Vie, 44(1), 95- 102.

Article # 2: Intro Difficulté de mesurer le fitness : Dans bien des cas, on veut déterminer ce qui est le mieux… mais mesurer la survie de la descendance, c’est un grand défi! Utilisation de proxy , ex: croissance

Article # 2: Intro Optimal foraging theory: Les animaux devraient théoriquement maximiser le gain en énergie/temps

Discussion de l’article En groupe de 3-4, 20-30 minutes: Questions sur le contenu de l’article Quelle est la question de recherche? En quoi est-elle différente de ce qui a été fait avant? Formulez les hypothèses pour les tests de t. Quel type de test de t? C’était le bon choix? Unilatéral ou bilatéral? Les résultats? On rejette H0? Quelles sont les réponses obtenues? Avez-vous trouvé l’article bien écrit? Qu’est-ce que vous n’avez pas compris? Des points qui pourraient remettre les résultats en cause?

Pour le 20 février Nous discuterons l'article #3 Vous devez lire l'article #3 attentivement. Pour chacune des sections suivantes, donnez quelques critiques positives ou négatives par rapport à ce que l'on a vu à propos de la FONCTION de chaque partie d'un article de recherche en faisant directement référence au contenu de l'article #3. Titre Résumé Introduction Méthodes Résultats Discussion

Plan Discussion de l'article #2 ANOVA

ANOVA Analyse de variance

Comparaison de moyennes Test de t pour comparer deux moyennes Analyse de variance ou ANOVA (de l’anglais analysis of variance) pour comparer plusieurs moyennes

Comparaison de moyennes Pourquoi ne pas faire pleins de tests de t pensez- vous? ex. 4 groupes -> 6 tests t

Comparaison de moyennes Pourquoi ne pas faire pleins de tests de t pensez- vous? ex. 4 groupes -> 6 tests t Ces comparaisons ne sont pas indépendantes. Si X1=X2 et X3>X1, alors probablement que X3>X1. L’erreur alpha augmente avec le nombre de comparaisons: 1-(1-alpha)c, où c=nbr de comparaisons

Comparaison de moyennes Une comparaison entre 2 groupes à un seuil alpha 0.05 donne une erreur alpha de 0.05 Une seconde comparaison dans le même échantillon occasionne une seconde erreur de 0.05, etc... Donc l’erreur augmente. ex: Pour 3 tests, alpha=1-(1-alpha)c=1-(1-0.05)3=0.143

Comparaison de moyennes Taux d’erreur pour un ensemble de comparaisons: α= Erreur réelle α= α= Nombre de comparaisons

L’ANOVA et le test t Lorsqu’il n’y a que deux moyennes à comparer, les deux tests s’appliquent également On trouvera qu’ils produisent la même probabilité et que la statistique F = la statistique t2 L’ANOVA utilise la loi de Fisher (distribution F) comme distribution des probabilités au lieu de la distribution de t.

L’analyse de variance H0: les moyennes sont égales H1: au moins une moyenne diffère des autres moyennes À noter: l’analyse de variance ne permet pas de distinguer qu’elle(s) moyenne(s) diffèrent des autres. Il faut faire un test à postériori pour les identifier (test post hoc).

L’analyse de variance Fonctionnement: Rapport de la variance intergroupe et de la variance intragroupe Variance inter: effet de traitement Variance intra: terme d’erreur, variance non expliquée L’analyse vérifie si la variance entre les moyennes est supérieure à la variance à l’intérieur de chaque variable.

L’analyse de variance

L’analyse de variance

L’analyse de variance

L’analyse de variance Variabilité intra Variabilité inter

ANOVA (exemple) Question: Est-ce que dormir 4h, 6h ou 8h avant un examen influence le résultat obtenu? H0: ? H1: ?

ANOVA (exemple) Question: Est-ce que dormir 4h, 6h ou 8h avant un examen influence le résultat obtenu? H0: La durée du sommeil n’influence pas les résultats aux examens: μ4h=μ6h=μ8h H1: La durée du sommeil influence les résultats aux examens: μi≠μj (au moins une moyenne diffère des autres)

ANOVA (exemple) k groupes 4h 3 2 1 6h 5 4 3 8h 7 6 5 N observations (9)

ANOVA (exemple) k groupes 4h 3 2 1 6/3 6h 5 4 3 12/3 8h 7 6 5 18/3 N observations (9) X = X = moyenne globale = (3+2+1+5+4+3+7+6+5) / 9 = 4

ANOVA (exemple) k groupes 4h 3 2 1 6h 5 4 3 8h 7 6 5 N observations (9) X = 4 X =   totale

ANOVA (exemple) k groupes 4h 3 2 1 6h 5 4 3 8h 7 6 5 N observations (9) X = 4 X =  

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 N observations (9) X = 4 X =  

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 N observations (9) X = 4 X =  

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 N observations (9) X = 4 X =  

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 SSW= 6 6 N observations (9) X = 4 X =  

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 SSW= 6 6 N observations (9) X = 4 X =  

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 SSW= 6 6 N observations (9) X = 4 X =  

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 SSW= 6 6 SSB= 24 2 N observations (9) X = 4 X =  

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 SSW= 6 6 SSB= 24 2 N observations (9) X = 4 X = SST = SSW + SSB Variance totale = variance intra + variance inter ddl total = ddl intra + ddl inter

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 SSW= 6 6 SSB= 24 2 N observations (9) X = 4 X = statistique F = variance inter = SSB/(k-1) = 24/2 =12 variance intra SSW/(N-k) 6/6 F(2,6)=12 -> p=0.008 On rejette?

ANOVA (exemple) k groupes ddl 4h 3 2 1 6h 5 4 3 8h 7 6 5 SST = 30 8 SSW= 6 6 SSB= 24 2 N observations (9) X = 4 X = statistique F = variance inter = SSB/(k-1) = 24/2 =12 variance intra SSW/(N-k) 6/6 F(2,6)=12 -> p=0.008 On rejette? Oui!

Calculs pour l’analyse de variance Autrement dit: Il s’agit de diviser la variance des moyennes par la variance à l’intérieur des moyennes

ANOVA (exemple) S’il y a k moyennes à comparer basées sur un total de N observations, alors les degrés de libertés sont: k-1 pour le numérateur N-k pour le dénominateur.

La loi de Fisher (distribution F)

L’analyse de variance alpha=0.05, F(k-1, n-k) critique

L’analyse de variance Énoncer les hypothèses nulles et alternatives Calculer la moyenne pour chaque groupe et la moyenne globale Calculer la variance entre les moyennes (intergroupe) Calculer la variance à l’intérieur des groupes Diviser la variance inter par la variance intra pour obtenir une valeur de F Comparer la valeur de F avec la valeur critique Conclure

Un autre exemple Vous avez semé trois variétés de carottes dans votre jardin ce printemps. Laquelle a produit les plus lourdes carottes ? Votre échantillon vous donne (en gramme par carotte): Variété A: 43, 47, 50, 53, 57 Variété B: 42, 50, 56, 60 Variété C: 32, 40, 45

Résultat de l’analyse ANOVA Source des variations Somme des carrés Dégrés de liberté Moyenne des carrés F Probabilité Entre Groupes 326,917 2 163,4583 3,8112 0,0632 A l'intérieur des groupes 386 9 42,89 Total 712,917 11  

Résultat de l’analyse Degrés de liberté? Variété A: 43, 47, 50, 53, 57 ANOVA Source des variations Somme des carrés Dégrés de liberté Moyenne des carrés F Probabilité Entre Groupes 326,917 2 163,4583 3,8112 0,0632 A l'intérieur des groupes 386 9 42,89 Total 712,917 11   Degrés de liberté? Variété A: 43, 47, 50, 53, 57 Variété B: 42, 50, 56, 60 Variété C: 32, 40, 45 ? ? ?

Résultat de l’analyse Conclusion ??? ANOVA Source des variations Somme des carrés Dégrés de liberté Moyenne des carrés F Probabilité Entre Groupes 326,917 2 163,4583 3,8112 0,0632 A l'intérieur des groupes 386 9 42,89 Total 712,917 11   Conclusion ???

Conclusion Il n’y a pas une forte évidence que les carottes d’une variété diffèrent de celles des autres. Il est possible que le test manque de puissance car l’effectif est petit. Réalité (inconnu) Décision Ho vrai Ho fausse Rejet de Ho Erreur de première espèce (type I) P=α Décision correcte Puissance statistique Non-rejet de Ho Décision correcte P=1- α Erreur de seconde espèce (type II)

La distribution de F est influencée par la variance des échantillons ! Plus la variance dans les groupes est élevée, plus le dénominateur sera grand -> plus f sera petit -> plus p sera élevé

Test post-hoc Si l’ANOVA est significative, on peut dire: H0: les moyennes sont égales H1: au moins une moyenne diffère des autres moyennes

Test post-hoc Pour determiner quelle(s) moyenne(s) diffère(nt) Test de Tuckey (en anglais Tuckey’s HSD pour: honest significance test) Compare chaque paire, mais en corrigeant l’erreur alpha afin d’obtenir un alpha global desiré. Autrement dit, chaque test se fait à un alpha plus faible que le alpha global afin de compenser pour la propagation des erreurs

Test post-hoc Pour determiner quelle(s) moyenne(s) diffère(nt) Test de Tuckey : Résultats Les groupes A et B ne diffèrent pas. Les groupes B et C non plus. A et C diffèrent. A, B et C diffèrent de D et E. Groupe A Groupe B Groupe C Groupe D Groupe E A B C

En équipe Développez pour l’ANOVA. 1 question Les hypothèses Les données à récoltées Les variables, leur types