ANOVA : introduction.

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
Ma surprise du Zoo.
[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Vocabulaire 6.2 Français II Bon voyage ! 1.
Licence pro MPCQ : Cours
Distance inter-locuteur
1. ami 2. compagnon 3. amant 4. frère 5. père 6. maître 7. éducateur 8
Les numéros
Les identités remarquables
Les Prepositions.
Comparaison de plusieurs moyennes observées
Sirop de Liège « industriel »
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
2 1. Vos droits en tant quusagers 3 1. Vos droits en tant quusagers (suite) 4.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
Écrit, animé et illustré par Sheila CartwrightTraduit par
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
1 Choisir une catégorie. Vous recevrez la réponse, vous devez donner la question. Cliquez pour commencer.
Cours de physique générale I Ph 11
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
PM18 MONTAGE DU BLINDAGE AUTOUR DE LA QRL F. DELSAUX - 25 JAN 2005
Le Concours de Conaissance Francais I novembre 2012.
Titre : Implémentation des éléments finis sous Matlab
1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.
Problème Autre formulation :
LES NOMBRES PREMIERS ET COMPOSÉS
Comment rendre une femme heureuse…
Stat-infoCM4a : 1 Changement de groupe TD Lebossé Olivier  8h00 : M105 Charbonnier Guillaume ?  8h00 : M105.
Logiciel gratuit à télécharger à cette adresse :
1 INETOP
1 Délégation FSA 2008: Cycle de formations prédépart __ Quest-ce que la mondialisation ?
Calculs et écritures fractionnaires
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
Systèmes mécaniques et électriques
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
1 10 pt 15 pt 20 pt 25 pt 5 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Les fonctions.
Titre : Implémentation des éléments finis en Matlab
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Aire d’une figure par encadrement
Équipe 2626 Octobre 2011 Jean Lavoie ing. M.Sc.A.
Les groupes.
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
Régression linéaire.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
* Source : Étude sur la consommation de la Commission européenne, indicateur de GfK Anticipations.
Vous allez voir des nombres sur la diapositive suivante. Il faudra bien les observer et les garder en mémoire. Vous devrez les écrire sur l’ardoise quand.
Equation différentielle de 2ème ordre
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE EXPÉRIENCE DE SOINS DES ANGLOPHONES DE LA MONTÉRÉGIE Direction de santé publique Surveillance.
Exercice de vérification 1 p
Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.
Les Chiffres Prêts?
Les parties du corps By Haru Mehra Le Frehindi 1Haru Mehra, DELF, DALF,CFP.
Problème Autre formulation :
1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.
1 Licence Stat-info CM4a 2004 V2Christophe Genolini Égalité des variances Une des conditions pour utiliser T est l’égalité des variances s APA  s MS On.
Transcription de la présentation:

ANOVA : introduction

Définition L’ ANOVA est l’analyse des variances. La comparaison des variances nous dira si les moyennes sont significativement différentes

Problème On cherche a détecter d’un phénomène particulier : Flûtiste exceptionnelle ou moyenne Groupe de TD super bon Caillou dans la mer

Flûtiste Silence Cécile seule Les autres sans Cécile Cécile avec les autres

Quiz : je mélange…

Quiz : je mélange… Ultra facile : Silence Trop facile : Cécile seule Ben… Heu…

Pourquoi ? Ici, la variance est de 0,5 La variance ici est nulle C’est une grosse différence. Elle EST significative Ici, la variance ici est 17,43 Ici, la variance est de 17,93 Entre 17,43 et 17,93 la différence N’EST PAS significative

Intuitivement Vinter (Variance Inter) est la variance que l’on cherche à détecter. Vintra (Variance Intra) est le « bruit », la variabilité du au hasard (variabilité biologique)

Intuitivement On détecte la flûte ou son absence Vintra = 0 Vinter = 0,5 On détecte l’orchestre mais la flûte seule est impossible à entendre Vintra = 17,43 Vinter = 0,5

Formulation du problème On dispose de plusieurs groupes de donnée (ici, des bandes sonores). On cherche à détecter quelque chose (ici, la flûte) Pour le savoir, on calcule Vintra et Vinter Vintra mesure la variabilité biologique (ici, le bruit) Vinter mesure ce que l’on cherche vraiment (ici, la flûte) Si Vinter est grand devant Vintra, on a détecté quelque chose. Si Vinter est petit devant Vintra, la variabilité biologique est trop forte, elle empêche toute détection.

La flûte Vintra = 0 Vinter = 0,5 On détecte la présence d’une flûte dans le groupe 2 Vintra = 17,43 Vinter = 0,5 On ne détecte pas la présence de la flûte dans le groupe 2

Décomposition en facteurs

Autre approche : Mini QCM La note de l’élève 2 groupe 1 (Yvon) est 19. Pourquoi ?

Étude de la note d’Yvon La moyenne générale est de 12. Yvon a +7 par rapport à la moyenne générale La moyenne de groupe 1 est de 15 Yvon a +4 par rapport à la moyenne du groupe 1 Le groupe 1 a +3 par rapport à la moyenne générale

(sa variabilité biologique : Étude de la note d’Yvon On peut donc « expliquer » la note d’Yvon comme 19 = 12 + 3 + 4 Particularité d’Yvon (sa variabilité biologique : Yvon est plutôt bon) Note d’Yvon Moyenne générale (contrôle facile) Effet du groupe 1 (super prof)

Étude de la note de Justin Justin, élève 4 groupe 1 à 14 On peut donc « expliquer » la note de Justin : 14 = 12 + 3 - 1 Note de Justin Particularité de Justin Moyenne générale (contrôle facile) Effet du groupe 1 (super prof)

Étude de la note de Gaston Gaston, élève 7 groupe 3 à 13 On peut donc « expliquer » la note de Gaston : 13 = 12 - 3 + 4 Note de Gaston Particularité de Gaston Moyenne générale (contrôle facile) Effet du groupe 3 (prof pas terrible)

Formalisation On peut donc « expliquer » la note d’Yvon comme 19 = 12 + 3 + 4 Variabilité personnelle, à l’intérieur du groupe Note Moyenne générale Variabilité entre les groupes

Que cherche-t-on ? La variabilité personnelle dépend de nombreux facteurs On ne peut pas l’expliquer. C’est la variabilité entre groupes qui nous intéresse ici Si les groupes ont des moyennes significativement différentes, on pourra ensuite examiner des causes éventuelles : différences entre les profs, meilleur matériel, meilleur emploi du temps…

Formellement

H0 Hypothèse H0 : il n’y a pas de différence entre les groupes. Ils ont même moyenne et même variance On ne s’intéresse pas au groupe mais aux populations qu’ils représentent : on travaille avec 

Calcul de Vintra Notations k est le nombre de groupe (ici, k=3) n est le nombre d’élève dans chaque groupe (n=9) N est le nombre total d’élève (N=27) i2 est la variance du groupe i (12=1,5) Xi est la moyenne du groupe i (X1=15) X est la moyenne générale (X=12)

Calcul de Vintra La variance d’un groupe représente son hétérogénéité ou sa variabilité biologique interne. Vintra est la variabilité biologique interne de tous les groupe (le « bruit » global). Pour l’évaluer, on prend simplement la moyenne des variances des groupes :

Les clones sont parmi nous… Si on travaillait sur des « clones » (aucune différence entre les individus d’un groupe), il n’y aurait aucune variance à l’intérieur des groupes :

Calcul de Vinter La moyenne d’un groupe est une mesure du niveau moyen du groupe. Vinter est la variabilité entre les groupes. Pour l’évaluer, on prend simplement la variance des moyennes multipliés par l’effectif :

Calcul pratique (réveil !!!)

Des clones partout Les profs et les élèves sont des clones : Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes

Retour au problème Y a-t-il des différences entre les groupes ?

Retour au problème Y a-t-il des différences entre les groupes ? Vinter = 0 La réponse est trivialement non !

Retour au problème Y a-t-il des différences entre les groupes ? Vinter = 0 La réponse est trivialement non car Vinter=0 indique l’égalité entre les moyennes des groupes Les profs et les élèves sont des clones : Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes

Retour au problème Y a-t-il des différences entre les groupes ?

Retour au problème Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection…

Retour au problème Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection… Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Pas de bruit Détection possible

Retour au problème Y a-t-il des différences entre les groupes ?

Retour au problème Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0

Retour au problème Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0 Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes Trop de bruit Détection impossible

On utilise le test pour comparer les variances : Comment conclure ? Si Vinter=16 et Vintra=0 : on rejette H0 Si Vinter=0 et Vintra=22,4 : on rejette H0 Entre les deux, si Vinter=18 et Vintra=7 ? On utilise le test pour comparer les variances : le F de Fisher

F de Fisher

F de Fisher : comme d’hab On calcule le F observé On calcule la probabilité de F Autre méthode : lecture du F théorique sur une table Si FObs > FTh, la différence est significative, on rejette H0 Si FObs < FTh, la différence n’est pas significative, on ne rejette pas H0

Loi.F(Fobs,DDL dessous,DDL dessus) Calcul du F observé Puis la probabilité d’obtenir un tel F si SEULEMENT la variabilité biologique est en jeu est : Loi.F(Fobs,DDL dessous,DDL dessus)

Calcul des DDL V inter est une variance Son DDL est de le nombre de groupe moins 1 DDL inter=k-1 Vintra est la moyenne des variances Son DDL est la somme des DDL de chacun des groupes Chaque groupe a un DDL de n-1 DDL intra = n-1 + n-1 + … + n-1 = N-k

Exemple DDL inter = k-1 = 3-1 = 2 DDL intra = N-k = 27 – 3 = 24

Lecture du F théorique Cette fois-ci, on lit le F sur la table 5% (parce ce que on doit tester Vinter/Vintra, mais pas Vintra/Vinter FTh=3,40 FObs étant plus grand que FTh, on peut rejeter H0 : il existe une différence significative entre les moyennes

Risque 5% On veut savoir si Vinter/Vintra est grand On teste donc au risque 5% Pour la comparaison des variances, on voulait savoir si V1/V2 était grand OU si V2/V1 était grand. On devait donc tester V1/V2 au risque 2,5% et V2/V1 au risque 2,5% Grâce a une astuce, on avait qu’un seul des deux tests à faire, mais ca ne changeait rien au seuil

Groupes de taille variable

Vintra : Groupes de taille variable Rappel : pour les groupes de même taille : Vintra = moyenne des variances = Pour des groupes de taille variable : Vintra = moyenne des variances PONDEREE par les DDL : Si les k groupes ont la même taille n, les formules coïncident

Vinter : Groupes de taille variable Rappel : pour les groupes de même taille : Vinter = n x variances des moyennes = Pour des groupes de taille variable : Vinter = variances des moyennes PONDEREE par les tailles : Si les groupes ont la même taille n, les formules coïncident

Exemple : mini QCM

Conclusion L’hypothèse « toutes les moyennes sont les mêmes » est rejetée. toutes les moyennes ne sont pas les mêmes MAIS on ne sait pas ou sont les différences

Conclusion Les moyennes sont 10,2 ; 15,2 et 17,6 On sait qu’il existe au moins une différence significative. Entre 10,2 et 15,2 ? Entre 10,6 et 17,6 ? Entre 15,2 et 17,6 ?

Pour le savoir : T de Student… Rappel : pour comparer deux moyennes : Ici, au lieu de calculer la variance commune, on va utiliser Vintra

Pour le savoir : T de Student… DDL des 2 groupes = (11-1) + (7-1) = 16 T th = 2,120 La différence entre 10,2 et 15,2 N’est PAS significative