La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

ANOVA : introduction.

Présentations similaires


Présentation au sujet: "ANOVA : introduction."— Transcription de la présentation:

1 ANOVA : introduction

2 Définition L’ ANOVA est l’analyse des variances. La comparaison des variances nous dira si les moyennes sont significativement différentes

3 Problème On cherche a détecter d’un phénomène particulier :
Flûtiste exceptionnelle ou moyenne Groupe de TD super bon Caillou dans la mer

4 Flûtiste Silence Cécile seule Les autres sans Cécile
Cécile avec les autres

5 Quiz : je mélange…

6 Quiz : je mélange… Ultra facile : Silence Trop facile : Cécile seule
Ben… Heu…

7 Pourquoi ? Ici, la variance est de 0,5 La variance ici est nulle
C’est une grosse différence. Elle EST significative Ici, la variance ici est 17,43 Ici, la variance est de 17,93 Entre 17,43 et 17,93 la différence N’EST PAS significative

8 Intuitivement Vinter (Variance Inter) est la variance que l’on cherche à détecter. Vintra (Variance Intra) est le « bruit », la variabilité du au hasard (variabilité biologique)

9 Intuitivement On détecte la flûte ou son absence Vintra = 0
Vinter = 0,5 On détecte l’orchestre mais la flûte seule est impossible à entendre Vintra = 17,43 Vinter = 0,5

10 Formulation du problème
On dispose de plusieurs groupes de donnée (ici, des bandes sonores). On cherche à détecter quelque chose (ici, la flûte) Pour le savoir, on calcule Vintra et Vinter Vintra mesure la variabilité biologique (ici, le bruit) Vinter mesure ce que l’on cherche vraiment (ici, la flûte) Si Vinter est grand devant Vintra, on a détecté quelque chose. Si Vinter est petit devant Vintra, la variabilité biologique est trop forte, elle empêche toute détection.

11 La flûte Vintra = 0 Vinter = 0,5
On détecte la présence d’une flûte dans le groupe 2 Vintra = 17,43 Vinter = 0,5 On ne détecte pas la présence de la flûte dans le groupe 2

12 Décomposition en facteurs

13 Autre approche : Mini QCM
La note de l’élève 2 groupe 1 (Yvon) est 19. Pourquoi ?

14 Étude de la note d’Yvon La moyenne générale est de 12.
Yvon a +7 par rapport à la moyenne générale La moyenne de groupe 1 est de 15 Yvon a +4 par rapport à la moyenne du groupe 1 Le groupe 1 a +3 par rapport à la moyenne générale

15 (sa variabilité biologique :
Étude de la note d’Yvon On peut donc « expliquer » la note d’Yvon comme 19 = Particularité d’Yvon (sa variabilité biologique : Yvon est plutôt bon) Note d’Yvon Moyenne générale (contrôle facile) Effet du groupe 1 (super prof)

16 Étude de la note de Justin
Justin, élève 4 groupe 1 à 14 On peut donc « expliquer » la note de Justin : 14 = Note de Justin Particularité de Justin Moyenne générale (contrôle facile) Effet du groupe 1 (super prof)

17 Étude de la note de Gaston
Gaston, élève 7 groupe 3 à 13 On peut donc « expliquer » la note de Gaston : 13 = Note de Gaston Particularité de Gaston Moyenne générale (contrôle facile) Effet du groupe 3 (prof pas terrible)

18 Formalisation On peut donc « expliquer » la note d’Yvon comme
19 = Variabilité personnelle, à l’intérieur du groupe Note Moyenne générale Variabilité entre les groupes

19 Que cherche-t-on ? La variabilité personnelle dépend de nombreux facteurs On ne peut pas l’expliquer. C’est la variabilité entre groupes qui nous intéresse ici Si les groupes ont des moyennes significativement différentes, on pourra ensuite examiner des causes éventuelles : différences entre les profs, meilleur matériel, meilleur emploi du temps…

20 Formellement

21 H0 Hypothèse H0 : il n’y a pas de différence entre les groupes. Ils ont même moyenne et même variance On ne s’intéresse pas au groupe mais aux populations qu’ils représentent : on travaille avec 

22 Calcul de Vintra Notations k est le nombre de groupe (ici, k=3)
n est le nombre d’élève dans chaque groupe (n=9) N est le nombre total d’élève (N=27) i2 est la variance du groupe i (12=1,5) Xi est la moyenne du groupe i (X1=15) X est la moyenne générale (X=12)

23 Calcul de Vintra La variance d’un groupe représente son hétérogénéité ou sa variabilité biologique interne. Vintra est la variabilité biologique interne de tous les groupe (le « bruit » global). Pour l’évaluer, on prend simplement la moyenne des variances des groupes :

24 Les clones sont parmi nous…
Si on travaillait sur des « clones » (aucune différence entre les individus d’un groupe), il n’y aurait aucune variance à l’intérieur des groupes :

25 Calcul de Vinter La moyenne d’un groupe est une mesure du niveau moyen du groupe. Vinter est la variabilité entre les groupes. Pour l’évaluer, on prend simplement la variance des moyennes multipliés par l’effectif :

26 Calcul pratique (réveil !!!)

27 Des clones partout Les profs et les élèves sont des clones :
Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes

28 Retour au problème Y a-t-il des différences entre les groupes ?

29 Retour au problème Y a-t-il des différences entre les groupes ?
Vinter = 0 La réponse est trivialement non !

30 Retour au problème Y a-t-il des différences entre les groupes ?
Vinter = 0 La réponse est trivialement non car Vinter=0 indique l’égalité entre les moyennes des groupes Les profs et les élèves sont des clones : Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes

31 Retour au problème Y a-t-il des différences entre les groupes ?

32 Retour au problème Y a-t-il des différences entre les groupes ?
Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection…

33 Retour au problème Y a-t-il des différences entre les groupes ?
Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection… Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Pas de bruit Détection possible

34 Retour au problème Y a-t-il des différences entre les groupes ?

35 Retour au problème Y a-t-il des différences entre les groupes ?
Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0

36 Retour au problème Y a-t-il des différences entre les groupes ?
Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0 Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes Trop de bruit Détection impossible

37 On utilise le test pour comparer les variances :
Comment conclure ? Si Vinter=16 et Vintra=0 : on rejette H0 Si Vinter=0 et Vintra=22,4 : on rejette H0 Entre les deux, si Vinter=18 et Vintra=7 ? On utilise le test pour comparer les variances : le F de Fisher

38 F de Fisher

39 F de Fisher : comme d’hab
On calcule le F observé On calcule la probabilité de F Autre méthode : lecture du F théorique sur une table Si FObs > FTh, la différence est significative, on rejette H0 Si FObs < FTh, la différence n’est pas significative, on ne rejette pas H0

40 Loi.F(Fobs,DDL dessous,DDL dessus)
Calcul du F observé Puis la probabilité d’obtenir un tel F si SEULEMENT la variabilité biologique est en jeu est : Loi.F(Fobs,DDL dessous,DDL dessus)

41 Calcul des DDL V inter est une variance
Son DDL est de le nombre de groupe moins 1 DDL inter=k-1 Vintra est la moyenne des variances Son DDL est la somme des DDL de chacun des groupes Chaque groupe a un DDL de n-1 DDL intra = n-1 + n-1 + … + n-1 = N-k

42 Exemple DDL inter = k-1 = 3-1 = 2 DDL intra = N-k = 27 – 3 = 24

43 Lecture du F théorique Cette fois-ci, on lit le F sur la table 5% (parce ce que on doit tester Vinter/Vintra, mais pas Vintra/Vinter FTh=3,40 FObs étant plus grand que FTh, on peut rejeter H0 : il existe une différence significative entre les moyennes

44 Risque 5% On veut savoir si Vinter/Vintra est grand
On teste donc au risque 5% Pour la comparaison des variances, on voulait savoir si V1/V2 était grand OU si V2/V1 était grand. On devait donc tester V1/V2 au risque 2,5% et V2/V1 au risque 2,5% Grâce a une astuce, on avait qu’un seul des deux tests à faire, mais ca ne changeait rien au seuil

45 Groupes de taille variable

46 Vintra : Groupes de taille variable
Rappel : pour les groupes de même taille : Vintra = moyenne des variances = Pour des groupes de taille variable : Vintra = moyenne des variances PONDEREE par les DDL : Si les k groupes ont la même taille n, les formules coïncident

47 Vinter : Groupes de taille variable
Rappel : pour les groupes de même taille : Vinter = n x variances des moyennes = Pour des groupes de taille variable : Vinter = variances des moyennes PONDEREE par les tailles : Si les groupes ont la même taille n, les formules coïncident

48 Exemple : mini QCM

49 Conclusion L’hypothèse « toutes les moyennes sont les mêmes » est rejetée. toutes les moyennes ne sont pas les mêmes MAIS on ne sait pas ou sont les différences

50 Conclusion Les moyennes sont 10,2 ; 15,2 et 17,6
On sait qu’il existe au moins une différence significative. Entre 10,2 et 15,2 ? Entre 10,6 et 17,6 ? Entre 15,2 et 17,6 ?

51 Pour le savoir : T de Student…
Rappel : pour comparer deux moyennes : Ici, au lieu de calculer la variance commune, on va utiliser Vintra

52 Pour le savoir : T de Student…
DDL des 2 groupes = (11-1) + (7-1) = 16 T th = 2,120 La différence entre 10,2 et 15,2 N’est PAS significative


Télécharger ppt "ANOVA : introduction."

Présentations similaires


Annonces Google