1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

ANOVA à un facteur (Rehailia)
D.Gile statscrit1 LUTILISATION DES STATISTIQUES INFERENTIELLES DANS LA RECHERCHE : REFLEXIONS CRITIQUES
Thomas G. Dietterich Approximate Statistical Tests for Comparing
Les tests d’hypothèses (I)
Comparaison de deux moyennes observées
Situation du problème :
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests de comparaison de pourcentages
Comparaison de plusieurs moyennes Analyse de variance
Comparaison de plusieurs moyennes Analyse de variance
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
Les liens entre les variables et les tests d’hypothèse
Structure de causalité bivariée
Fonction puissance Montage préparé par : André Ross
Régression linéaire simple
Groupe 1: Classes de même intervalle
Objectifs du chapitre 12: Interprétation des résultats
Problème Autre formulation :
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
La corrélation et la régression multiple
La corrélation et la régression
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
La puissance statistique
La puissance statistique
La corrélation et la régression
Analyse factorielle de variance: Principes d’expérimentation
La régression multiple
Méthodes de Biostatistique
Méthodologie expérimentale : l’analyse des données
ANOVA : introduction.
ANALYSE DE DONNEES TESTS D’ASSOCIATION
1 Licence Stat-info CM4 b 2004 V1Christophe Genolini Groupes appareillés : problème On veut comparer deux correcteurs On dispose de 3 copies –Le premier.
M2 Sciences des Procédés - Sciences des Aliments
ANOVA à 1 facteur en groupes de mesure indépendants
Probabilités et Statistiques Année 2010/2011
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Problème Autre formulation :
Ecritures fractionnaires Quotients
L’erreur standard et les principes fondamentaux du test de t
Stat-infoCM1b : 1 Stat : pour quoi faire ? La licence commence ici…
Stat-infoCM6a : 1 Rappels.
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Quelques commentaires sur les tests statistiques
Test 2.
1 1 Licence Stat-info CM6 a 2004 V1Christophe Genolini Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un.
1 Licence Stat-info CM4 c 2004 V1Christophe Genolini Estimateur fiable.
Groupes appareillés.
STATISTIQUES.
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
MODULE FTH 2007 Diversité génétique
1 Licence Stat-info CM4a 2004 V2Christophe Genolini Égalité des variances Une des conditions pour utiliser T est l’égalité des variances s APA  s MS On.
1 1 Licence Stat-info CM6 b 2004 V1Christophe Genolini Régression linéaire : problème On a les notes math et français suivantes : Un élève a 10 en math,
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Introduction aux statistiques Intervalles de confiance
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Chapitre 6 Les tests d ’ hypoth è se 2 – Les tests du  2 (chi 2)
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)
Transcription de la présentation:

1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super bon

2 Licence Stat-info CM5a 2004 V1Christophe Genolini Flûtiste Silence Cécile seule Cécile avec les autresLes autres sans Cécile

3 Licence Stat-info CM5a 2004 V1Christophe Genolini Quiz : je mélange…

4 Licence Stat-info CM5a 2004 V1Christophe Genolini Quiz : je mélange… Trop facile : Cécile seule Ultra facile : Silence Heu… Ben…

5 Licence Stat-info CM5a 2004 V1Christophe Genolini Pourquoi ? La variance ici est nulle Ici, la variance est de 0,5 C’est une grosse différence. Elle EST significative Ici, la variance ici est 17,43Ici, la variance est de 17,93 Entre 17,43 et 17,93 la différence N’EST PAS significative

6 Licence Stat-info CM5a 2004 V1Christophe Genolini Intuitivement Vinter (Variance Inter) est la variance que l’on cherche à détecter. Vintra (Variance Intra) est le « bruit », la variabilité du au hasard (variabilité biologique)

7 Licence Stat-info CM5a 2004 V1Christophe Genolini Intuitivement Vintra = 0 Vinter = 0,5 Vintra = 17,43 Vinter = 0,5 On détecte la flûte ou son absence On détecte l’orchestre mais la flûte seule est impossible à entendre

8 Licence Stat-info CM5a 2004 V1Christophe Genolini Formulation du problème On dispose de plusieurs groupes de donnée (ici, des bandes sonores). On cherche à détecter quelque chose (ici, la flûte) Pour le savoir, on calcule Vintra et Vinter –Vintra mesure la variabilité biologique (ici, le bruit) –Vinter mesure ce que l’on cherche vraiment (ici, la flûte) Si Vinter est grand devant Vintra, on a détecté quelque chose. Si Vinter est petit devant Vintra, la variabilité biologique est trop forte, elle empêche toute détection.

9 Licence Stat-info CM5a 2004 V1Christophe Genolini La flûte Vintra = 0 Vinter = 0,5 Vintra = 17,43 Vinter = 0,5 On détecte la présence d’une flûte dans le groupe 2 On ne détecte pas la présence de la flûte dans le groupe 2

10 Licence Stat-info CM5a 2004 V1Christophe Genolini Autre approche : back on Mini QCM La note de l’élève 2 groupe 1 (Yvon) est 19. Pourquoi ?

11 Licence Stat-info CM5a 2004 V1Christophe Genolini Étude de la note d’Yvon La moyenne générale est de 12. –Yvon a +7 par rapport à la moyenne générale La moyenne de groupe 1 est de 15 –Yvon a +4 par rapport à la moyenne du groupe 1 –Le groupe 1 a +3 par rapport à la moyenne générale

12 Licence Stat-info CM5a 2004 V1Christophe Genolini Étude de la note d’Yvon On peut donc « expliquer » la note d’Yvon comme 19 = Note d’Yvon Moyenne générale (contrôle facile) Effet du groupe 1 (super prof) Particularité d’Yvon (sa variabilité biologique : Yvon est plutôt bon)

13 Licence Stat-info CM5a 2004 V1Christophe Genolini Étude de la note de Justin Justin, élève 4 groupe 1 à 14 On peut donc « expliquer » la note de Justin : 14 = Note de Justin Moyenne générale (contrôle facile) Effet du groupe 1 (super prof) Particularité de Justin

14 Licence Stat-info CM5a 2004 V1Christophe Genolini Étude de la note de Gaston Justin, élève 7 groupe 3 à 13 On peut donc « expliquer » la note de Gaston : 13 = Note de Gaston Moyenne générale (contrôle facile) Effet du groupe 3 (prof pas terrible) Particularité de Gaston

15 Licence Stat-info CM5a 2004 V1Christophe Genolini Formalisation On peut donc « expliquer » la note d’Yvon comme 19 = Note Moyenne générale Variabilité entre les groupes Variabilité personnelle, à l’intérieur du groupe

16 Licence Stat-info CM5a 2004 V1Christophe Genolini Que cherche-t-on ? La variabilité personnelle dépend de nombreux facteurs –On ne peut pas l’expliquer. C’est la variabilité entre groupes qui nous intéresse ici –Si les groupes ont des moyennes significativement différentes, on pourra ensuite examiner des causes éventuelles : différences entre les profs, meilleur matériel, meilleur emploi du temps… Hypothèse H0 : il n’y a pas de différence entre les groupes. Ils ont donc même moyenne et même variance On ne s’interesse pas au groupe mais aux populations qu’ils représentent : on travaille avec 

17 Licence Stat-info CM5a 2004 V1Christophe Genolini Calcul de Vintra Notations –k est le nombre de groupe (ici, k=3) –n est le nombre d’élève dans chaque groupe (n=9) –N est le nombre total d’élève (N=27) –  i 2 est la variance du groupe i (  1 2 =1,5) –X i est la moyenne du groupe i (X 1 =15) –X est la moyenne générale (X=12)

18 Licence Stat-info CM5a 2004 V1Christophe Genolini Calcul de Vintra La variance d’un groupe représente son hétérogénéité ou sa variabilité biologique interne. Vintra est la variabilité biologique interne de tous les groupe (le « bruit » global). Pour l’évaluer, on prend simplement la moyenne des variances des groupes :

19 Licence Stat-info CM5a 2004 V1Christophe Genolini Les clones sont parmi nous… Si on travaillait sur des « clones » (aucune différence entre les individus d’un groupe), il n’y aurait aucune variance à l’intérieur des groupes :

20 Licence Stat-info CM5a 2004 V1Christophe Genolini Calcul de Vinter La moyenne d’un groupe est une mesure du niveau moyen du groupe. Vinter est la variabilité entre les groupes. Pour l’évaluer, on prend simplement la variance des moyennes multipliés par l’effectif :

21 Licence Stat-info CM5a 2004 V1Christophe Genolini Calcul pratique (réveil !!!)

22 Licence Stat-info CM5a 2004 V1Christophe Genolini Des clones partout Les profs et les élèves sont des clones : Pas de variabilité du tout Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes

23 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ?

24 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ? Vinter = 0 La réponse est trivialement non !

25 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ? Les profs et les élèves sont des clones : Pas de variabilité du tout Vinter = 0 La réponse est trivialement non car Vinter=0 indique l’égalité entre les moyennes des groupes Les profs sont des clones : Variabilité à l’intérieur des groupes, mais pas entre les groupes

26 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ?

27 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection…

28 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 0 La réponse est oui car on détecte une différence entre les moyennes sans que des variations internes (bruit) gênent cette détection… Les élèves sont des clones : Variabilité entre les groupes, mais pas à l’intérieur Pas de bruit Détection possible

29 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ?

30 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 22,4 La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne rejette pas H0

31 Licence Stat-info CM5a 2004 V1Christophe Genolini Retour sur H0 Y a-t-il des différences entre les groupes ? Vinter = 16 Vintra = 22,4 Situation réelle : Variabilité à l’intérieur des groupes et également entre les groupes La réponse est moins nette. Peut-être qu’une différence existe mais le bruit nous empêche de la détecter. On ne peut pas rejeter H0 Trop de bruit Détection impossible

32 Licence Stat-info CM5a 2004 V1Christophe Genolini Comment conclure ? Si Vinter=16 et Vintra=0 : on rejette H0 Si Vinter=0 et Vintra=22,4 : on ne rejette pas H0 Entre les deux, si Vinter=18 et Vintra=7 ? On utilise le test pour comparer les variances : le F de Fisher

33 Licence Stat-info CM5a 2004 V1Christophe Genolini F de Fisher : comme d’hab On calcule le F observé On calcule le F théorique (lecture sur une table) –Si F Obs > F Th, la différence est significative, on rejette H0 –Si F Obs < F Th, la différence n’est pas significative, on ne rejette pas H0

34 Licence Stat-info CM5a 2004 V1Christophe Genolini Calcul du F observé

35 Licence Stat-info CM5a 2004 V1Christophe Genolini Calcul des DDL V inter est une variance –Son DDL est de le nombre de groupe moins 1 –DDL inter=k-1 Vintra est la moyenne des variances –Son DDL est la somme des DDL de chacun des groupes –Chaque groupe a un DDL de n-1 –DDL intra = n-1 + n-1 + … + n-1 = N-k

36 Licence Stat-info CM5a 2004 V1Christophe Genolini Exemple DDL inter = k-1 = 3-1 = 2 DDL intra = N-k = 27 – 3 = 24

37 Licence Stat-info CM5a 2004 V1Christophe Genolini Lecture du F théorique Cette fois-ci, on lit le F sur la table 5% (parce ce que on doit tester Vinter/Vintra, mais pas Vintra/Vinter F Th =3,40 F Obs étant plus grand que F Th, on peut rejeter H0 : il existe une différence significative entre les moyennes

38 Licence Stat-info CM5a 2004 V1Christophe Genolini Vintra : Groupes de taille variable Rappel : pour les groupes de même taille : –Vintra = moyenne des variances = Pour des groupes de taille variable : –Vintra = moyenne des variances PONDEREE par les DDL : Si les k groupes ont la même taille n, les formules coïncident

39 Licence Stat-info CM5a 2004 V1Christophe Genolini Vinter : Groupes de taille variable Rappel : pour les groupes de même taille : –Vinter = n x variances des moyennes = Pour des groupes de taille variable : –Vinter = variances des moyennes PONDEREE par les tailles : Si les groupes ont la même taille n, les formules coïncident

40 Licence Stat-info CM5a 2004 V1Christophe Genolini Exemple : mini QCM

41 Licence Stat-info CM5a 2004 V1Christophe Genolini Conclusion L’hypothèse « toutes les moyennes sont les mêmes » est rejetée.  toutes les moyennes ne sont pas les mêmes  MAIS on ne sait pas ou sont les différences

42 Licence Stat-info CM5a 2004 V1Christophe Genolini Conclusion Les moyennes sont 10,2 ; 15,2 et 17,6 On sait qu’il existe au moins une différence significative. –Entre 10,2 et 15,2 ? –Entre 10,6 et 17,6 ? –Entre 15,2 et 17,6 ?

43 Licence Stat-info CM5a 2004 V1Christophe Genolini Pour le savoir : T de Student… Rappel : pour comparer deux moyennes : Ici, au lieu de calculer la variance commune, on va utiliser Vintra

44 Licence Stat-info CM5a 2004 V1Christophe Genolini Pour le savoir : T de Student… DDL des 2 groupes = (11-1) + (7-1) = 16 T th = 2,120  La différence entre 10,2 et 15,2 N’est PAS significative