1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :

Slides:



Advertisements
Présentations similaires
Intervalles de confiance
Advertisements

Intervalles de confiance
Introduction aux statistiques Intervalles de confiance
Comparaison d’une moyenne observée à une moyenne théorique
Thomas G. Dietterich Approximate Statistical Tests for Comparing
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Échantillonnage-Estimation
Les tests d’hypothèses
La loi normale et l’estimation de paramètres
Lectures Volume obligatoire: Chapitre 8
Fluctuations d’une fréquence selon les échantillons, Probabilités
Tests de comparaison de moyennes
Les liens entre les variables et les tests d’hypothèse
Atelier Probabilités et statistiques
Méthodes de Biostatistique
Nombre de sujets nécessaires en recherche clinique
Échantillonnage (STT-2000)
Stat-infoCM4a : 1 Changement de groupe TD Lebossé Olivier  8h00 : M105 Charbonnier Guillaume ?  8h00 : M105.
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Distribution d’échantillonnage
Lectures Volume du cours : Chapitre 7
Les groupes.
Théorème de la limite centrale l’inférence statistique
1 Licence Stat-info CM4 b 2004 V1Christophe Genolini Groupes appareillés : problème On veut comparer deux correcteurs On dispose de 3 copies –Le premier.
TD4 : « Lois usuelles de statistiques »
Intervalles de confiance pour des proportions L’inférence statistique
ANALYSE D’UN ÉCHANTILLON PORTANT SUR UNE VARIABLE STATISTIQUE
1 1 Licence Stat-info CM7 a 2004 V1Christophe Genolini Récapitulatif : Variables qualitatives Variables qualitatives : –on se demande si elles sont liées.
Atelier Probabilités et statistiques
Concepts fondamentaux: statistiques et distributions
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Problème Autre formulation :
L’erreur standard et les principes fondamentaux du test de t
Stat-infoCM6a : 1 Rappels.
1 Licence Stat-info CM5a 2004 V1Christophe Genolini Problème Détection d’un phénomène particulier : –Flûtiste exceptionnelle ou moyenne –Groupe de TD super.
Test 2.
1 1 Licence Stat-info CM6 a 2004 V1Christophe Genolini Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un.
1 Licence Stat-info CM4 c 2004 V1Christophe Genolini Estimateur fiable.
Groupes appareillés.
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
1 Licence Stat-info CM4a 2004 V2Christophe Genolini Égalité des variances Une des conditions pour utiliser T est l’égalité des variances s APA  s MS On.
LOIS COURANTES DE PROBABILITES
1 1 Licence Stat-info CM6 b 2004 V1Christophe Genolini Régression linéaire : problème On a les notes math et français suivantes : Un élève a 10 en math,
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Distributions d’échantillonnage pour des proportions
Introduction aux statistiques Intervalles de confiance
Chapitre 3 Lois de probabilité 1. Lois discrètes 2. Loi de Bernoulli (ou loi alternative simple) variable de Bernoulli On appelle variable de Bernoulli.
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
4.2 Estimation d’une moyenne
Transcription de la présentation:

1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève : on peut connaître la probabilité de sa note –Exemple, X=10, s=2, l’élève à 14 => Top 2,5% L’élève à 11 => Top 31% Comment faire pour un groupe d’élèves ? –Sur un groupe, les bonnes notes sont compensées par les mauvaises –Extrêmement improbable qu’un groupe ait 14 de moyenne 8 ; 14 ; 16 ; 16 ; 18 –Une moyenne de 12, c’est déjà beaucoup : 8 ; 10 ; 12 ; 14 ; 16

2 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Comment faire ? Individu On compare la note d’un individu à la distribution des notes On conclut grâce à la loi normale Groupe de taille N On compare un groupe de taille N à la distribution des groupes de taille N.  Plus précisément, on compare la moyenne d’un groupe avec la distribution des moyennes des groupes de taille N On conclut grâce à la loi normale

3 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Exemple VOS notes d’anglais de l’an dernier Notes d’anglais par groupe de 4

4 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Distribution d’échantillonnage des moyennes On prend un groupe E au hasard de taille N On calcule sa moyenne E = 10,2 On recommence avec beaucoup de groupes 9,6 9,7 10,3 10,8 10,0 10,3 11,2 On obtient une distribution C’est la distribution d’échantillonnage des moyennes

5 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Théorème central limite Soit X une variable suivant une loi normale de moyenne X écart type s x On note EX la distribution d’échantillonnage des moyennes. Alors –EX suit une loi normale –Cette loi normale a pour moyenne X –Cette loi normale a pour écart type s x /  N

6 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Exemple des Notes d’anglais Les notes d’anglais suivent –la loi normale (plus ou moins) –de moyenne X=10,5 –et d’écart type s X = 3 Sa distribution d’échantillonnage des moyennes (groupes de taille 4) –suit une loi normale –de moyenne EX=10,5 –et d’écart type s EX =3/  4 = 3/2=1,5

7 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Exemple des notes Un amphi de 200 élèves suit –la loi normale –de moyenne X=10 –et d’écart type s X = 2 Sa distribution d’échantillonnage des moyennes (groupes de taille 25) –suit une loi normale –de moyenne EX=10 –et d’écart type s EX =2/  25 = 2/5=0,4

8 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Ne mélangeons pas tout ! X est la moyenne de la distribution X G est la moyenne du groupe G E est la moyenne de l’échantillon E EX est la distribution d’échantillonnage des moyennes. Comme toute distribution, EX a une moyenne. EX est la moyenne de la distribution EX Si c’est clair, tout le reste est facile !

9 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème Un amphi : moyenne X=10, écart type s X = 2 Le groupe des APA (25 élèves) : moyenne G=11 La différence est-elle significative ? On va comparer la moyenne du groupe à la distribution d’échantillonnage des moyennes EX : –EX=10 –s EX =2/  25 = 2/5=0,4 Ensuite, on utilise la loi normale : Hautement significatif (au risque 1%)

10 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Autre formulation de la solution

11 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Quand on ne connaît pas  Dans l’exemple précédent, on a comparé la moyenne d’un groupe G à la moyenne de la population X. Coup de chance, on connaissait l’écart type de la population. Problème : Si on ne connaît pas  X, comment faire ? Solution : On fait une approximation, on remplace  X par s G

12 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Exemple des salaires Un groupe de 10 femmes comparent leur salaire à celui des hommes : Salaire moyen des hommes : –moyenne=28 k$, –Écart type=? Salaire des 10 femmes : 24, 27, 31, 21, 19, 26, 30, 22, 15, 36 –Moyenne = 25,1 k$ –Écart type = 5,9 On approxime l’écart type des salaires moyens des hommes par l’écart type des salaires moyens des femmes

13 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Approximation : s G n’est pas  X Si N est grand (N>30) : pas de problème, s G est presque égal à  X Si N est petit (N<30 ) : s G est une sous estimation de  X –Donc le Z obtenue serait trop grand (par rapport à celui qu’on obtiendrait si on connaissait  X ) Dans ce cas, on remplace Z par le T de Student

14 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Récapitulatif On connaît s X On conclut grâce à la table de la loi normale On ne connaît pas  X N est grand (N>30) On conclut grâce à la table de la loi normale On ne connaît pas  X N est petit (N<30) On conclut grâce à la table du T de Student

15 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini T de Student Un échantillon de taille N a un degré de liberté (ddl) de N-1. On trouve le T de Student grâce à la table :

16 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini ATTENTION Pour le  2 DDL = (colonnes-1)x(lignes-1) Pour le T de Student DDL = effectifs - 1

17 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Exemple des salaires On calcule T Obs : Au risque 5% DDL 9, on trouve T Th =2,262 Comme T Obs < T Th, on ne peut pas rejeter H0