Les groupes.

Slides:



Advertisements
Présentations similaires
Aires et périmètres.
Advertisements

Comparaison d’une moyenne observée à une moyenne théorique
Association entre variables
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
ACTIVITES Le calcul littéral (3).
Comparaison d'une distribution observée à une distribution théorique
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les tests d’hypothèses
Défi écriture BEF Couverture. Défi écriture BEF Page 1.
Calculs automatisés n°2 Niveau 3ème Consignes Indiquez votre nom. Indiquez si vous êtes côté fenêtres ou côté couloir. Numérotez votre feuille de (1)
Estimation de la survie comparaison des courbes de survie FRT C3.
L’OUTIL STATISTIQUE.
Tests de comparaison de moyennes
LES ÉLASTICITÉS DE LA DEMANDE ET DE L’OFFRE
Savoir partager Ecole de Lanta
1.2 COMPOSANTES DES VECTEURS
Nombre de sujets nécessaires en recherche clinique
Exemples HULL CHAPITRE 8 1HULL_CHAPITRE 8. CALCUL DE LA VaR 2HULL_CHAPITRE 8.
Groupe 1: Classes de même intervalle
Problème Autre formulation :
Stat-infoCM4a : 1 Changement de groupe TD Lebossé Olivier  8h00 : M105 Charbonnier Guillaume ?  8h00 : M105.
2.1 LONGUEURS ET DISTANCES Cours 4 1.
FRACTIONS PARTIELLES cours 13.
Test bilan de calcul mental N°1 :
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les modèles linéaires (Generalized Linear Models, GLM)
Notre calendrier français MARS 2014
LES STATISTIQUES BOULAHBAL Free Powerpoint Templates.
LE CHOIX EN CONTEXTE D’INCERTITUDE
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
2.2 PRODUIT SCALAIRE ET CALCUL D’ANGLES
Henri Beauregard, enseignant retraité
Tests d’hypothèses.
Les intervalles de confiance pour la moyenne d’une population
ASI 3 Méthodes numériques pour l’ingénieur
Régression linéaire.
Probabilités Série n°1.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Eléments d’arithmétique dans l’ensemble des naturels
Probabilités et Statistiques
CALENDRIER-PLAYBOY 2020.
Probabilités et Statistiques Année 2009/2010
Seconde partie - cours n°3 Théorie des tests
1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.
ANOVA : introduction.
Joseph CHONG, Mauduit Pergent
Répondez aux Questions. 1. Qu’est-ce que c’est? Un canard.
Chimiometrie (Chemometrics)
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Christophe Genolini INSERM U669 / Université de Paris X.
Loi de Hardy-Weinberg Base de la Génétique des Populations
Rappels de statistiques descriptives
Statistiques et informatique
Théorème de la limite centrale l’inférence statistique
1 Licence Stat-info CM4 b 2004 V1Christophe Genolini Groupes appareillés : problème On veut comparer deux correcteurs On dispose de 3 copies –Le premier.
TD4 : « Lois usuelles de statistiques »
1 1 Licence Stat-info CM7 a 2004 V1Christophe Genolini Récapitulatif : Variables qualitatives Variables qualitatives : –on se demande si elles sont liées.
Problème Autre formulation :
1 1 Licence Stat-info CM6 a 2004 V1Christophe Genolini Rappels 1.Variables nominales : –Oui / Non –Bleu / Brun / Roux / Noir Pour déterminer s’il y a un.
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
1 Licence Stat-info CM4a 2004 V2Christophe Genolini Égalité des variances Une des conditions pour utiliser T est l’égalité des variances s APA  s MS On.
LOIS COURANTES DE PROBABILITES
1 1 Licence Stat-info CM6 b 2004 V1Christophe Genolini Régression linéaire : problème On a les notes math et français suivantes : Un élève a 10 en math,
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Introduction aux statistiques Intervalles de confiance
3.6 Loi continue 3 cours 18.
Transcription de la présentation:

Les groupes

Rappel Un amphi de 200 élèves : loi normale moyenne X et écart type s Un élève : on peut connaître la probabilité de sa note Exemple, X=10, s=2, l’élève à 14  Z= (14-10)/2  Top 2,5% L’élève à 11  Z= (11-10)/2  Top 31% Comment faire pour un groupe d’élèves ? Sur un groupe, les bonnes notes sont compensées par les mauvaises Extrêmement improbable qu’un groupe ait 14 de moyenne 8 ; 14 ; 16 ; 16 ; 18 Une moyenne de 12, c’est déjà beaucoup : 8 ; 10 ; 12 ; 14 ; 16

Comment faire ? Individu Groupe de taille N On compare la note d’un individu à la distribution des notes On conclut grâce à la loi normale Groupe de taille N On compare un groupe de taille N à la distribution des groupes de taille N. Plus précisément, on compare la moyenne d’un groupe avec la distribution des moyennes des groupes de taille N On conclut grâce à la loi normale

Exemple VOS notes d’anglais de l’an dernier Notes d’anglais par groupe de 4

Distribution d’échantillonnage des moyennes On prend un groupe E au hasard de taille N On calcule sa moyenne E = 10,2 On recommence avec beaucoup de groupes 9,6 9,7 10,3 10,8 10,0 10,3 11,2 On obtient une distribution C’est la distribution d’échantillonnage des moyennes

Théorème central limite Soit X une variable suivant une loi normale de moyenne X écart type sx On note EX la distribution d’échantillonnage des moyennes. Alors EX suit une loi normale Cette loi normale a pour moyenne X Cette loi normale a pour écart type sx / N

Exemple des Notes d’anglais Les notes d’anglais suivent la loi normale (plus ou moins) de moyenne X=10,5 et d’écart type sX = 3 Sa distribution d’échantillonnage des moyennes (groupes de taille 4) suit une loi normale de moyenne EX=10,5 et d’écart type sEX =3/4 = 3/2=1,5

Exemple des notes Un amphi de 200 élèves suit la loi normale de moyenne X=10 et d’écart type sX = 2 Sa distribution d’échantillonnage des moyennes (groupes de taille 25) suit une loi normale de moyenne EX=10 et d’écart type sEX =2/25 = 2/5=0,4

Si c’est clair, tout le reste est facile ! Ne mélangeons pas tout ! X est la moyenne de la distribution X (moyenne de l’amphi) G est la moyenne du groupe G (moyenne des APA, taille 25) EX est la distribution d’échantillonnage des moyennes des groupes de taille 25. Comme toute distribution, EX a une moyenne. EX est la moyenne de la distribution EX Si c’est clair, tout le reste est facile !

Exemple

Problème Un amphi : moyenne X=10, écart type sX=2 Le groupe des APA (25 élèves) : moyenne G=11 Quelle la probabilité qu’une groupe de taille 25 ait 11 ou plus ?

1. H0 H0 : la différence n’est pas significative.

2. Données G=11, moyenne de l’amphi X=10, écart type sX=2 On va comparer la moyenne du groupe à la distribution d’échantillonnage des moyennes EX : EX=10 sEX =2/25 = 2/5=0,4

3. Test On utilise la loi normale : Avec un individu : Avec un groupe :

4. Probabilité Z=2,5 P=0,62% Un groupe de taille 25 a 0,62% de chances d’avoir une moyenne dans [11 ; +∞]

5. Conclusion P<5%, on rejette H0

Autre formulation de la solution

s et σ

Quand on ne connaît pas  Dans l’exemple précédent, on a comparé la moyenne d’un groupe G à la moyenne de la population X. Coup de chance, on connaissait l’écart type de la population. Problème : Si on ne connaît pas X, comment faire ? Solution : On fait une approximation, on remplace X par sG

Exemple des salaires Un groupe de 10 femmes comparent leur salaire à celui des employés : Salaire moyen des employés : moyenne=28 k$, Écart type=? Salaire des 10 femmes : 24, 27, 31, 21, 19, 26, 30, 22, 15, 36 Moyenne = 25,1 k$ Écart type = 5,9 Solution théorique :

Solution réelle On approxime l’écart type des salaires moyens des hommes par l’écart type des salaires moyens des femmes est remplacé par

T de student

Approximation : sG n’est pas X Si N est grand (N>30) : pas de problème, sG est presque égal à X Si N est petit (N<30 ) : sG est une sous estimation de X Donc le Z obtenue serait trop grand (par rapport à celui qu’on obtiendrait si on connaissait X ) Dans ce cas, on remplace Z par le T de Student

T de Student La table du T change selon la taille de l’échantillon Un échantillon de taille N a un degré de liberté (ddl) de N-1. On trouve la probabilité du T de Student grâce A Excel : Loi.Student A la table papier

Table du T

Exemple des salaires On calcule T : DDL 9  P=5,27% On ne peut pas rejeter H0

ATTENTION : DDL Pour le  2 Pour le T de Student DDL = (colonnes-1)x(lignes-1) Pour le T de Student DDL = effectifs - 1

Récapitulatif On connaît sX On conclut grâce à la table de la loi normale On ne connaît pas X N est grand (N>30) N est petit (N<30) On conclut grâce à la table du T de Student