Echantillonnage Introduction Distribution d’échantillonnage d’une moyenne Distribution d’échantillonnage d’une proportion
Qu’est-ce que la statistique inférentielle ? Population Ensemble de référence x Echantillon Sous-ensemble de la population.
Pourquoi travaille-t-on sur un échantillon ? temps coût impossibilité d’avoir la population entière Tests destructifs
Statistique inférentielle : estimation et tests Population Ensemble de référence x Echantillon Sous-ensemble de la population. Estimation Le calcul d’une statistique à partir de l’échantillon permet d’estimer un paramètre inconnu de la population. Test Le calcul d’une statistique à partir de l’échantillon permet de prendre une décision concernant une hypothèse sur un paramètre de la population.
Exemple de problème Population = étudiants Sup de Co Un besoin : Je voudrais connaître le nombre d’heures de travail par semaine pour un étudiant Sup de Co. Pourquoi un échantillon? Comment l’extraire? Que pouvons-nous en tirer?
Estimation à partir d’un échantillon Population une variable quantitative X = nb d’heures de travail par semaine Taille : N x x On voudrait connaître un paramètre de la population x (Sup de Co) m = la moyenne des valeurs de X dans la population x x x Estimation x x x x x x x x x x On peut calculer une statistique à partir de l’échantillon x x x x x x x x m = moyenne des valeurs de X dans l‘échantillon x x x x x x x x x x Echantillon taille : n
Echantillonnage Echantillonnage Population Echantillon taille : n une variable quantitative m = nb d’heures de travail par semaine Taille : N x x x (Sup de Co) x x x Echantillonnage x x x x x x x x x x x x x x x x x x x m = moyenne des valeurs de X dans l‘échantillon x x x m est une variable aléatoire x x x x x x Quelle est la distribution de m ? Echantillon taille : n
Distribution d’échantillonnage de la moyenne m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m Si n est suffisamment grand, on peut considérer que la distribution de m est normale m + 1,96 sm m - 1,96 sm 95 % des m m de moyenne m
Et pour une proportion, c’est pareil... Population une variable qualitative «FUMEUR» Taille : N x x On voudrait connaître un paramètre de la population x p = la proportion des fumeurs dans la population (Sup de Co) x x x Estimation x x x x x x x x x x On peut calculer une statistique à partir de l’échantillon x x x x x x x x pe = proportion des fumeurs dans l‘échantillon x x x x x x x x x x Echantillon taille : n
Distribution d’échantillonnage d’une proportion Si n est suffisamment grand, on peut considérer que la distribution de pe est normale a pour moyenne E(pe)=p et pour écart-type