ECHANTILLONAGE ET ESTIMATION

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Comparaison d’une moyenne observée à une moyenne théorique
Probabilités et statistiques au lycée
STATISTIQUE INFERENTIELLE L ’ESTIMATION
DE LA COMPREHENSION A LA MESURE (1) : LAPPROCHE QUANTITATIVE ET LES TECHNIQUES DENQUETE.
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
Collecte de données F. Kohler.
Inférence statistique
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Comparaison de plusieurs moyennes observées
Variable aléatoire, estimation ponctuelle et par intervalle
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Les TESTS STATISTIQUES
Échantillonnage-Estimation
Les tests d’hypothèses
INFERENCE STATISTIQUE
Probabilités et statistique en TS
Tests de comparaison de moyennes
Sondage aléatoire simple
Méthodes de Biostatistique
1 - Construction d'un abaque Exemple
Thème 6 : l'échantillonnage et l'enquête
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Échantillonnage (STT-2000)
Comprendre la variation dans les données: Notions de base
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Distribution d’échantillonnage
ÉCHANTILLONNAGE AU FIL DES PROGRAMMES Stage : nouveaux programmes de première Novembre 2011.
Lectures Volume du cours : Chapitre 7
Les intervalles de confiance pour la moyenne d’une population
1 - Programme de Seconde (juin 2009) Statistique et probabilités
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Théorème de la limite centrale l’inférence statistique
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Intervalles de confiance pour des proportions L’inférence statistique
Échantillonnage (STT-2000)
Thème: statistiques et probabilités Séquence 6: Probabilités (Partie 1) Capacités : Déterminer la probabilité d’événements dans des situations d’équiprobabilité.
Concepts fondamentaux: statistiques et distributions
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Échantillonnage aléatoire simple
Chapitre 4 Variables aléatoires discrètes
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Échantillonnage (STT-2000)
ECOLE DES HAUTES ETUDES COMMERCIALES
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
LOIS COURANTES DE PROBABILITES
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
BIOSTATISTIQUES Définitions.
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Distributions d’échantillonnage pour des proportions
Formation Green Belt Lean Six Sigma
Introduction aux statistiques Intervalles de confiance
UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Transcription de la présentation:

ECHANTILLONAGE ET ESTIMATION DE PARAMETRES

Situation classique en statistique : on s’intéresse à une population, mais on ne peut étudier la population dans son ensemble on extrait un échantillon de cette population à partir de cet échantillon, comment estimer des paramètres de la population?

en statistique: un échantillon est un ensemble d’individus extraits d’une population initiale de manière aléatoire pour qu’il soit représentatif de cette population Sondage : méthode utilisée pour constituer un échantillon

Sondage : définition population : ensemble des individus ( unités statistiques) qu’on veut étudier les unités statistiques ne sont pas toujours des individus ( services hospitaliers, écoles…) base de sondage : liste des unités statistiques issues de la population servant à sélectionner un échantillon Tirage au sort : randomisation

Sondage systématique : base de sondage de grande taille déterminer le pas de sondage ex N = 10 000 et n = 500 : pas de sondage = n/N = 20 TAS du 1er sujet entre 1et n Puis tirage d’un sujet tous les 20

Sondage à plusieurs degrés : population de très grande taille +++ sondage à 2 ou n degrés COURS N°4

sondage en grappe : variante d’un sondage à n degrés on prend tous les individus du dernier degré

Sondage stratifié: Cas où l’on sait qu’il y a une liaison entre un caractère particulier de la population et la variable étudiée Exemple : on étudie le comportement par rapport au tabac chez des lycéens d ’une école ( 800 élèves) : proportion variable par classe : 2nd 10% ; 1ére : 20%, Term: 40%) . Stratifié sur la classe en faisant le TAS dans chaque strate

MESURES STATISTIQUES SUR UN ECHANTILLON Sur un échantillon, on peut mesurer les mêmes types de paramètres de position et de distribution que sur une population Utilisés comme estimateurs des paramètres inconnus dans la population

Postulats de base : la valeur observée sur un échantillon a peu de chances d’être exactement la valeur inconnue de la population que cette valeur est néanmoins assez proche de la valeur inconnue si notre échantillon est représentatif +++ En répétant l’échantillonnage, on trouve d’autres valeurs, toutes assez proches les unes des autres

En statistique on a la problématique suivante : on a un échantillon de n valeurs on veut en déduire quelque chose de la population dont est issu cet échantillon

On connaît notre échantillon : Variable quantitative : moyenne observée (m), variance observée (s2 ) variable qualitative : fréquence observée (p0).

Soit X une v. a de moyenne µ et de variance 2 Soit X une v. a de moyenne µ et de variance 2. On tire au sort un échantillon de n sujets : on mesure m et S2 Est-ce que m est un bon estimateur de  ? Est-ce que s 2 est un bon estimateur de 2 ?

Paramètres de position : Moyenne: on appelle m la moyenne d’une variable quantitative calculée sur un échantillon, μ étant la moyenne inconnue dans la population. Avec x: les valeurs de la variable, Σx la somme de ces valeurs et n la taille de l’échantillon m = Σx / n La moyenne m est l’estimateur de la moyenne μ inconnue

un bon estimateur de µ (population) : sans biais et convergent La valeur m de cet échantillon est un bon estimateur de µ (population) : sans biais et convergent

Paramètres de dispersion : la valeur = pas une bonne estimation de 2 inconnue (population) on a calculé les écarts par rapport à la moyenne observée m et non la moyenne théorique µ S 2

å ( ) x - m S = n-1 S2 est un bon estimateur de 2 : il est sans biais et convergent å ( x - ) 2 m S 2 = n-1

Estimation de proportions : Soit une population dans laquelle on observe une proportion P d’individus ayant une caractéristique. On cherche à estimer P par la proportion observée p d’un échantillon de cette population. p = k / n avec n = taille échantillon et K le nombre d’individus présentant la caractéristique p est un bon estimateur de P, sans biais et convergent

Estimation par intervalle de confiance : Un intervalle de confiance d’un paramètre inconnu est une fourchette de valeurs dans laquelle le paramètre inconnu qu’on veut estimer a une probabilité 1-α de se trouver (et α de ne pas se trouver) m − IεIα sm < μ < m + IεI α sm Ici, on connaît m et on cherche à déterminer μ.

1- Estimation d’une moyenne µ inconnue par un intervalle de confiance : c’est donner les valeurs qui vont encadrer µ avec une probabilité ( 1- α ) de trouver µ : Pr (m - k < µ < m + k ) = ( 1 – α ) ex : IC 95% = Intervalle de confiance qui a 95% de chance de contenir µ

= ± e Grand échantillon (n30) d ’après le théorème central limite: l’observation d ’une moyenne m sur un échantillon de n observations, permet d ’assigner à la moyenne inconnue µ, l ’intervalle de confiance à 95% : dérivée formule générale : S 2 ( = 5% :  =1,96) IC = m ± 1,96 95% n é ù S 2 d 2 d 2 IC = m ± e IC = ê m - e ú ; m + e 1 - a a n 1 - a ê a a n n ú ë û

é ù S S IC = ê m - t ( n - 1 ) ; m + t ( n - 1 ) ú ê n n ú ë û petit échantillon (n < 30) a) la variable aléatoire X suit une loi normale :  remplacer  par une autre variable, plus dispersée = t de student, définie en fonction du degré de liberté (n-1) de S2 - IC pour µ inconnue é ù S 2 S 2 IC = ê m - t ( n - 1 ) ; m + t ( n - 1 ) ú 1 - a a/é a ê n n ú ë û

2 - Estimation d ’un pourcentage par un intervalle de confiance : Conditions de validité à vérifier : n p0 et n q0  5

l ’observation d ’un pourcentage p0 sur un échantillon de n cas permet d ’assigner au pourcentage inconnu p mesuré dans une population, l ’intervalle de confiance à 95% dérivée formule générale p q IC = p ± 1 , 96 95 % n p q = ± e IC p a 1 - a n