Échantillonnage (STT-2000)

Slides:



Advertisements
Présentations similaires
Bratec Martin ..
Advertisements

NOTIFICATION ÉLECTRONIQUE
Fragilité : une notion fragile ?
SEMINAIRE DU 10 AVRIL 2010 programmation du futur Hôtel de Ville
Phono-sémantique différentielle des monosyllabes italiens
MAGGIO 1967 BOLOGNA - CERVIA ANOMALIES DU SOMMEIL CHEZ L'HOMME
droit + pub = ? vincent gautrais professeur agrégé – avocat
Transcription de la présentation:

Échantillonnage (STT-2000) Section 2 Estimation sans biais du total. Version: 22 août 2003

Estimation de la moyenne et du total dans un plan systématique Il peut être montré que la quantité suivante estime la moyenne: De même, le total de la variable y peut être estimé par STT-2000; Échantillonnage

Estimation de la variance dans un plan systématique Malheureusement, il n’existe pas d’estimateurs de variance pour les estimateurs précédents! L’estimation de la variance sera toujours la considération délicate dans un tirage systématique. La raison en est la suivante: le hasard dépend uniquement d’une seule unité (celle choisie parmi les a premières dans la liste). STT-2000; Échantillonnage

Problème relié aux cycles possibles Dans cet exemple, si par malchance il existe un « cycle » comme dans l’exemple extrême ci-contre, l’échantillonnage risque de donner que les petites valeurs de la variable d’intérêt. STT-2000; Échantillonnage

Autre exemple de cycles Si par malchance les données sont listées selon les mois de janvier, février, mars, etc… et si le pas est de 12, alors les données d’un même mois seront toujours sélectionnées! Dans la mesure du possible, dans l’exemple précédent, il suffit de bien mélanger la population avant de procéder au tirage. STT-2000; Échantillonnage

Probabilité de sélection (Henry, p.25 et voir acétate 11 du cours 1) Dans la formule ci-dessus le facteur ns/N est appelée la probabilité de sélection. Probabilité de sélection = probabilité de faire partie de l’échantillon. Dans ce cas-ci, les chances sont les mêmes pour toutes les unités dans la population; c’est un plan à probabilités égales. STT-2000; Échantillonnage

Estimateurs de la moyenne sous tirage aléatoire simple sans remise Pour une variable y, l’estimateur de la moyenne est L’estimateur de la variance est où La constance f=n/N est le taux de sondage. IC: STT-2000; Échantillonnage

Estimateurs du total sous tirage aléatoire simple sans remise Pour une variable y, l’estimateur de la moyenne est L’estimateur de la variance est IC: STT-2000; Échantillonnage

Poids d’échantillonnage Dans la formule le facteur N/ns est appelé poids d’échantillonnage. Ce facteur a une interprétation pour les spécialistes des sondages. Chaque observation yk est dilatée par le facteur N/ns. Supposons que N=1000 et que ns=100. Alors N/ns = 10 et c’est comme si chaque unité dans l’échantillon représente 10 unités dans la population. STT-2000; Échantillonnage

Taille de l’échantillon Pour trouver la taille de l’échantillon, il faut se munir d’un critère. Plusieurs approches existent. Ardilly p. 68 et Henry p.54. On a vu que l’intervalle de confiance est On appelle la précision ou encore la marge d’erreur. Après des calculs, on peut isoler n. STT-2000; Échantillonnage

STT-2000; Échantillonnage Quel est le n? Les détails sont dans Ardilly, p. 68 et Henry p.54. On calcule dans un premier temps S est l’écart-type. P est la précision. STT-2000; Échantillonnage

Que fait-on en pratique? On utilise habituellement les formules obtenues pour le tirage aléatoire simple. Ainsi, on fait « comme si » l’échantillon était obtenu par tirage aléatoire simple. Avantages: facile à mettre en œuvre. Inconvénients: la performance du tirage systématique dépend de l’ordre dans lequel se trouve les unités dans la base de sondage. On ne choisit pas cet ordre (ex: bottin téléphonique). STT-2000; Échantillonnage