Échantillonnage (STT-2000) Section 2 Estimation sans biais du total. Version: 22 août 2003
Estimation de la moyenne et du total dans un plan systématique Il peut être montré que la quantité suivante estime la moyenne: De même, le total de la variable y peut être estimé par STT-2000; Échantillonnage
Estimation de la variance dans un plan systématique Malheureusement, il n’existe pas d’estimateurs de variance pour les estimateurs précédents! L’estimation de la variance sera toujours la considération délicate dans un tirage systématique. La raison en est la suivante: le hasard dépend uniquement d’une seule unité (celle choisie parmi les a premières dans la liste). STT-2000; Échantillonnage
Problème relié aux cycles possibles Dans cet exemple, si par malchance il existe un « cycle » comme dans l’exemple extrême ci-contre, l’échantillonnage risque de donner que les petites valeurs de la variable d’intérêt. STT-2000; Échantillonnage
Autre exemple de cycles Si par malchance les données sont listées selon les mois de janvier, février, mars, etc… et si le pas est de 12, alors les données d’un même mois seront toujours sélectionnées! Dans la mesure du possible, dans l’exemple précédent, il suffit de bien mélanger la population avant de procéder au tirage. STT-2000; Échantillonnage
Probabilité de sélection (Henry, p.25 et voir acétate 11 du cours 1) Dans la formule ci-dessus le facteur ns/N est appelée la probabilité de sélection. Probabilité de sélection = probabilité de faire partie de l’échantillon. Dans ce cas-ci, les chances sont les mêmes pour toutes les unités dans la population; c’est un plan à probabilités égales. STT-2000; Échantillonnage
Estimateurs de la moyenne sous tirage aléatoire simple sans remise Pour une variable y, l’estimateur de la moyenne est L’estimateur de la variance est où La constance f=n/N est le taux de sondage. IC: STT-2000; Échantillonnage
Estimateurs du total sous tirage aléatoire simple sans remise Pour une variable y, l’estimateur de la moyenne est L’estimateur de la variance est IC: STT-2000; Échantillonnage
Poids d’échantillonnage Dans la formule le facteur N/ns est appelé poids d’échantillonnage. Ce facteur a une interprétation pour les spécialistes des sondages. Chaque observation yk est dilatée par le facteur N/ns. Supposons que N=1000 et que ns=100. Alors N/ns = 10 et c’est comme si chaque unité dans l’échantillon représente 10 unités dans la population. STT-2000; Échantillonnage
Taille de l’échantillon Pour trouver la taille de l’échantillon, il faut se munir d’un critère. Plusieurs approches existent. Ardilly p. 68 et Henry p.54. On a vu que l’intervalle de confiance est On appelle la précision ou encore la marge d’erreur. Après des calculs, on peut isoler n. STT-2000; Échantillonnage
STT-2000; Échantillonnage Quel est le n? Les détails sont dans Ardilly, p. 68 et Henry p.54. On calcule dans un premier temps S est l’écart-type. P est la précision. STT-2000; Échantillonnage
Que fait-on en pratique? On utilise habituellement les formules obtenues pour le tirage aléatoire simple. Ainsi, on fait « comme si » l’échantillon était obtenu par tirage aléatoire simple. Avantages: facile à mettre en œuvre. Inconvénients: la performance du tirage systématique dépend de l’ordre dans lequel se trouve les unités dans la base de sondage. On ne choisit pas cet ordre (ex: bottin téléphonique). STT-2000; Échantillonnage