Échantillonnage (STT-2000) Section 2 Aspects spéciaux de léchantillonnage et de lestimation. Version: 7 septembre 2003
STT-2000; Échantillonnage 2 Estimation par domaines (SSW, chap. 10; Satin et Shastry, p. 53) On a déjà discuté de différentes sous- populations reliées à léchantillonnage. Parfois ces sous-populations sont nommées des domaines. Exemples de domaines: – âge, sexe, activité, profession.
STT-2000; Échantillonnage 3 Estimation dans chaque domaine En pratique, lestimation dans chaque domaine nécessite un échantillon assez grand. Idéalement, – On sarrange pour stratifier selon ces domaines. Dans un tel cas, les strates sont exactement les domaines. – On peut planifier, comme dans un plan stratifié, la taille dans chaque strate (domaine). Quand on ne peut procéder de façon idéale, on doit utiliser léchantillon s à notre disposition. – Questions qui surviennent après le sondage.
STT-2000; Échantillonnage 4 U1U1 U2U2 s U U 1 = population des hommes, U 2 = population des femmes Exemple
STT-2000; Échantillonnage 5 Estimation dans chaque domaine (suite) Dans lexemple précédent, léchantillon s pourrait être tiré selon SI, SY, BE dans la population U. Exemple: Ainsi, sous un plan SI, si léchantillon est de taille n = 1000, on sattend dobtenir environ 500 hommes et 500 femmes. Cependant, il peut en être différemment en pratique.
STT-2000; Échantillonnage 6 Estimation dans chaque domaine (suite) Théorie entourant lestimation dans chaque domaine…
STT-2000; Échantillonnage 7 Problème des grandes unités (Satin et Shastry, p. 53) Dans les enquêtes sur les populations humaines, il arrive fréquemment que quelques grandes villes aient une influence marquée. – Beaucoup de petites villes; quelques très grandes villes. Il en est de même dans les enquêtes agricoles, les enquêtes portant sur les entreprises. – Quelques unités (fermes, entreprises) ont une influence considérable. – Revenues de certaines entreprises présentent des valeurs très élevées par rapport aux valeurs généralement observées (PME versus multinationales).
STT-2000; Échantillonnage 8 Que se passe-t-il si le plan déchantillonnage est mal conçu? Les estimations des caractéristiques risquent dêtre – 1) Trop élevées si les grosses unités sont sur-représentées. – 2) Trop faibles si les unités sont sous représentées.
STT-2000; Échantillonnage 9 Idéalement, que faire pour surmonter les difficultés dans de telles populations? Si possible, on peut tenter de stratifier les entreprises (ou les fermes, ou les grosses unités) en fonction de leur taille – On pourrait créer une strate « prendre tout ». On pourrait choisir toutes les grandes unités en donnant k = 1 si k est une grande entreprise, disons pour k dans U grande. – Pour les petites entreprises, disons la population U petite, on pourrait échantillonner (disons par SI) normalement.
STT-2000; Échantillonnage 10 Si ce nest pas possible? Lestimateur Horvitz-Thompson est une méthode destimation. Il existe dautres méthodes destimation. Le problème des grandes unités est relié au problème des valeurs aberrantes. Il existe toute la théorie des méthodes robustes. Estimateur possible: M-estimateur.
STT-2000; Échantillonnage 11 M-estimateur Pour illustrer la technique, limitons-nous au plan SI, k = n/N. On peut noter que lestimateur Horvitz- Thompson est obtenu solution de léquation: Le M-estimateur est obtenu comme solution de léquation
STT-2000; Échantillonnage 12 M-estimateur (suite) Un exemple de fonction est la fonction Il est possible détudier la variance de ces estimateurs, de considérer des plans plus généraux que SI, etc. Cependant, cela va bien au delà dun premier cours.