Échantillonnage (STT-2000) Section 2 Tirage de Bernoulli (plan BE). Version: 4 septembre 2003
STT-2000; Échantillonnage 2 Plan de Bernoulli (BE) Pour le mettre en œuvre, on exécute une expérience de Bernoulli pour chaque unité dans la base de sondage, avec la probabilité pour inclusion, et 1- pour la non-inclusion. Les expériences sont effectuées de manière indépendantes. L’échantillon est composé des unités k pour lesquelles on a obtenu inclusion.
STT-2000; Échantillonnage 3 Algorithme pour exécuter un plan BE On simule N variables aléatoires U(0,1) indépendamment. Avec S-PLUS, on peut utiliser runif(). On obtient alors u 1, u 2, …, u N. Si u i < , alors l’unité est choisie. Sinon l’unité est rejetée. On a bien P(U i < ) = puisque U i est U(0,1).
Illustration du plan BE
STT-2000; Échantillonnage 5 Utilisation de la fonction S-PLUS runif()
Trois échantillons, 14/30 = 0.46
STT-2000; Échantillonnage 7 Échantillons retenus Les trois échantillons sont: s 1 = {1, 2, 3, 5, 6, 7, 9, 10, 13, 17, 19, 24, 25, 26}; s 2 = {4, 8, 9, 10, 12, 13, 14, 16, 17, 19, 21, 22, 25, 27, 28, 29, 30}; s 3 = {1, 3, 4, 5, 6, 7, 9, 11, 12, 13, 16, 17, 18, 19, 22, 23, 24, 28, 29, 30}.
STT-2000; Échantillonnage 8 Exemple d’utilisation du plan BE Enquête canadienne sur l’emploi, la rémunération et les heures de 1994 de Statistique Canada. Le plan d’échantillonnage est un plan stratifié à deux phases: – Phase I: considère des strates par région. On fait un plan BE dans chaque strate. On ramasse beaucoup d’information sur les unités choisies (informations par cher à obtenir). – Phase II: On fait un tirage aléatoire simple dans les unités choisies. On recueille l’information qui nous intéresse vraiment.
STT-2000; Échantillonnage 9 Probabilités d’inclusion dans un plan BE La taille de l’échantillon s, que l’on note n s, est aléatoire. En fait, Pour montrer cela, on note que et les I k sont indépendantes,