Échantillonnage (STT-2000) Section 2 Tirage aléatoire simple (plan SI). Version: 22 août 2003
STT-2000; Échantillonnage 2 Plan aléatoire simple sans remise Ce plan est tel que tout échantillon de taille n, où n est déterminée à lavance, possède la même probabilité. Ce tirage est essentiellement ce que lon a en tête quand on tire dans une urne n boules sans remise qui sont bien mélangées et indétectable au toucher. En pratique, il faut des algorithmes pour mettre en œuvre ce plan.
STT-2000; Échantillonnage 3 Fonction de probabilité
STT-2000; Échantillonnage 4 Probabilités dinclusion dordre 1 Toutes les unités ont la même probabilité dinclusion:
STT-2000; Échantillonnage 5 Probabilité dinclusion dordre 2
STT-2000; Échantillonnage 6 Algorithmes pour la mise en œuvre du tirage SI Deux types dalgorithmes: – Par une série de tirages, où chaque tirage donne une unité incluse, jusquà la taille désirée n. – Par une série dexpériences, une pour chaque unité dans la base de sondage, selon lordre défini par cette base de sondage particulière. Lexpérience pour lunité k donne soit le résultat « unité incluse » ou « unité non incluse ».
STT-2000; Échantillonnage 7 Exemple dalgorithme du premier type Tirer la première unité en donnant une probabilité 1/N à toutes les unités. Ne pas remettre lunité choisie. Tirer la seconde unité en donnant une probabilité de 1/(N-1) aux unités restantes. Ne pas remettre lunité choisie. … Tirer la n ième unité en donnant la probabilité 1/(N-n+1) à toutes les unités restantes. Fin.
STT-2000; Échantillonnage 8 Second exemple dun algorithme du premier type Tirer la première unité en donnant un probabilité de 1/N à toutes les unités. Noter lunité et remettre lunité. Répéter jusquà ce que lon ait obtenu n unités distinctes. Il faut ainsi un nombre dessais valant et satisfaisant Le nombre de tirage est aléatoire.
STT-2000; Échantillonnage 9 Premier exemple dun algorithme du second type (SSW, p.12) Soient u 1,u 2,…,u N des réalisations dune variable aléatoire U(0,1). Si u 1 < n/N, alors lunité k=1 est incluse. … Si u k < (n-n k )/(N-k+1), où n k = nombre déléments choisis parmi les k-1 éléments dans la liste de la population. La procédure arrête quand n k = n.
STT-2000; Échantillonnage 10 Second exemple dun algorithme du second type Soient u 1,u 2,…,u N des réalisations dune variable aléatoire U(0,1). Trier les nombres obtenus par ordre croissant: u (1) < u (2) < … < u (N) Les unités retenues correspondent aux indices des n premiers individus de la liste triée.
STT-2000; Échantillonnage 11 Exemple avec runif() Population de taille N = 10 On veut un échantillon de taille n = 3 Après avoir trié selon les nombres de la colonne unif Léchantillon est {1,3,7}