Présentation 3 : Sondage aléatoire simple Programme d’appui à la gestion publique et aux statistiques Sous-programme Statistiques (PAGPS/SPS) Atelier de formation sur les techniques d’échantillonnage et le calcul de précision des indicateurs Présentation 3 : Sondage aléatoire simple Ousman KORIKO PAGPS/SPS 1 HTD
SOMMAIRE Introduction Formules d’estimations et précisions Probabilité d’inclusion et estimation des paramètres Tirage aléatoire simple d’un échantillon Tirage systématique d’un échantillon
Introduction Sondage aléatoire simple (SAS) : une méthode qui consiste à tirer au hasard avec ou sans remise dans une population de taille N, un échantillon de n individus et ceci en donnant la même chance de sélection à chaque unité. Exemple : tirage de n boules dans une urne qui en contient N.
Formules d’estimations et précisions Notations sur l’univers Notations sur l’échantillon N Population totale n Taille de l’échantillon Coefficient d’extrapolation des caractéristiques de l’individu i de l’échantillon à l’ensemble de la population Probabilité d’inclusion de l’individu dans l’échantillon Yi Valeur de la caractéristique Y pour le ième individu de la population yi Valeur de la caractéristique Y pour le ième individu de l’échantillon Total d’une caractéristique dans une population Total d’une caractéristique sur l’échantillon Moyenne d’une caractéristique dans la population Moyenne d’une caractéristique sur l’échantillon
Notations sur l’univers Notations sur l’échantillon Variance de la caractéristique Y dans la population Variance de la caractéristique Y dans l’échantillon Variance corrigée de la caractéristique Y dans la population Variance corrigée de la caractéristique Y dans l’échantillon Coefficient de variation du total Y dans la population Coefficient de variation de Y dans l’échantillon
Probabilité d’inclusion et estimation des paramètres Estimateur du total : Estimateur de la moyenne : On montre que ces estimateurs sont sans biais : Estimateur de la variance de l’estimateur de la moyenne: L’estimation de la dispersion corrigée :
Probabilité d’inclusion et estimation des paramètres Intervalle de confiance du paramètre ɵ avec 5% de risque :
Tirage aléatoire simple d’un échantillon Numéroter les unités de l’univers de 1 à N. Ranger les numéros dans une seule colonne. Générer un nombre aléatoire entre 0 et 1 devant chaque unité. Trier les unités dans l’ordre décroissant des nombres aléatoires Sélectionner les n premières unités pour constituer l’échantillon.
Tirage systématique d’un échantillon Tirage systématique d’un échantillon de n unités Disposer d’une liste finie d’unités de sondage numérotée de 1 à N Calculer un pas de tirage noté P = N/n, où n est la taille de l’échantillon à tirer Tirer un nombre aléatoire compris entre 0 et P La valeur obtenue est le numéro de la première unité tirée Ajouter à la valeur tirée le pas P calculé pour obtenir le numéro de l’unité suivante à sélectionner Poursuivre le processus jusqu’à l’obtention des n unités de l’échantillon.
Tirage systématique Précautions : soit P le pas de tirage calculé. Soit α un nombre aléatoire tiré entre 0 et 1. Alors P et α sont des nombres réels. Soit X1=Pα. Alors X1 désigne le numéro de la première unité sélectionnée. X2=X1+P, Xi=Xi-1+P Soit Xi, tel que u ≤ Xi<u+1 où u est un entier naturel. On considère alors que l’unité sélectionnée correspond à l’entier immédiatement supérieur, soit u+1.
Exercices pratiques Exercice 1 : soit dans le tableau ci-après, la distribution de la superficie des exploitations agricoles numérotées de 1 à 7. Calculer la superficie moyenne des exploitations agricoles Former tous les échantillons possibles de 2 exploitations parmi les 7. Calculer la superficie moyenne des exploitations pour chaque échantillon Calculer la moyenne des moyennes des superficies des différents échantillons. Qu’observe-t-on ? Numéro de l’exploitation 1 2 3 4 5 6 7 Superficie 8 10
Exercices pratiques Exercice 2 : le directeur d’une entreprise cherche à évaluer la performance de son personnel. L’entreprise emploie 500 personnes auxquelles le directeur fait passer un test psychotechnique. Toutes les copies sont corrigées. Il a décidé d’évaluer la performance du personnel à partir d’un échantillon de 50 personnes. quel est le nombre possible d’échantillons ? quel plan de sondage peut-on lui conseiller ? pourquoi ? quel mode de tirage peut-on lui conseiller? pourquoi ?
Exercices pratiques Le Directeur de l’entreprise a sélectionné au hasard les 50 copies. Les caractéristiques de l’échantillon sont : moyenne des notes Calculer les grandeurs suivantes et et les intervalles de confiance respectifs.
MERCI DE VOTRE AIMABLE ATTENTION