Programme d’appui à la gestion publique et aux statistiques Sous-programme Statistiques (PAGPS/SPS) Atelier de formation sur les techniques d’échantillonnage et le calcul de précision des indicateurs Présentation 2 : Considérations pratiques dans l’élaboration d’un plan de sondage Ousman KORIKO PAGPS/SPS 1 HTD
SOMMAIRE Introduction Détermination de la taille d’échantillon Choix de la base de sondage Exemple d’un plan de sondage Principaux paramètres estimés dans les enquêtes Méthodes d’échantillonnage
Introduction La décision de réaliser une enquête par sondage doit doit tenir compte non seulement des objectifs de l’étude mais aussi d’autres facteurs tels que les contraintes budgétaires. Les principaux concepts de l’étude doivent être définis. Pour y arriver, il faut effectuer une revue de la littérature. Se fixer des objectifs de qualité des indicateurs : La principale préoccupation dans le choix d’un plan de sondage est d’estimer des indicateurs fiables et vraisemblables.
Détermination de la taille d’échantillon Taille de l’échantillon : grande question à résoudre dès le départ. Tenir compte de trois préoccupations : i) la précision des estimations, ii) les contraintes de mise en œuvre du plan de sondage, iii) l’efficacité du plan de sondage. La détermination de la taille de l’échantillon est fonction de la probabilité d’apparition du phénomène étudié et non de la taille de l’univers Le choix de la taille d’échantillon a pour but de limiter les erreurs aléatoires et non les erreurs d’observation.
Détermination de la taille d’échantillon Dans le cas d’un sondage aléatoire simple (SAS), la formule suivante est souvent utilisée pour déterminer la taille de l’échantillon en vue d’obtenir un degré de précision d’une moyenne : 𝑛= 𝑧 2 𝑆 2 𝑒 2 + 𝑧 2 𝑆 2 𝑁 Les étapes suivantes sont requises pour la détermination de n Se donner une marge d’erreur e
Détermination de la taille d’échantillon Une valeur z correspondant à un niveau de confiance voulue. Pour un risque de 5%, z vaut 1,96 ou 2 la taille de la population N Une estimation de la variabilité de la population 𝑆 2 Dans le cas d’une proportion, l’équation s’écrit : 𝑛= 𝑧 2 𝑃 (1− 𝑃) 𝑒 2 + 𝑧 2 𝑃 (1− 𝑃) 𝑁
Détermination de la taille d’échantillon Dans le cas où N est suffisamment grand, l’expression devient 𝑛= 𝑧 2 𝑃 (1− 𝑃) 𝑒 2 Exemple : si z=1,96; P=0,5 et e=0,05 alors : 𝑛= (1,96) 2 ∗0,5(1−0,5) (0,05) 2 Soit n=384
Taille de l’échantillon Exemples des tailles d’échantillon pour une proportion P=0,5 (SAS) avec un taux de confiance de 95% Taille de l’échantillon Marge d’erreur 50 ± 0,139 100 ± 0,098 500 ± 0,044 1000 ± 0,031
Détermination de la taille d’échantillon Dans le cas où N n’est pas suffisamment grand, on peut ajuster la taille de l’échantillon initial (notée n1) par l’expression : 𝑛 2 = 𝑛 1 𝑁 𝑁+ 𝑛 1 Exemple : si N=8000 et n1=384 alors : 𝑛 2 =384 8000 8000+384 Soit n2=366
Détermination de la taille d’échantillon Dans le cas d’un sondage aléatoire à plusieurs degrés, on ajuste la taille de l’échantillon par l’effet de plan de sondage (Deff) à l’aide de l’expression : 𝑛 3 = 𝑑𝑒𝑓𝑓∗𝑛 2 Exemple : si deff=1,2 et n2=366 alors : 𝑛 3 =366∗1,2 Soit n3=439
Détermination de la taille d’échantillon En faisant l’hypothèse sur le taux de réponse noté r à l’enquête, alors on peut ajuster la taille d’échantillon par la formule : 𝑛 4 = 𝑛 3 𝑟 Exemple : si r=0,8 et n3=439 alors : 𝑛 4 = 439 0,8 Soit n4=549
Détermination de la taille d’échantillon Dans le cas d’un sondage aléatoire simple stratifié Option 1 : marge d’erreur pour l’estimation de la population dans l’ensemble On calcule n et on procède à sa répartition dans les strates (allocation proportionnelle, allocation optimale de Neyman, etc…) Option 2 : marge d’erreur pour l’estimation de la population dans chaque strate Le cumul des tailles des échantillons des strates donne l’échantillon total
Choix de la base de sondage Une autre étape à franchir est le choix de la base de sondage de bonne qualité : i) une couverture exhaustive, ii) pas de doubles enregistrements, iii) pas des unités « mortes », iv) non basée essentiellement sur des informations anciennes.
Exemple : EDM 2008 dans les pays de l’UEMOA Villes/Pays Cotono u (Bénin) Ouagadoug ou (Burkina Faso) Abidjan (Côte d’Ivoire) Bissau (Guinée Bissau) Bamak o (Mali) Niamey (Niger) Dakar (Sénégal ) Lomé (Togo) Taille de l’échantillon des grappes 84 Taille de l’échantillon des ménages 1008 Nombre de strates 3 2 1 7 4 Taux de réponse en % 100 97,3 99,4 98,9 97 98 99,2 96,6 Coefficient de variation de dépense totale (%) 5,5 6,2 7,1 6,4 5,7 5,1
Principaux paramètres estimés dans les enquêtes Soit Y une variable d’intérêt Une enquête par sondage peut permettre d’estimer les caractéristiques suivantes de Y : Le total, la moyenne (la proportion est une moyenne calculée pour une variable qualitative), le ratio La variance et le coefficient de variation des estimateurs L’effet de sondage et l’effet de grappe
Méthodes d’échantillonnage Sondage aléatoire simple (SAS) : Une méthode qui consiste à tirer au hasard avec ou sans remise dans une population de taille N, un échantillon de n individus et ceci en donnant la même chance de sélection à chaque unité. Exemple : tirage de n boules dans une urne qui en contient N. Sondage stratifié : la méthode consiste d’abord à constituer selon des critères précis, des groupes homogènes de population, indépendants les uns des autres, puis de réaliser un type de sondage dans chaque groupe.
Méthodes d’échantillonnage Sondage à probabilités inégales : C’est une forme de sondage aléatoire à un degré dont le dispositif accorde plus de chances de sélection à certaines unités que d’autres. Sondage à plusieurs degrés : méthode qui consiste à tirer dans un premier temps, un nombre fini d’unités appelées unités primaires (exemple zones de dénombrement), puis à tirer dans ces zones, un nombre fini d’unités secondaires qui seront finalement enquêtées.
Méthodes d’échantillonnage Sondage en grappes : Forme particulière de sondage à deux degrés. Les unités primaires sont d’abord sélectionnées au hasard. Toutes les unités secondaires dans les UP sélectionnées sont alors enquêtées. On parle de ratissage. Méthodes non probabilistes ou à choix raisonné : méthode des quotas, échantillon de convenance, méthode des itinéraires, méthode de la boule de neige
MERCI DE VOTRE AIMABLE ATTENTION