Présentation 8 : Redressement des estimateurs Programme d’appui à la gestion publique et aux statistiques Sous-programme Statistiques (PAGPS/SPS) Atelier de formation sur les techniques d’échantillonnage et le calcul de précision des indicateurs Présentation 8 : Redressement des estimateurs Ousman KORIKO PAGPS/SPS 1 HTD
SOMMAIRE Introduction Post stratification simple Cas d’un sondage aléatoire simple Cas d’un sondage complexe Post stratification sur plusieurs critères Estimateur par le ratio ou le quotient
Introduction Objet des méthodes de sondage aléatoire : estimations des indicateurs, Ces estimations peuvent être biaisées, soit à cause des non réponses soit à la suite des distorsions éventuelles apparues dans l’échantillon des unités statistiques enquêtées. D’où le recours aux informations auxiliaires, extérieures aux données collectées pendant l’enquête, pour procéder à un redressement des estimateurs.
Introduction Soit Wi le coefficient de pondération initialement déterminé pour un individu i appartenant à un échantillon tiré au hasard. Wi est connu avant la descente sur le terrain pour la collecte des données. Si à l’avance, la structure des coefficients de pondération initiale présente une forte distorsion, il est possible de remédier soit en changeant de plan de sondage ou en modifiant la taille de l’échantillon.
Introduction Par contre, la structure des coefficients de pondération peut être bonne, alors que les extrapolations conduisent à des sous estimations ou à des distorsions dans les structures démographiques, économiques, etc… Exemple 1 : l’estimation de la population totale de l’univers par extrapolation du nombre d’individus dans les ménages enquêtés, peut être différente des données de la projection démographique. Exemple 2 : la pyramide des âges de la population estimée par l’enquête peut être différente de celle issue d’un recensement général de la population et de l’habitat.
Introduction Les différentes méthodes de redressement permettent de corriger les effets de niveau et les effets de structure.
Post stratification simple C’est la méthode de redressement la plus connue. Le principe : découper l’univers en strates, calculer les indicateurs par strate agréger le tout pour obtenir des estimations globales.
Cas d’un sondage aléatoire simple L’estimateur brut (avant redressement) de la moyenne d’une grandeur Y s’écrit : Si après l’enquête, l’univers est découpé en k strates avec respectivement une population vraie Nh, alors l’estimateur redressé de la moyenne s’écrira : Ou encore :
Cas d’un sondage aléatoire simple Les sont des moyennes simples de la grandeur Y calculées sur les différentes parties d’échantillon qui se retrouvent respectivement dans les strates h. L’estimateur post-stratifié d’un total de la grandeur Y s’écrit alors : La post-stratification entraine ainsi la modification des coefficients de pondération initiale. Il s’agit en fait d’une méthode de calage sur les effectifs. Les poids modifiés sont
Cas d’un sondage aléatoire simple Les sont inconnues avant l’enquête et sont aléatoires. La variance de l’estimateur post stratifié de la moyenne est donnée par la formule suivante : L’estimateur de la variance de l’estimateur post-stratifié de la moyenne est donnée par la formule :
Cas d’un sondage complexe La méthode de calage sur des effectifs peut aussi s’appliquer à un échantillon tiré selon un plan de sondage quelconque. Plan complexe non stratifié avec des tirages équiprobables à chaque degré : l’estimateur s’écrit simplement : C’est un estimateur biaisé. Sa variance est fonction du plan de sondage et peut-être compliqué à calculer.
Cas d’un sondage complexe Plan complexe non stratifié avec tirage à probabilités inégales L’estimateur s’écrit : Avec et est l’estimateur sans biais de la vraie taille Nh de la post- strate h (connue par ailleurs). En cas d’un plan sondage complexe et stratifié, effectuer la post-stratification au sein de chaque strate définie à priori.
Post stratification sur plusieurs critères : raking ratio On parle de post stratification complexe lorsqu’il intervient plusieurs critères dans le découpage à posteriori. C’est la méthode du raking ratio qui est utilisée pour caler les estimations d’un échantillon sur plusieurs critères. Il est fréquent que l’on ne dispose pas des effectifs de population sur les croisements des critères, mais seulement on connait la répartition de la population pour chacun des critères pris isolément tel qu’il est décrit dans le tableau ci-après.
Post stratification sur plusieurs critères : raking ratio Dans la population A B B1 B2 B3 Total A1 N11 Inconnu N12 Inconnu N13 Inconnu N1. A2 N21 Inconnu N22 Inconnu N23 Inconnu N2. N.1 N.2 N.3 N
Post stratification sur plusieurs critères : raking ratio Dans l’échantillon A B B1 B2 B3 Total A1 n11 connu n12 connu n13 connu n1. A2 n21 connu n22 connu n23 connu n2. n.1 n.2 n.3 n
Post stratification sur plusieurs critères : raking ratio
Post stratification sur plusieurs critères : raking ratio
Post stratification sur plusieurs critères : raking ratio
Post stratification sur plusieurs critères : raking ratio
Post stratification sur plusieurs critères : raking ratio
Post stratification sur plusieurs critères : raking ratio
Post stratification sur plusieurs critères : raking ratio
Estimateur par le ratio ou le quotient
Estimateur par le ratio ou le quotient
Estimateur par le ratio ou le quotient
Estimateur par le ratio ou le quotient
Estimateur par le ratio ou le quotient
Estimateur par le ratio ou le quotient
MERCI DE VOTRE AIMABLE ATTENTION