Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Les mesures dans les enquêtes
Exemples de traitement de la non réponse dans les enquêtes
2
Plan Remarques préliminaires Rappel des sources et causes des erreurs
Consignes pour minimiser les erreurs Traitement de la non réponse Etapes pratiques d’imputation Exemples de traitement de la non réponse pour les variables quantitatives Exemples de traitement de la non réponse pour les variables qualitatives
3
Remarques préliminaires
Le but majeur de toute investigation statistique est d’obtenir des informations de bonne qualité permettant de donner une image fidèle de l’ampleur du (des ) phénomène(s) étudié (s) , de ses caractéristiques et de sa variabilité La détection de toutes les sources d’insuffisance constitue une étape cruciale dans la réalisation de ce but Toutes les sources de données ( recensements , enquêtes ,statistiques administratives ) sont concernées par ce phénomène Il n’est pas probablement efficace de se focaliser sur une source d’erreur et de négliger les autres sources d’erreurs Il n’est peut être pas efficace d’avoir une grande taille de l’échantillon dans le but de réduire l’erreur d’échantillonnage, si les autres sources d’erreurs sont beaucoup plus grandes que l’erreur d’échantillonnage. Une partie du budget de l’opération peut être alloué plus efficacement pour réduire les autres sources d’erreur. Seule l’erreur d’échantillonnage est propre aux sondages ; les autres erreurs s’appliquent également aux recensements et aux statistiques administratives
4
Remarques préliminaires
Il est important de ne pas confondre non-réponse et réponse sans objet. On ne peut en effet parler de non réponse que pour des variables pour lesquelles on sait qu’il existe une valeur. La non réponse peut apparaître comme une des réponses possibles à une question d’opinion. La modalité ‘sans opinion’ est alors une valeur possible de la réponse. Il ne s’agit pas donc d’une erreur de mesure si l’on admet qu’une personne peut réellement ne pas avoir d’opinion sur un sujet. La non réponse est une erreur de mesure quand on peut raisonnablement supposer que derrière une non réponse se cache une vraie valeur de la variable d’intérêt Un questionnaire bien conçu doit anticiper ces problèmes. Par exemple, si une question est sans objet, pour la clarté de l’entretien, elle ne doit pas être posée. La modalité « sans opinion » doit exister pour les questions d’opinion. Une mauvaise conception du questionnaire amènera inévitablement des confusions entre : -sans objet -non réponse -sans opinion
5
Rappel des sources et causes d’erreurs
Deux grands types d’erreur: Erreur d’échantillonnage : provient du fait qu’on observe uniquement une partie de la population objet d’étude Erreur d’observation ou erreur non due à l’échantillonnage : les erreurs de couverture, les erreurs de mesure et de traitement et les erreurs de non réponse
6
Erreurs d’observation
Erreur de couverture : provient du fait que la base de sondage correspond rarement à la population cible et de l’impossibilité d’appliquer exactement le plan de sondage fixé, Erreur de sur dénombrement : la base de sondage contient des unités qui ne font pas partie de la population cible, Erreur de sous dénombrement: la base de sondage est une sous population de la population cible. Cette erreur va affecter tous les estimateurs d’un biais, puisque certaines unités auront une probabilité nulle d’être sélectionnée. Répétition des unités dans la base de sondage : Ce problème est certainement le plus délicat à traiter. Dans beaucoup de bases de données administratives, certaines unités peuvent être représentées plusieurs fois Erreur de mesure : elle peut provenir ou avoir diverses causes : interviewer , interviewé , mauvaise rédaction du questionnaire, codification, saisie, façon de poser la question,…..etc. Erreur causée par la non réponse : on distingue la non réponse totale et la non réponse partielle.
7
Non réponse totale absence complète d’information sur une unité
Quand toutes les valeurs de toutes les variables(questions) sont manquantes pour une unité d’échantillonnage, absence complète d’information sur une unité Causes L’unité d’observation n’a pas pu être contactée, L’unité d’observation est incapable de répondre à l’enquête, Le questionnaire est perdu ou inexploitable, L’unité d’observation abandonne dès le début de l’enquête; Impossibilité d’atteindre des zones couvertes par l’enquête
8
Non réponse partielle Quand une partie du questionnaire n’est pas renseignée une ou plusieurs ( pas toutes) des valeurs est manquante. Causes l’unité d’observation refuse de répondre à certaines questions abordant des thèmes sensibles ( ex: revenu, patrimoine…), ou encore tabous (pratique contraceptive, consommation d’alcool, de drogues, opinions particuliers…..) l’unité d’observation sélectionnée ne comprend pas la question, ou l’enquêteur n’a pas compris la réponse de l’enquêté, les réponses sont incohérentes l’unité d’observation abandonne au cours de l’enquête
9
Consignes pour minimiser les erreurs
Trois étapes importantes doivent être séparées pour essayer de minimiser au maximum ces erreurs La phase conceptuelle Une bonne délimitation de l’objet de l’étude Un questionnaire qui répond clairement aux objectifs Actualisation des nomenclatures utilisées Choix judicieux du personnel engagé au niveau de la collecte Formation appropriée Elaboration de formulaires retraçant les difficultés à rencontrer Conception d’un plan de sondage adéquat
10
Consignes pour minimiser les erreurs
La phase de collecte multiplier les efforts pour parvenir à collecter l’information souhaitée (plusieurs visites) insister sur l’interview de l’unité concernée ne pas hésiter à reposer la question en cas de réponse * vague ‚ ambiguë * ou partielle‚ incomplète * ou orientée volontairement vers une sous déclaration
11
Consignes pour minimiser les erreurs
La phase post collecte Assurer une saisie intelligente des différents supports de collecte Garantir une bonne programmation des différents tests (validité cohérence‚ vraisemblance ,,,,,) Pourvoir un choix judicieux des variables auxiliaires pour modéliser la non réponse Sélection de méthode optimale de redressement de la non réponse
12
Traitement de la non réponse
Que faire en présence de non réponse ? Ne rien faire Utiliser uniquement les enregistrements pour lesquels les données sont complètes (se limiter aux données sur les répondants) Utiliser une méthode de repondération Imputer une valeur à la non réponse.
13
Traitement de la non réponse
les méthodes de repondération C’est une approche qui repose sur le principe du caractère aléatoire de la décision de répondre ou non se formalise donc par une probabilité qu’il faut estimer Les pistes d’estimation de cette probabilité sont multiples, mais souvent on cherche à partitionner la population en sous population au sein desquelles ces probabilités restent constantes. La repondération est une technique satisfaisante pour la non réponse totale N’est pas pratique pour la non réponse partielle, qui touche les différentes variables de façon différente : il faudrait une pondération par variable, et même par couple de variables etc.
14
Traitement de la non réponse
les méthodes d’imputation Imputation simple A- Méthode déterministe l’imputation par la moyenne , par le ratio ; par la régression; par le voisin le plus proche B- Méthodes aléatoires ou stochastiques Ces méthodes se basent sur le concept de donneur. La donnée manquante est remplacée par la valeur observée pour un individu répondant choisi au hasard ( Hot-deck , Clod-deck ) Imputation multiple Principe: chercher à remplacer les valeurs manquantes pour toute unité non répondante à travers une modélisation directe du comportement en utilisant un vecteur d’informations auxiliaires
15
Etapes pratiques d’imputation
Calcul de la moyenne de la variable d’étude au niveau des seuls répondants ( sans les non répondants) Imputer par une méthode quelconque les valeurs des répondants aux non répondants Calcul de nouveau de la moyenne de la variable que devient cette moyenne ne pas s’arrêter à ce niveau Mesurer l’effet de cette imputation Calculer Vr : la variance de la variable sans les non répondants Calculer V i : la variance de la variable après imputation Calculer le rapport ( Vr / Vi ) et le comparer à l’unité
16
Etapes pratiques d’imputation
Veiller à recourir à d’autres caractéristiques à même d’aider à expliquer la variabilité de la variable d’étude Chercher des variables auxiliaires supposées être fortement corrélées à la variable d’étude et permettant La subdivision de la population en groupes homogènes vis-à-vis de la variable d’étude La combinaison de plusieurs variables
17
Traitement de la non réponse pour les variables quantitatives - Exemple 1
Au niveau d’une enquête anthropomètrique, on veut à partir de 12 observations estimer le poids moyen , la taille moyenne et l’IMC ( indice de Quetelet) d’une population d’une classe de 120 étudiants Personne Poids ( Kg) Taille (cm) Sexe 1 ? 2 80 3 70 180 4 55 160 5 60 150 6 7 8 9 170 10 11 75 185 12 90 165
18
Traitement de la non réponse pour les variables quantitatives - Exemple 2
Au niveau d’une enquête sur les dépenses , on veut à partir de 12 observations estimer la dépense alimentaire mensuelle des 100 ménages constituant une localité ménage Dépense alimentaire Taille Milieu de résidence 1 2000 4 rural 2 2800 urbain 3 2500 1000 5 1700 6 ? 7 8 1800 9 2100 10 11 3000 12 1600
19
Traitement de la non réponse pour les variables quantitatives - Exemple 3
Au niveau d’une enquête sur les revenus , on veut à partir de 10 observations estimer le revenu mensuel des 100 ménages constituant une localité ménage Revenu du ménage Activité du chef Strate d’habitat 1 20 000 entrepreneur luxe 2 12000 salarié moderne 3 4500 retraité ancienne 4 ? périphérique 5 7000 6 5000 femme au foyer 7 4000 agriculteur rural 8 9 3200 ouvrier agricole 10 3800
20
Perception de l’évolution de la situation financière
Traitement de la non réponse pour les variables qualitatives - Exemple 1 Au niveau d’une enquête qualitative sur la perception de l’évolution future de la situation financière des salariés d’une entreprise ( 10 sur 100) 1: va s’améliorer 2: va stagner 3: va se détériorer Salarié Perception de l’évolution de la situation financière 1 2 3 4 5 ? 6 7 8 9 10
21
Traitement de la non réponse pour les variables qualitatives - Exemple 2
On reprend l’exemple de l’enquête anthropomètrique, mais cette fois c’est au niveau de la variable sexe qu’il ya des observations manquantes Personne Poids ( Kg) Taille (cm) Sexe 1 85 170 ? 2 80 175 3 70 180 4 55 160 5 60 150 6 7 8 9 10 65 11 75 185 12 90 165
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.