Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Base de sondage et Plan de sondage Pres. 5
Corrélation Position du problème Définition covariance (X,Y) r =
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Classification et prédiction
But de la lecture critique
Les tests d’hypothèses (I)
Echantillonnage Introduction
ENQUETE ANNUELLE DENTREPRISES DANS LE SECTEUR DU COMMERCE (EXERCICE 2004) ROYAUME DU MAROC HAUT COMMISSARIAT AU PLAN DIRECTION DE LA STATISTIQUE.
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Traitement des données.
Collecte de données F. Kohler.
Comparaison de plusieurs moyennes observées
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
Les K plus proches voisins
Les TESTS STATISTIQUES
Échantillonnage-Estimation
Dr DEVILLE Emmanuelle J D V 12/07/2006
16ème Conférence Nationale des Présidents de Commissions locales dinformation Autorité de Sûreté Nucléaire Paris, 8 décembre 2004 Perception et Gestion.
Probabilités et statistique en TS
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
Régression linéaire simple
Échantillonnage (STT-2000)
Comprendre la variation dans les données: Notions de base
Échantillonnage (STT-2000)
Méthodes de prévision (STT-3220)
Le test t.
Distribution d’échantillonnage
Échantillonnage (STT-2000) Section 2 Tirage aléatoire simple (plan SI). Version: 22 août 2003.
La méthode sociologique
Théorie de l’échantillonnage (STT-6005)
Lectures Volume du cours : Chapitre 7
Régression linéaire (STT-2400)
Échantillonnage (STT-2000) Section 2 Aspects spéciaux de léchantillonnage et de lestimation. Version: 7 septembre 2003.
Échantillonnage (STT-2000) Section 3 Utilisation de variables auxiliaires. Version: 8 septembre 2003.
Régression linéaire (STT-2400)
Échantillonnage (STT-2000) Section 2 Tirage de Bernoulli (plan BE). Version: 4 septembre 2003.
Méthodes de prévision (STT-3220)
Échantillonnage (STT-2000)
Méthodes de prévision (STT-3220) Section 6 Exemple: Prévisions dans un modèle AR(1) Version: 18 décembre 2008.
Échantillonnage (STT-2000)
Méthodes de Biostatistique
CHAPITRE IV MÉTHODES DE COLLECTE ET DE TRAITEMENT DES DONNÉES
Théorème de la limite centrale l’inférence statistique
CHAPITRE IV MÉTHODES D’ANALYSE DES DONNEES. QUAND ET POURQUOI FAUT-IL FAIRE UN TEST T ?
Concepts d’échantillonnage statistique. Introduction Échantillon représentatif – Supprime la subjectivité / biais – Une confiance plus grande dans les.
Marquez cette valeur sur le diagramme à points de la question 6. La moyenne réelle des nombres de lettres par mots dans la population de l'ensemble des.
Présentation du marché obligataire
Echantillonage pour une Evaluation d’Impact
JEAN-MARC FONTAN SOC-1101 COURS 3
Les Techniques d’enquête quantitative
Échantillonnage (STT-2000)
Recherche de motifs par projections aléatoires
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
L’enquête de fréquentation hôtelière
Mais quel est donc le taux d’inflation actuel ? J.C. Lambelet et D. Nilles Catherine Roux Alvaro Aparicio Gregor Banzer Daniel Cavallaro.
Échantillonnage aléatoire simple
Concepts préliminaires sur les études de recherche Population: le groupe entier de personnes ou d'objets sur lequel un chercheur veut apprendre quelque.
JEAN-MARC FONTAN SOC-1101 COURS 4
1 Gestion des voitures médecins d'Urgences-Santé Michel Gendreau Émilie Frot¹ Gilbert Laporte Frédéric Semet¹ Centre de recherche sur les transports Université.
Échantillonnage (STT-2000)
Échantillonnage (STT-2000)
Analyse des données. Plan Lien entre les statistiques et l’analyse des données Propagation des erreurs Ajustement de fonctions.
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
Probabilités et statistique MQT-1102
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Introduction aux statistiques Intervalles de confiance
Transcription de la présentation:

Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003

STT-2000; Échantillonnage 2 Non-réponse Problème survenant dans plusieurs sondages. Peut varier considérablement dans le temps, même pour un même sondage effectué à plusieurs reprises dans le temps. Pour la contrôler: entraînement des interviewers, déroulement de l’entrevue (longueur de l’entrevue, choix et formulation des questions, etc.)

STT-2000; Échantillonnage 3 Exemples de non-réponse Incapacité de contacter un individu, un ménage, ou de manière générale une unité. La personne peut décider de ne pas répondre; refus catégorique; incompréhension (langue, analphabétisme) Idéalement, l’interviewer tente d’obtenir de l’information démographique sur le non- répondant (âge?, sexe?, ethnie?, lieu de résidence: rural/urbain?)

STT-2000; Échantillonnage 4 Effets de la non-réponse Biais potentiel dans les estimateurs des paramètres de la population. La non-réponse est particulièrement grave car la volonté de réponse est souvent liée à la variable d’intérêt y.

STT-2000; Échantillonnage 5 Facteurs principaux font que le biais est petit: Moyenne chez les non-répondants est similaire à la moyenne chez les répondants. Taux de non-réponse est raisonnablement petit. (Pour EPA = enquête population active, taux de non- réponse est d’environ 7%; 5% et moins est « acceptable ».)

STT-2000; Échantillonnage 6 Formalisation de la non-réponse Contexte: On sélectionne s dans U avec probabilité p(s), avec  k > 0 et  kl > 0. Après la collecte des données, y k est disponible seulement pour les unités pour et Dans une telle situation, nous sommes en présence de données manquantes ou de la non-réponse.

Exemple Échantillon s Non- échantillonné, partie U-s Réponse aux deux questions. Réponse à une question mais pas aux deux. (non- réponse par item) Non-réponse aux deux questions. (non- réponse par unité)

STT-2000; Échantillonnage 8 Illustration du problème de biais: Enquête sur le revenu, où tous les hauts revenus ont une probabilité de répondre plus faible. Ceci implique une sous-représentativité des hauts revenus dans. Si tirage SI (n parmi N): Si on considère comme estimateur où m est le nb de répondants:

STT-2000; Échantillonnage 9 Techniques pour contrôler le problème de la non-réponse Sous-échantillonnage des répondants. Techniques de réponses randomisées. Techniques basées sur la modélisation de la non-réponse. Imputation.

STT-2000; Échantillonnage 10 On connaît On impute On obtient ainsi un ensemble de données complétées: Imputation: on pose des valeurs plausibles pour les valeurs manquantes

STT-2000; Échantillonnage 11 Autre exemples d’imputation Hot Deck: On choisit au hasard une valeur déjà obtenue pour remplir les trous. Cold Deck: Utilisation de données provenant de sources externes. Imputation par la moyenne: Chacun des trous est remplacé par la valeur moyenne des répondants. Imputation utilisant des modèles: par le ratio, par la régression, etc.

STT-2000; Échantillonnage 12 Repondération comme une méthode d’ajustement pour la non- réponse On accepte la non-réponse. On ne tente pas d’imputer. Cependant, on cherche à redresser l’échantillon de répondants. On a besoin cependant d’information auxiliaire, permettant un découpage en catégories (exemple: âge, sexe)

STT-2000; Échantillonnage 13 Repondération On identifie G groupes, g = 1,2,…,G. L’échantillon s est découpé en s 1, s 2, …, s G. Ainsi, ceci implique que l’échantillon des répondants r est découpé en r 1, r 2, …, r G. Pour, on doit donc pouvoir observer les caractéristiques qui définissent le regroupement.

STT-2000; Échantillonnage 14 Repondération (suite) Pour le groupe g, soit m g /n g le taux de réponse, où m g = taille de r g, et n g = taille de s g. Par repondération, on veut dire que le poids d’échantillonnage 1/  k (poids sans non- réponse) est remplacé (ou redressé) par la valeur (n g /m g )(1/  k ) (avec non-réponse).

STT-2000; Échantillonnage 15 Intuition derrière la méthode de redressement (plan SI) 1/  k = N/n. On note que. Cependant. On cherche  tel que

STT-2000; Échantillonnage 16 Estimateur par repondération Estimateur: Pour le plan SI:

STT-2000; Échantillonnage 17 Justification de l’estimateur par repondération Pour s: Pour r, on pose: Dans le cas de l’estimateur par repondération par groupes, on suppose: L’estimateur est:

STT-2000; Échantillonnage 18 Justification (suite) Sous les hypothèse suivantes: Pour chaque unité k dans le groupe g, les unités répondent avec probabilité  g indépendamment (plan BE étant donné s). L’estimateur précédent est alors sans biais sous ce mécanisme de réponse. Puisque  g est inconnu, on l’estime par

STT-2000; Échantillonnage 19 Exemple, T.P. 9, no.5

Solution Estimateur: On pose: On obtient: Estimateur repondéré: Moyenne des répondants:

STT-2000; Échantillonnage 21 Solution (suite et fin) L’estimateur repondéré est mieux que la moyenne des répondants dans la mesure où l’estimateur repondéré tient compte des différences qu’il y a entre les groupes en rapport avec la volonté de répondre. Dans l’exemple, les hommes répondaient moins que les femmes.