Échantillonnage (STT-2000) Section 4 Sondages empiriques. Version: 1 décembre 2003
Méthodes d’échantillonnage non-probabilistes Avec des méthodes, habituellement, Moins grande exactitude que les méthodes probabilistes. Impossible de mesurer la précision. Gros avantage des méthodes non-probabilistes: Ces méthodes sont souvent moins coûteuses. STT-2000; Échantillonnage
Inconvénients statistiques des méthodes non probabilistes Avec les méthodes probabilistes, le hasard dans la sélection est pris en compte. Avec les méthodes non-probabilistes: des concepts comme le biais des estimateurs, ou les marges d’erreurs, ne peuvent pas être considérés ou calculés. En particulier, les écarts-types des estimateurs ne peuvent pas être calculés. STT-2000; Échantillonnage
Autres conséquences d’un échantillonnage non-probabiliste Éléments sont choisis de façon arbitraire. Impossible de trouver les Il est donc impossible de savoir si Rappelons que des probabilités d’inclusion nulles impliquent la possibilité que des unités ne puissent être échantillonnées. Sans pk et encore moins des pkl, on ne peut pas savoir si les estimateurs utilisés sont sans biais et impossible de formuler un estimateur de variance. STT-2000; Échantillonnage
STT-2000; Échantillonnage Méthode des quotas (échantillonnage dirigé, échantillonnage par choix raisonnée) Utilisé dans les enquêtes d’opinion, les études de marché. On demande aux interviewers de faire un nombre déterminé d’interviews dans divers groupes définis de la population. Ces groupes dont définis en fonction de variables socio-économiques (âge, sexe, géographie, démographie, etc.). Les quotas sont souvent établis de façon à être sensiblement proportionnels à la fraction de la population représentée par chaque groupe. STT-2000; Échantillonnage
Méthode des quotas (suite) Pour le mettre en œuvre: Pas besoin d’une base de sondage! Pas besoin d’un plan d’échantillonnage! STT-2000; Échantillonnage
Inconvénients de la méthode des quotas La méthode des quotas est toujours sujette à des problèmes de biais de sélection. Cette méthode masque le problème de la non-réponse. Si un individu refuse de participer ou s’il est absent de son domicile, l’interviewer ira voir un autre individu car il a à combler son quota. Ainsi, il y a un sérieux risque de ne jamais rejoindre certaines catégories de la population ayant de la réticence à répondre ou difficile à rejoindre. De manière générale, il faut retenir qu’avec les méthodes non probabilistes, on NE peut PAS vraiment mesurer la précision des estimations. STT-2000; Échantillonnage
STT-2000; Échantillonnage Exemple: population de personnes; on veut une représentativité de toute la population; variables âge et sexe STT-2000; Échantillonnage
Exemple (suite): Taille de la population n On doit déterminer les nij de sorte que: On utilise alors la régle « proportionnelle »: Où Nij = effectifs connus de la population (obtenu par recensement par exemple) STT-2000; Échantillonnage
Exemple (suite): Formation des quotas et estimation On forme les quotas, où des gens sont interrogés au hasard où selon une autre méthode. Estimation: où sij = l’ensemble des unités sélectionnées dans la cellule ( i, j ). STT-2000; Échantillonnage
Propriétés de l’estimateur Est-ce que cet estimateur est sans biais? On ne peut pas le savoir… Cette façon ressemble à un sondage stratifié, sauf que l’on n’est pas assuré que ce soit SI dans chaque cellule Uij. « Variance »: On retrouve parfois des mesures de « précisions ». STT-2000; Échantillonnage
STT-2000; Échantillonnage Mesure de précision Parfois on retrouve la formule: STT-2000; Échantillonnage
STT-2000; Échantillonnage Remarques: Avec la théorie que nous connaissons, nous ne pouvons pas dire que les estimateurs proposés sont biaisés ou non, tant concernant l’estimateur de la moyenne ou encore l’estimateur de la variance. STT-2000; Échantillonnage
STT-2000; Échantillonnage Remarques (2): La théorie vue dans le cours STT-2000 repose sur la « théorie de la randomisation » (design-based). Le plan d’échantillonnage induit des probabilités d’inclusion et les propriétés des estimateurs reposent sur le hasard engendré par la mise en œuvre d’un plan d’échantillonnage. Il existe cependant d’autres théories, basées sur les modèles (model based). STT-2000; Échantillonnage