Échantillonnage (STT-2000) Partie 1 Exemples de sondages douteux Version: 22 août 2003
STT-2000; Échantillonnage 2 « Les femmes et lamour » Shere Hite, 1988 Auteure qui a écrit de nombreux ouvrages sur la vie sentimentale des hommes et des femmes. La méthodologie repose sur lenvoie de questionnaires visant la population féminine américaine. Les conclusions rapportées reposent sur des études de statistiques descriptives (calcul de pourcentages, de moyennes).
STT-2000; Échantillonnage 3 « Grandes trouvailles » de Shere Hite Page 804: 84% de toutes les femmes ne sont pas satisfaites émotionnellement dans leurs relations personnelles. Page 856: 70% de toutes les femmes mariées de plus de cinq ans ont des rapports extra-conjugaux. Page 810: 95% de toutes les femmes ressentent des formes de terrassement émotionnel et psychologique de la part du conjoint. Page 809: 84% des femmes ressentent des formes de condescendance de la part de leur conjoint.
STT-2000; Échantillonnage 4 Se pourrait-il que les conclusions soient exagérées? Les résultats de Shere Hite furent médiatisés et vivement contestés. Il importe de se poser certaines questions. – 1. Est-ce que nous doutons des résultats de Shere Hite? Non… – 2. Est-ce que nous doutons que des femmes ont répondu ainsi? Non… Le problème se situe à quel niveau?
STT-2000; Échantillonnage 5 Caractéristiques de la méthodologie de Hite 1. Les femmes qui recevaient le questionnaire décidaient volontairement de faire partie de léchantillon. Problème potentiel de biais de non-réponse. 2. De plus: Page 824 (vf): « Au total, nous avons distribué cent mille questionnaires; quatre mille cinq cents nous ont été retournés (…) ». Ceci donne un taux de réponse de 4.5%.
STT-2000; Échantillonnage 6 Caractérisques (2) Les questionnaires ont été envoyés à des groupes de femmes. – groupes paroissiaux, groupes politiques de femmes, associations pour les droits des femmes, associations professionnelles de femmes, centre de conseil et daide aux femmes et aux familles. Comment être certain que ces associations représentent bien la population totale des femmes aux USA? Problème potentiel de sous-couverture de la population visée.
STT-2000; Échantillonnage 7 Caractéristiques (3) Le questionnaire comportait 127 questions à répondre sous forme dessai, avec questions et sous-questions. Qui va avoir tendance à répondre à un tel questionnaire? Certaines questions étaient floues, et dautres suggéraient même les réponses.
STT-2000; Échantillonnage 8 Une vraie perle… Page 825 (vf): « Une recherche qui ne sappuie pas sur un échantillon choisi au hasard donne-t- elle le droit détendre les résultats obtenus à lensemble de la population? Si lenquête est assez vaste et léchantillon assez important, et si lon procède avec précaution, oui. » NON!
STT-2000; Échantillonnage 9 Attention… Un grand échantillon nest pas le seul gage de précision! Puisque la base de sondage est visiblement imparfaite (problème de sous-couverture), que léchantillon final comportait un taux de réponse de 4.5% (problème de biais due à la non-réponse), que le questionnaire avait des failles, la seule conclusion possible est que les résultats obtenus reflétaient létat desprit des femmes désireuses de participer à lenquête. Ceci NE veut PAS dire cependant que létude en question est sans intérêt.
STT-2000; Échantillonnage 10 Sondage du Literacy Digest de 1936 En 1912, le magazine a commencé à produire des sondages pour prédire le résultat de lélection américaine. Entre 1912 et 1932, les prévisions étaient toujours justes! Ceci a eu pour effet que le magazine a acquis une réputation solide dans la prévision des résultats. Les éditeurs étaient confiants dans la prévision de lélection de 1936.
STT-2000; Échantillonnage 11 « Landon, , Roosevelt : Final Returns in The Digests Pool of Ten Million Voters » Le sondage prévoyait 55% pour Landon, 41% pour Roosevelt. Dans les faits, les résultats de lélection furent 61% pour Roosevelt et 37% pour Landon! Pourquoi un si grand écart dans les résultats?
STT-2000; Échantillonnage 12 Problèmes possibles dans le sondage du Literacy Digest de 1936 La base de sondage reposait fortement sur les bottins téléphoniques et les listes denregistrement automobiles. – On est en À cette époque, posséder une voiture/téléphone était réservée à une classe sociale/économique peut-être plus privilégiée; lopinion des politiques économiques de Roosevelt pouvait changer selon la classe économique du répondant. Problème potentiel de biais dans la base de sondage.
STT-2000; Échantillonnage 13 Problèmes possibles (2) En second lieu,10 millions de questionnaires ont été envoyés, cependant seulement 2.3 millions ont été retournés. Le taux de réponse était moins de 25%. Des analyses subséquentes ont montré quen fait il était plus vraisemblable que les partisans de Landon retournent le sondage que les partisans de Roosevelt. Toujours sinterroger sur la non-réponse, ses raisons et son impact potentiel.
STT-2000; Échantillonnage 14 Leçons du sondage du Literacy Digest de 1936 Les éditeurs du Digest étaient confiants, car ils avaient un large échantillon (2.3 millions). Cependant léchantillon était associé à un taux de non- réponse de plus de 75%. Léchantillon, bien que grand, était non représentatif de la population. Un grand échantillon non représentatif peut faire plus de dommages quun petit échantillon non représentatif! En fait, les dommages peuvent être plus importants, dans la mesure où lon a la fausse impression de justesse, uniquement car on dispose de résultats sur 2.3 millions dindividus. La mise en œuvre du sondage est plus importante que la taille de léchantillon!