La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

2.3.2. La notion déchantillonnage 1.La vérification ou l'infirmation des hypothèses, associée au mode de contrôle des variables qui a été prévu, suppose.

Présentations similaires


Présentation au sujet: "2.3.2. La notion déchantillonnage 1.La vérification ou l'infirmation des hypothèses, associée au mode de contrôle des variables qui a été prévu, suppose."— Transcription de la présentation:

1 La notion déchantillonnage 1.La vérification ou l'infirmation des hypothèses, associée au mode de contrôle des variables qui a été prévu, suppose bien entendu des observations ou données qui sont souvent récoltées par échantillonnage. 2. La nécessité de tels échantillons tient au fait que la taille de l'"univers" à décrire est souvent trop grande pour être intégralement observée. Il faut alors en capturer des fractions, mais avec pour but de rendre compte de la totalité. Ce passage du segment à la totalité est nommé problème d'inférence: quelles sont les conditions qui permettent de dire que ce qui est observé dans l'échantillon est valable pour l'univers concerné tout entier? 3.Cette question de l'inférence amène à une distinction importante entre les échantillons probabilistes et les échantillons non–probabilistes. Ces derniers sont souvent réalisés sous la forme d'échantillons par quota. 4.Deux autres questions, liées d'ailleurs à la première, sont centrales dans les questions d'échantillonnage: - quelle taille donner à l'échantillon, ou plutôt, quels critères prendre en compte pour fixer la taille d'un échantillon? - comment concilier approche individuelle et contextuelle dans un échantillon: cest la question des échantillons à plusieurs niveaux

2 1. Echantillon par quota Il sagit dassurer une comparabilité entre univers et échantillon en construisant une sorte de maquette, de modèle réduit, de lunivers. Pour ce faire, la constitution dun échantillon par quota suit les procédures générales suivantes: a) Définition de l'aire géo-démographique pertinente (ou population concernée; p.ex. Citoyennes et citoyens du Canton de..) b) Définition de la composition relative de la population concernée (p.ex. fictif 55% de femmes, 45% dhommes; 45% 40 ans; 5% secteur primaire, 35% secondaire, 60 % tertiaire, etc), pour les éléments jugés pertinents (âges, statut social, zone urbaine ou rurale, travail professionnelle, état civil, revenu,etc) c) Choix de la taille de l'échantillon d) Distribution de cet échantillon global en des sous-ensembles de tailles proportionnées à la composition de la population e) Instructions de récolte données aux enquêteurs: faire x interviews auprès de femmes, y auprès dhommes; tant dans le primaire, etc…

3 Les variables retenues pour définir les quotas sont celles qui sont jugées essentielles pour le comportement observé : assez classiquement. lâge, le sexe, lemploi, létat-civil, la nationalité, etc. Mais on peut penser à tout autre chose ( usage dune voiture, dune télé, présence dadolescents dans le ménage,etc) La simplicité apparente de ce genre déchantillonnage le rend surtout utile quand il nexiste pas de listes fiables et détaillées de personnes en principe concernées. Pourtant, un dilemme existe : - considérer les proportions variable par variable (50% de femmes, 35% demployés subalternes,etc), avec le risque que les femmes employées subalternes soient proportionnellement beaucoup plus nombreuses, - ou prendre des proportions de « femmes employées subalternes », avec le risque de compliquer beaucoup la récolte des données et de perdre ainsi les avantages de ce genre déchantillonnage.

4 Exemple Taille échantillon.xls

5 Limites Un échantillon par quota ne donne pas à chaque élément de l'univers la même probabilité d'être représenté dans l'échantillon. Par exemple, on remplace sans autre les non –répondants, ou bien on ne va pas chercher de cas dans des lieux trop éloignés, ou à des heures malcommodes, etc. C'est le côté arbitraire de ces choix et remplacements qui fait parler d'échantillon non-probabiliste. En principe, de tels échantillons ne permettent donc pas de calculer des marges derreur.

6 2. Echantillonnage probabiliste 2.1. Echantillon probabiliste simple 1.Le souci de calculer des marges derreur et de faire des tests de signification conduit souvent à préférer les échantillons probabilistes aux échantillons par quota. 2.Léchantillonnage probabiliste simple est basé sur lidée de donner à chaque élément de lunivers une chance égale de figurer dans léchantillon. Cette égalité, lorsque la taille de léchantillon est suffissamment grande, permet daffirmer, avec un risque derreur connu, que les compositions de lunivers et de léchantillon seront comparables (taille mise à part, bien sûr pour toutes les variables, et non seulement poiur les variables jugées pertinentes. 3.Il convient de se baser sur les sur les procédures suivantes : a) Chaque élément de lunivers concerné reçoit un numéro didentification de 1 à n. (Il faut donc disposer en principe dune liste exhaustive et nominale des personnes concernées) b) A laide de tables de nombres au hasard ou de procédures équivalentes, on « tire au sort » le nombre de cas désiré. 4.La taille de léchantillon dépend de la marge derreur – ou intervalle de confiance – que lon veut tolérer. Dans le cas de proportions, la formule P = p +/- k*racine(p*q/n) permet de calculer cette taille.

7 Brève explicitation Les différentes moyennes p1, p2, p3, pn dune multitude déchantillons de taille n possibles constitués de manière probabiliste se distribueront de façon « normale » autour de la « vraie » moyenne P (recherchée) Cest dire que les 66% de ces moyennes « potentielles » ne sécarteront pas de P de plus de 1 sigma ( =racine de P*Q/n), que 95 % seront comprises dans un intervalle de 2 sigmas, 99% dans un intervalle de 3 sigmas,etc. En conséquence, on peut dire, par exemple, « avec 95% de certitude », que la vraie valeur P recherchée ne diffère pas de la valeur trouvée p dun écart supérieur à +/- 2*racine(p*q/n)

8 Estimation grossière de la taille dun échantillon Taille échantillon.xls

9 La consigne est alors dobserver/interviewer les personnes qui ont été tirées au sort, et pas dautres. Léquiprobabilité dêtre tiré permet, par le biais de la loi des grands nombres, daffirmer dans certaines limites (intervalles de confiance) que léchantillon a une composition semblable à celle de lunivers et que ce qui est observé dans léchantillon vaut pour tout cet univers. On remarquera que la taille de léchantillon à choisir ne dépend pas directement de la taille de lunivers, mais du degré de précision demandé. Attention, pour les univers de petite taille, à la correction (1-f), où f représente la fraction sondée. Négligeable évidemment si, par exemple, f = 0.003, utile si f = par exemple 0.4 Cette manière de faire permet de calculer des indices dassociation et des tests de signification. En principe, les non-réponses ne doivent pas être « remplacées ». En pratique, on calcule souvent des tailles théoriques déchantillons plus grandes, pour tenir compte de cette probabilité de non-réponse.

10 Addendum: le sondage systématique 1.Le sondage systématique rejoint les mêmes objectifs que le sondage probabiliste simple. Il remplace simplement le tirage aléatoire par le tirage – dans une liste déjà constituée (p.ex. liste demployés, ou délecteurs, ou bottin téléphonique) – dun individu tous les nièmes cas. Cette simplification peut avoir des risques quand la liste en question est organisée selon un rythme (p.ex. sections militaires listées selon limportance décroissante du grade).

11 2.2. Echantillons stratifiés 1.Il arrive que lon préfère un échantillonnage probabiliste stratifié à un échantillonnage probabiliste simple. 2. La procédure de stratification consiste à subdiviser lunivers en des sous- ensembles (strates) définis par des variables jugées importantes pour le comportement observé (comme dans les quotas) et de procéder au tirage aléatoire dun nombre (Ns/N)*E de cas dans la strate considérée. 3.Dans ce cas, il sagit dun échantillon stratifié proportionnel: il sagit, par le biais de la stratification, de réduire la variance et par là le nombre de cas nécessaires. 4.Mais on peut préférer construire un échantillon stratifié non proportionnel. Dans ce deuxième cas, il sagit de « gonfler » les strates démographiquement peu importants, de manière à pouvoir les observer plus en détail. Les tendances générales se calculent alors en utilisant les proportions de lunivers comme pondération des tendances observées dans chaque sous- ensemble de léchantillon.

12 Echantillons en grappe Aux possibilités déjà évoquées sajoute celle de léchantillonnage en grappes, qui consiste à faire un tirage en plusieurs niveaux. P.ex: a) subdiviser l « univers » Suisse en un nombre r de régions; b) tirer au sort un certain nombre de ces régions ; c) puis, dans chaque région sélectionnée, tirer un nombre ni de cas. Autre exemple : dans une grande administration, tirer dabord des sections ou bureaux ou divisions, puis des employés… Le but de lopération est de pouvoir mettre en rapport des données individuelles avec des données contextuelles, ce qui serait difficile avec des données trop dispersées. Le calcul de la variance amène des résultats analogues à ceux du sondage probabiliste simple.

13 Questions-clé pour le choix dun échantillon Voici quelques questions essentielles que lon peut ou doit se poser pour sélectionner une procédure et une taille déchantillon : 1.Veut-on privilégier la description générale dune population ou analyser dans le détail un système de relations ? 2.Est-on intéressé à réunir une perspective individuelle et une perspective contextuelle ? 3.Veut-on analyser en tant que tels des agrégats numériquement faibles ? 4.Réciproquement, a-t-on besoin dun très grand nombre de sujets provenant dagrégats proportionnellement très importants ?

14 5. Existe-t-il un risque important dune grande proportion de non- réponses ? Ces non-réponses sont-elles en rapport avec les attitudes ou comportements investigués ? 6. Est-on intéressé à définir des intervalles de confiance ? Plus spécifiquement, est-on attaché à la possibilité de définir une marge derreur ? 7. Dispose-t-on dune liste exhaustive et nominale de lunivers ? 8. Quelles variables veut-on contrôler ? Par exclusion ou par inclusion ? Selon quelles procédures?


Télécharger ppt "2.3.2. La notion déchantillonnage 1.La vérification ou l'infirmation des hypothèses, associée au mode de contrôle des variables qui a été prévu, suppose."

Présentations similaires


Annonces Google