La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Gile Echantillonnage1 LECHANTILLONNAGE : QUELQUES PRINCIPES Daniel Gile

Présentations similaires


Présentation au sujet: "Gile Echantillonnage1 LECHANTILLONNAGE : QUELQUES PRINCIPES Daniel Gile"— Transcription de la présentation:

1 Gile Echantillonnage1 LECHANTILLONNAGE : QUELQUES PRINCIPES Daniel Gile

2 Gile Echantillonnage2 POURQUOI LECHANTILLONNAGE (1) Dans la recherche scientifique On cherche souvent (mais pas toujours) à généraliser à partir dun nombre dobservations limitées parce quon na accès quà une partie de la réalité Si la réalité était homogène Il suffirait dune observation (ou deux ou trois pour sassurer que lon na pas commis derreurs dans lobservation)

3 Gile Echantillonnage3 POURQUOI LECHANTILLONNAGE (2) Mais la réalité est généralement complexe et présente de la variabilité Il faut donc trouver un moyen de sassurer (dans la mesure du possible) que la partie de la réalité que lon va pouvoir mesurer « représentera » bien celle-ci Léchantillonnage comme méthode ou ensemble de procédés vise à assurer que, dans la mesure du possible, La partie de la réalité que lon va pouvoir mesurer sera aussi proche que possible de la réalité

4 Gile Echantillonnage4 REPRESENTATIVITÉ ET ERREUR DECHANTILLONNAGE La caractéristique principale que lon cherchera dans léchantillon constitué est sa « représentativité » En statistique, cela ne veut pas dire quil aura les mêmes caractéristiques que la totalité du phénomène que lon souhaite étudier (la population) Un certain écart est toujours possible, et même très probable. Cet écart sappelle « erreur déchantillonnage » bien quil ne sagisse pas dune « erreur » au sens de « faute » La représentativité désigne labsence de biais, c.a.d. labsence dune déviation systématique dans un sens donné (généralement soit plus, soit moins) entre les valeurs mesurées sur léchantillon et la population

5 Gile Echantillonnage5 ECHANTILLON ET POPULATION Il est convenu, en statistiques, de parler dune « population » Lensemble des individus ou entités qui intéressent le chercheur (personnes, animaux, objets, événements, situations) Léchantillon étant un sous-ensemble dentités de cette même « population » Léchantillon a une certaine « taille », à savoir le nombre dentités dont il se compose

6 Gile Echantillonnage6 CARACTERISTIQUES MESUREES DANS LECHANTILLON En général, on mesure dans léchantillon la valeur dun indicateur pour estimer sa valeur dans la population (pourcentage de chômeurs, note moyenne des étudiants, temps daccomplissement dune tâche, etc.) Deux calculs très importants sont celui de la moyenne de cette valeur dans léchantillon Et celui de lécart-type, qui est une estimation de la variabilité des valeurs constatées autour de la moyenne. La moyenne est une estimation de la moyenne de la valeur dans la population Lécart-type nous renseigne sur le degré dincertitude due à la variabilité (par opposition à des erreurs) de cette estimation

7 Gile Echantillonnage7 ECHANTILLON REPRESENTATIF OU BIAISÉ 1 Dans un échantillon représentatif, le hasard fera que la moyenne de la valeur mesurée sera soit supérieure, soit inférieure à la moyenne de la population, sans quon sache si elle y est supérieure ou inférieure. En principe, si on constitue un premier échantillon représentatif, puis un second, puis un troisième et ainsi de suite, le hasard fera que les moyennes pour chaque échantillon seront distribuées de manière plus ou moins symétriques autour de la moyenne de la population. La moyenne dune ensemble de moyennes déchantillons devrait être plus proche de la moyenne de la population que chacune des moyennes des échantillons individuels

8 Gile Echantillonnage8 ECHANTILLON REPRESENTATIF OU BIAISÉ 2 A terme, quand on aura constitué un très grand nombre déchantillons représentatifs, la moyenne de leurs moyennes sera très proche de la moyenne de la population Dans un échantillon biaisé, la moyenne aura tendance à être systématiquement supérieure (ou inférieure) à celle de la population, et cette tendance persistera même quand on constituera un grand nombre déchantillons.

9 Gile Echantillonnage9 ERREUR DECHANTILLONNAGE ET TAILLE DE LECHANTILLON On peut réduire la variabilité relative dans léchantillon en augmentant sa taille, mais cette réduction est proportionnelle non pas à laugmentation de la taille, mais à la racine carrée de cette augmentation. Autrement dit, pour la réduire de moitié, il faut multiplier la taille de léchantillon par 4. Pour la réduire de 75%, il faut multiplier la taille de léchantillon par 16. Ca nest pas nécessairement très intéressant, parce que ça peut être coûteux, sans que cela nous rapproche suffisamment de la moyenne de la population Cest pour cela quon ne cherche pas, en général, à constituer des échantillons de plusieurs milliers dentités

10 Gile Echantillonnage10 REDUIRE LERREUR DECHANTILLONNAGE On peut aussi améliorer la représentativité dun échantillon par des méthodes déchantillonnage plus précises que le simple échantillonnage aléatoire sur lensemble de la population Par exemple, si lon sait que dans une population donnée, il y a 70% de membres dun groupe ethnique majoritaire A, 20% de membres dun groupe ethnique minoritaire B 10% de membres dun groupe ethnique minoritaire C Dans échantillon aléatoire simple de 100 personnes, tirage au sort peut aboutir à sur- ou sous-représentation de certains groupes ethniques, ce qui risque de biaiser les résultats de létude On peut donc choisir délibérément de tirer au sort de manière aléatoire 70, 20 et 10 personnes de chaque groupe respectivement Cest ce quon appelle l« échantillonnage stratifié »

11 Gile Echantillonnage11 MAIS SIL Y TANT DINCERTITUDE, DES INFERENCES SONT-ELLES JUSTIFIEES ? Des calculs mathématiques permettent destimer la probabilité que la moyenne calculée sur léchantillon représentatif se trouve à une certaine distance de la moyenne (non connue) de la population. Ce nest quune estimation, mais elle a de bonnes chances dêtre vraie. Une réplication avec un nouvel échantillon devrait laméliorer, sans toutefois parvenir à une certitude. Et ainsi de suite

12 Gile Echantillonnage12 COMMENT SAIT-ON QUUN ECHANTILLON EST REPRESENTATIF (NEST PAS BIAISÉ ?) En éliminant tout risque de biais Le seul moyen de léliminer à coup sûr, cest de procéder par échantillonnage aléatoire, où chaque entité dans la population a la même probabilité dêtre incluse dans léchantillon. On peut le faire avec une table de nombres aléatoires, ou par voie informatique (lordinateur génère une série quasi-aléatoire) Mais tout « système » humain où intervient un raisonnement autre que celui de la génération de phénomènes aléatoires risque dintroduire un biais caché

13 Gile Echantillonnage13 ET DANS LA REALITÉ ? Dans la réalité des sciences humaines et sociales, il est rare de pouvoir faire de léchantillonnage aléatoire, Ne serait-ce que parce quon ne dispose que rarement dune liste complète de toutes les personnes faisant partie dune population Et que même si on lavait, on naurait pas accès à tout le monde On a donc recours à un échantillonnage non aléatoire, de commodité ou de proximité (convenience sampling), ou de volontariat Dans ces conditions, on nest jamais certain que léchantillon nest pas biaisé.

14 Gile Echantillonnage14 INCIDENCES ? (1) Cela ninvalide pas totalement la démarche, Surtout si on fait de son mieux pour que léchantillon soit représentatif En fonction des connaissances et des hypothèses du chercheur. Mais on na aucune certitude, et lévaluation de la fiabilité des résultats a une part de subjectivité et darbitraire

15 Gile Echantillonnage15 INCIDENCES ? (2) La prudence scientifique dicte donc, dans ces conditions, Une certaine prudence dans les conclusions. On peut faire des analyses statistiques, Mais en les présentant, On rappellera que léchantillon nest pas nécessairement représentatif Quand on sait que léchantillon fait partie dun sous- ensemble bien défini de la population (jeunes, originaires de tel pays, étudiants etc.) il est bon de souligner également que lon a conscience dun éventuel biais propres aux caractéristiques de ce sous- ensemble.

16 Gile Echantillonnage16 INCIDENCES ? (3) La prudence scientifique dicte donc, dans ces conditions, Une certaine prudence dans les conclusions. On peut faire des analyses statistiques, Mais en les présentant, On rappellera que léchantillon nest pas nécessairement représentatif Quand on sait que léchantillon fait partie dun sous- ensemble bien défini de la population (jeunes, originaires de tel pays, étudiants etc.) On peut éventuellement généraliser à ce sous-ensemble… et souligner que lon a conscience dun éventuel biais propres aux caractéristiques de ce sous-ensemble.

17 Gile Echantillonnage17 INCIDENCES ? (4) Autrement dit, à moins que léchantillon soit véritablement aléatoire Toute généralisation ne peut être que provisoire.. et les résultats dune seule étude ne démontrent rien Ce nest quà travers laccumulation de résultats convergents que lhypothèse dune généralisabilité gagne de plus en plus de poids

18 Gile Echantillonnage18 ECHANTILLONNAGE ET ETUDES DE CAS Mais alors, en quoi les études sur échantillons diffèrent-elles détudes de cas (sur un cas unique) ? Après tout, laccumulation de résultats convergents sur des études de cas na-t-elle pas le même effet que laccumulation détudes sur échantillons ? Si, mais les études sur échantillons sont plus puissantes, puisquelles sont susceptibles de réduire la variabilité par rapport aux études de cas, La moyenne dun échantillon étant a priori plus proche de la moyenne de la population quune seule valeur tirée au hasard Le problème du biais demeure Les études de cas demeurent légitimes, et permettent parfois daller plus en profondeur que les études sur échantillon


Télécharger ppt "Gile Echantillonnage1 LECHANTILLONNAGE : QUELQUES PRINCIPES Daniel Gile"

Présentations similaires


Annonces Google