Plan la séance 7 Procédures d’échantillonnage Terminologie Étapes du processus d’échantillonnage Méthodes d’échantillonnage Échantillonnage sur internet Quel type d’échantillonnage utiliser ? Taille de l’échantillon Atelier : Planification du processus d’échantillonnage et validation des questionnaires
Terminologie Univers Échantillon Recensement Graphique tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
Univers Population ou groupe à l’étude Différentes entités : Citoyens Employés Clients Partenaires Fournisseurs Élément de l’univers ou de la population : Entité individuelle d’un groupe particulier Unité d’étude
Échantillon Sous-ensemble d’un groupe plus large Doit être représentatif du groupe plus large Source : http://courses.tlt.psu.edu/course/bio12/module03/2009/10/lesson-02-samples-and-populations.html
Recensement Enquête auprès de tous les éléments d’une population En France, dans les communes de 10 000 habitants ou plus : Un échantillon probabiliste représentant environ 8 % de la population est recensé chaque année Au bout de 5 ans, l'ensemble du territoire de chaque commune est pris en compte, et 40 % environ des habitants de ces communes sont recensés http://www.insee.fr/fr/publics/default.asp?page=communication/recensement/particuliers/organisation.htm#complus
Étapes du processus d’échantillonnage Définir l’univers Méthodes d’échantillonnage Sélection des éléments Procédure de sélection Taille de l’échantillon Travail de terrain Cadre d’échantillonnage Graphique tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
Définir l’univers À qui voulons-nous parler ? Bien définir l’unité d’étude, c’est-à-dire l’élément que nous voulons étudier dans l’univers
Cadre d’échantillonnage Liste des éléments composant l’univers, p. ex. : Liste de clients Annuaire de téléphone Attention à l’erreur d’exclusion
Méthodes d’échantillonnage Non probabilistes Probabilistes De convenance De jugement Aléatoire simple Systématique Boule de neige Stratifié Par quota Grappes Phases multiples Volontaire Structuré aléatoire
Échantillonnage non probabiliste
Échantillonnage de convenance Échantillon que le chercheur a sous la main, p. ex. : Une classe d’étudiants ou une cafétéria pour un sondage dans le cadre d’un travail de session Représentativité limitée de l’échantillon
Échantillonnage de jugement Échantillon sélectionné selon le jugement d’une personne d’expérience, p. ex. : Les sous-groupes de la population utilisés par les médias pour prédire les résultats le soir d’une élection Marchés témoins pour évaluer un nouveau produit Source : http://www.ourbigearth.com/2011/05/02/get-out-the-vote-federal-election-is-today/
Échantillonnage boule de neige Construction graduelle d’un échantillon en utilisant des références obtenues des premiers répondants Les premiers répondants peuvent être sélectionnés de façon aléatoire ou non Méthode utilisée lorsque les répondants sont difficiles à identifier
Échantillonnage par quota Échantillon dont les sous-groupes respectent les proportions de chacun de ces groupes au sein de l’univers étudié en fonction de caractéristiques précises, p. ex. l’âge et le sexe À ne pas confondre avec l’échantillon stratifié (probabiliste) Sexe Âge 25 et - 26 à 50 51 et + Total H 11% 16% 22% 49% F 10% 17% 24% 51% 21% 33% 46% 100%
Échantillonnage volontaire Échantillon composé de personnes auto sélectionnées Par exemple : les lecteurs d’un journal ayant accepté de participer à un sondage réalisé par ce journal auprès de tous ses lecteurs
Échantillonnage structuré aléatoire 1 de 3 Ce type d’échantillon n’est pas considéré comme étant probabiliste, mais il est quand même considéré comme étant scientifique Seule alternative pratique en l’absence d’un cadre d’échantillonnage Il s’agit de structurer la population en fonction de plusieurs critères bien définis tels le jour, l’heure et la localisation géographique Source : http://zoom-travels.blogspot.ca/2012/08/fantasy-fridays-samba-at-carnival-rio.html
Échantillonnage structuré aléatoire 2 de 3 Pour un festival par exemple, on répartira la cueillette de données sur toute la durée de l’événement (p. ex. : 3 jours) On sélectionnera les répondants à différentes heures, les mêmes chaque jour (p. ex : 10h, 14h, 18h et 22h) Source : http://zoom-travels.blogspot.ca/2012/08/fantasy-fridays-samba-at-carnival-rio.html
Échantillonnage structuré aléatoire 3 de 3 On sélectionnera les répondants de façon systématique pour introduire un effet aléatoire (p. ex. : un visiteur sur trois ou sur quatre) Cette méthode est utilisée par des chercheurs et des étudiants de cycles supérieurs et acceptée par certaines instances gouvernementales pour justifier des demandes de subvention Source : http://zoom-travels.blogspot.ca/2012/08/fantasy-fridays-samba-at-carnival-rio.html
Échantillonnage probabiliste
Échantillonnage aléatoire simple Échantillon construit à partir d’une liste de l’univers, dans laquelle chaque élément a une chance égale d’être choisi Il peut être difficile d’obtenir une liste de l’univers On utilise des tables de hasard ou des numéros générés au hasard par un ordinateur pour sélectionner les répondants Pour les petits échantillons, on peut sélectionner les répondants avec une roulette, un boulier, des papiers dans un chapeau… L’échantillon peut ne pas être représentatif de la population Source : http://ccelearn.csus.edu/wasteclass/mod9/mod9_05.html
Échantillonnage systématique Échantillon construit à partir d’une liste complète de l’univers à l’étude, comme l’échantillon simple au hasard Les répondants sont sélectionnés à intervalle fixe, le premier devant être sélectionné au hasard comme pour l’échantillonnage aléatoire simple Source : http://rchsbowman.wordpress.com/2009/08/16/statistics-notes-sampling-techniques-2/
Échantillonnage stratifié Échantillon dont les sous-groupes respectent les proportions de chacun de ces groupes au sein de l’univers étudié en fonction de caractéristiques précises, p. ex. l’âge et le sexe On utilise des tables de hasard ou des numéros générés au hasard par un ordinateur pour sélectionner les répondants dans chacune des strates À ne pas confondre avec l’échantillonnage par quota (non probabiliste) Genre Classes d’âges 25 et - 26 à 50 51 et + Total H 11% 16% 22% 49% F 10% 17% 24% 51% 21% 33% 46% 100%
Échantillonnage par grappes Échantillon dont l’unité n’est plus l’élément de l’univers qui est à l’étude mais un sous-groupe (grappe) réunissant plusieurs de ces éléments Ces grappes sont composées d’éléments dont un des points communs est la proximité géographique Cette méthode vise à produire un échantillon d’une façon économique tout en retenant les caractéristiques d’un échantillon probabiliste Considéré comme échantillonnage probabiliste si la sélection des grappes est aléatoire
Vols Montréal-Toronto Voyageur d’affaires Montréal-Toronto Exemples de grappes Grappes possibles : Vols Montréal-Toronto Population à l’étude : Voyageur d’affaires Montréal-Toronto
Échantillonnage en phases multiples Échantillon sélectionné en utilisant une combinaison de plusieurs méthodes probabilistes, p. ex. l’échantillonnage aréolaire (area sampling) : Diviser le Canada en provinces/villes/arrondissements/blocs (échantillonnage stratifié) Sélectionner un certain nombre de blocs Recueillir les réponses de tous les répondants au sein des blocs sélectionnés (échantillonnage par grappes)
Échantillonnage sur internet (1 de 3) Échantillons non probabilistes de convenance pour les sondages éclair Pour les sondages éclair, la construction d’un gros échantillon peut être très rapide pour les sites populaires Les méthodes probabilistes les plus utilisées en ligne sont : Échantillonnage aléatoire simple Échantillonnage systématique
Échantillonnage sur internet (2 de 3) Problème de surreprésentation des visiteurs fréquents Sélection aléatoire en utilisant une fenêtre intempestive « Pop-Up »… … mais les fureteurs évolués bloquent les fenêtres intempestives Utilisations de panels… … mais un panel n’est pas toujours représentatif de la population à l’étude
Échantillonnage sur internet (3 de 3) Pour les sondages auprès de la clientèle, utilisation de numéros d’accès pour empêcher les réponses multiples du même répondant Invitations à participer en personne, par courrier, par courriel ou sur un reçu de caisse Certaines personnes ne disposent pas d’un ordinateur ou d’un accès internet rapide
Quelle méthode d’échantillonnage utiliser? Marge d’erreur et niveau de confiance désirés Ressources humaines et financières disponibles Contraintes de temps Disponibilité d’une liste de l’univers Dispersion géographique des répondants Nécessité d’effectuer des projections à une population plus large
Taille de l’échantillon N’est pas fonction de la taille de l’univers Représentativité Marge d’erreur et niveau de confiance E = échantillon A & B = partage des répondants (0,5 par défaut) ER = erreur permise (3%, 4%, 5%,...) Z = # d’écarts type vs niveau de confiance (3 = 99%, 2 = 95%, 1 = 68%) Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 143 165
Intervalle de confiance MOYENNE Conventional Product Adoption Life Cycle: Five types of customers who will end up adopting a product INNOVATORS (2.5%): People who are the first to adopt a product. They are trend-setting, risk-taking, and are not typical consumers. Example: See a movie first weekend it’s out or in a preview. EARLY ADOPTERS (13.5%): People who are among the first but not as risk-taking. They adopt ideas early but with consideration, and they enjoy roles as opinion leaders. They spread the word about the product. Example: See a movie the first week of its release. EARLY MAJORITY (34%): Deliberate customers; adopt earlier than most customers but are not leaders. Example: See a movie after a few weeks, after reading all the reviews and getting recommendations from early adopters. LATE MAJORITY (34%): Skeptical customers, will only adopt an idea if the majority of people have tried it. Example: See a movie after it has been nominated for an Oscar. LAGGARDS (16%): Tradition-bound, suspicious of change; will adopt an idea only after it has been around long enough. Example: See a movie after it has come out on video. Écart type = -1 Écart type = +1 -2 +2 -3 +3 99% 68% 68% 99% 95% 95% Tiré et adapté de : Zikmund, W.G. 2003. Essentials of Marketing Research, 2nd ed. Mason (OH) : South-Western, 452 p.
Taille de l’échantillon Pour le pire des scénarios, un partage 50/50 des répondants Une marge d’erreur de 5% Un niveau de confiance de 95% (usuel) Taille de l’échantillon = 400 répondants
Taille de l’échantillon Supposons un partage 20/80 des répondants Une marge d’erreur de 5% Un niveau de confiance de 95% (usuel) Taille de l’échantillon = 256 répondants
Taille de l’échantillon Pour le pire des scénarios, un partage 50/50 des répondants Une marge d’erreur de 5% On augmente le niveau de confiance à 99% Taille de l’échantillon = 900 répondants
Taille de l’échantillon Pour le pire des scénarios, un partage 50/50 des répondants On diminue la marge d’erreur à 3% Un niveau de confiance de 95% Taille de l’échantillon = 1 111 répondants
Taille de l’échantillon Pour le pire des scénarios, un partage 50/50 des répondants On diminue la marge d’erreur à 3% Un niveau de confiance de 99% Taille de l’échantillon = 2 500 répondants
Atelier Planification du processus d’échantillonnage Validation des questionnaires