Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.

Slides:



Advertisements
Présentations similaires
L’échantillonnage & Ses Fluctuations
Advertisements

Base de sondage et Plan de sondage Pres. 5
L’ECHANTILLONNAGE : QUELQUES PRINCIPES
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Echantillonnage d’une Enquête sur les indicateurs du Paludisme
Les comités pharmaceutiques et thérapeutiques
DE LA COMPREHENSION A LA MESURE (1) : LAPPROCHE QUANTITATIVE ET LES TECHNIQUES DENQUETE.
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
ANALYSE CONJOINTE 29/06/07- Analyse conjointe.
Collecte de données F. Kohler.
Inférence statistique
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
Échantillonnage-Estimation
Dr DEVILLE Emmanuelle J D V 12/07/2006
INFERENCE STATISTIQUE
LE RECUEIL D’INFORMATION SUR LA DEMANDE
variable aléatoire Discrète
Probabilités et statistique en TS
AUTOUR DE LA LOI NORMALE
Fluctuations d’une fréquence selon les échantillons, Probabilités
Sondage aléatoire simple
Thème 6 : l'échantillonnage et l'enquête
Échantillonnage (STT-2000)
Groupe 1: Classes de même intervalle
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
Échantillonnage (STT-2000)
La notion d’échantillonnage
Validité interne, fiabilité, validité externe
La corrélation et la régression
La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.
Distribution d’échantillonnage
Échantillonnage (STT-2000) Section 2 Tirage aléatoire simple (plan SI). Version: 22 août 2003.
Théorie de l’échantillonnage (STT-6005)
ÉCHANTILLONNAGE AU FIL DES PROGRAMMES Stage : nouveaux programmes de première Novembre 2011.
Lectures Volume du cours : Chapitre 7
Échantillonnage (STT-2000) Section 2 Aspects spéciaux de léchantillonnage et de lestimation. Version: 7 septembre 2003.
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Concepts d’échantillonnage statistique. Introduction Échantillon représentatif – Supprime la subjectivité / biais – Une confiance plus grande dans les.
Marquez cette valeur sur le diagramme à points de la question 6. La moyenne réelle des nombres de lettres par mots dans la population de l'ensemble des.
Echantillonage pour une Evaluation d’Impact
STATISTIQUES DESCRIPTIVES
Les Techniques d’enquête quantitative
Investigation en Santé Publique
Échantillonnage aléatoire simple
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
JEAN-MARC FONTAN SOC-1101 COURS 4
Études de Marché MBA Hivers 2006 La recherche par sondage.
Études de Marché Dess communication de masse
Échantillonnage (STT-2000)
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Échantillonnage (STT-2000)
ECOLE DES HAUTES ETUDES COMMERCIALES
Des expériences comparatives à répartition aléatoire (autrement dit des études expérimentales aléatoires)
Probabilités et statistique MQT-1102
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Famille A La famille A a cinq enfants – Patricia – Mary – Susan – Helen – Kathleen – Quelle est la probabilité que le prochain enfant soit un garçon ?
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Chapitre 5 Interprétation des données d’enquête 1.
Transcription de la présentation:

Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine

Plan Terminologie Méthodes de sondage Qualité des estimateurs

Comment dénombrer ? Question : combien y a-t-il de personnes atteintes de troubles de la vue parmi les conducteurs automobiles en France ? Réponse : 10% ? 40 % ? 75 % ? Il est impossible de les compter toutes en examinant toute la population des conducteurs français Il va être nécessaire d’utiliser une procédure particulière (l’échantillonnage) et des méthodes statistiques pour estimer la précision du résultat (incertitude)

Un peu de terminologie Population : Toutes les personnes à qui les résultats doivent s’appliquer Echantillon : Dans la plupart des cas, la taille de la population est trop importante pour que l’on puisse étudier tous les individus qui la compose. On étudie un sous-groupe appelé échantillon. Unités : il peut s’agir d’unité individuelle (sujet) ou collective (foyer, hôpitaux)

Un peu de terminologie Phénomène d’intérêt : c’est la caractéristique de santé qui fait l’objet de l’étude Sondage : toute forme d’échantillonnage qui permet de constituer un échantillon à partir de la population Estimateur : résultat estimé à partir des données observées dans l’échantillon qui représente la valeur vraie du phénomène dans la population, avec un certain degré d’incertitude

Différentes méthodes Sondage empirique Sondage aléatoire simple Sondage stratifié Sondage en grappe Sondage pseudo-aléatoire

Sondage empirique Constituer un échantillon de telle façon qu’un nombre fixe de personnes à enquêter soit atteint. On utilisera volontiers la méthode des quotas, indiquant à l’enquêteur de s’arrêter lorsqu’il a atteint le quota voulu dans chaque catégorie: X hommes, Y femmes Z1 [18– 25 ans[, Z2 [25 – 60 ans[, Z3 [60 ans et +] etc…

Sondages probabilistes Ensemble de méthodes appelées sondages probabilistes, parce que chaque unité échantillonnée a une probabilité connue à l’avance de figurer dans l’échantillon Ceci permet de généraliser l’estimation du phénomène à la population dont est issu l’échantillon d’apprécier la marge d’erreur, le degré d’incertitude de l’estimateur

Sondage aléatoire simple Chaque sujet de la population a la même probabilité d’être inclus dans l’échantillon Maximise la possibilité de conclure pour toute la population Base de sondage : liste pré-établie des sujets Liste des conducteurs Liste des foyers Liste des abonnés au téléphone …

Sondage aléatoire simple Procéder à un tirage au sort des sujets dans la base : Programme informatique Tables de nombre au hasard Population Échantillon TAS

Sondage aléatoire simple Le sondage permet de limiter la taille de l’investigation Avantages : Réduction des coûts d’investigation Meilleure qualité de l’observation chez chaque sujet (enquête, questionnaire, investigation clinique) Délai d’obtention des résultats plus rapide Limite : il est nécessaire d’avoir une base de sondage fiable

Sondage stratifié Dans certains cas, on peut craindre d’obtenir trop peu de sujets d’un sous-groupe particulier (p.ex. les conducteurs occasionnels), alors qu’on peut supposer une fréquence particulière du phénomène dans ce sous-groupe. On risque que l’échantillon de ce sous-groupe de la population ne permette pas de calculer un estimateur suffisamment précis Par le simple fait du hasard, on peut sous-estimer ou sur-estimer la fréquence du phénomène dans ce sous-groupe

Sondage stratifié La méthode consiste à identifier les niveaux / catégories de la variable qui caractérise cet aspect de la population exemple 1 : fréquence de la conduite Quotidienne longs trajets Quotidienne courts trajets Occasionnelle Chaque catégorie définit une strate de la population

Sondage stratifié La méthode consiste à identifier les niveaux / catégories de la variable qui caractérise cet aspect de la population exemple 2 : on peut supposer que les personnes d’un même groupe partagent des caractéristiques qui déterminent plus particulièrement le phénomène Les troubles de la vue peuvent comporter une composante d’origine génétique : daltonisme, myopie Les personnes d’une même famille ont donc une probabilité différente d’une autre famille Chaque famille définit une strate de la population

Sondage stratifié L’échantillon est constitué par un sondage aléatoire simple par strate : Tirage au sort des unités dans chaque strate Population TAS Échantillon

Sondage stratifié Ainsi, connaissant le poids (la proportion) de chaque strate dans la population, on peut en tenir compte au moment du calcul des estimateurs Avantage : cette méthode permet d’améliorer la précision du sondage Inconvénient : le calcul de l’estimateur est plus complexe

Sondage en grappe Dans certains cas, il est difficile d’obtenir un échantillon d’individus indépendants les uns des autres. Il peut être plus facile d’enquêter dans un lieu où ils sont rassemblés Exemple : les sujets d’un même foyer (résidence) Le sous-groupe de la population définit une grappe

Sondage en grappe Ce sont les grappes qui sont tirées au sort dans la population L’ensemble des sujets d’une grappe tirée au sort sera enquêté Échantillon TAS Population

Sondage en grappe Avantages : Inconvénients : il n’est pas nécessaire de disposer d’une base de sondage des individus, une liste des grappes suffit Inconvénients : le sondage est moins précis que le sondage aléatoire simple L’analyse doit prendre en compte l’effet grappe, ce qui est plus complexe

Sondage pseudo-aléatoire En l’absence de base de sondage, on peut prendre des méthodes d’allure organisée, sur un caractère supposé indépendant du phénomène étudié, mais qui ne garantissent pas un vrai tirage au sort Ces méthodes ne garantissent pas la représentativité comme le ferait un véritable tirage au sort

Sondage pseudo-aléatoire Méthode systématique : les conducteurs qui franchissent un carrefour, qui se garent sur un parking Méthode dite « des itinéraires » : les conducteurs de telle maison, puis telle autre plus loin.

La qualité de l’estimation La qualité d'une estimation repose sur sa précision et sur l'absence de biais. La représentativité de l’échantillon est la qualité garantie par une estimation sans biais. La précision n’est jamais parfaite et se traduit par une incertitude sur la valeur de l’estimateur

La qualité de l’estimation une estimation sans biais est obtenue au mieux par les méthodes de sondage aléatoire estimation estimation non biaisée biaisée Animation : faire afficher d’abord la figure à gauche, puis celle de droite.

La qualité de l’estimation La précision d’une estimation dépend du degré d’erreur de la méthode de mesure L’incertitude sur la valeur de l’estimateur est exprimée par son intervalle de confiance L’incertitude diminue lorsque la taille de l’échantillon augmente

La qualité de l’estimation Elle dépend donc de la méthode d’échantillonnage choisie et de la taille de l’échantillon Faire afficher : En haut à gauche En bas à gauche En haut à droite En bas à droite