L’échantillonnage & Ses Fluctuations

Slides:



Advertisements
Présentations similaires
Indicateurs de Suivi, Risques & Mesure d’Associations
Advertisements

Comparaison d’une moyenne observée à une moyenne théorique
Probabilités et statistiques au lycée
L’ECHANTILLONNAGE : QUELQUES PRINCIPES
STATISTIQUE INFERENTIELLE L ’ESTIMATION
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
Collecte de données F. Kohler.
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Nombre de sujets nécessaires en recherche clinique
Les TESTS STATISTIQUES
Échantillonnage-Estimation
Moyenne, écart type et incertitude de mesure.
Les tests d’hypothèses
L’action de promotion-animation
Probabilités et statistique en TS
Intervalle de confiance pour p en %
La loi normale et l’estimation de paramètres
AUTOUR DE LA LOI NORMALE
Lectures Volume obligatoire: Chapitre 8
Fluctuations d’une fréquence selon les échantillons, Probabilités
Statistiques et Probabilités au lycée
Tests de comparaison de moyennes
FERRAFIAT Nicolas Le logiciel d’estimation statistique en fiabilité
1 - Construction d'un abaque Exemple
Jacqueline Vacherand-Revel
L’inférence statistique
Thème 6 : l'échantillonnage et l'enquête
Nombre de sujets nécessaires en recherche clinique
Échantillonnage (STT-2000)
Mathématiques Les statistiques et probabilités en STI2d/STL
Partie 3 La psychophysique.
Comprendre la variation dans les données: Notions de base
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
LA LOI DE HARDY-WEINBERG ET LA MICROÉVOLUTION
La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.
TEST d’ADEQUATION A UNE LOI EQUIREPARTIE
Distribution d’échantillonnage
ÉCHANTILLONNAGE AU FIL DES PROGRAMMES Stage : nouveaux programmes de première Novembre 2011.
Lectures Volume du cours : Chapitre 7
1 - Programme de Seconde (juin 2009) Statistique et probabilités
LA LOI DE HARDY-WEINBERG ET LA MICROÉVOLUTION
Marquez cette valeur sur le diagramme à points de la question 6. La moyenne réelle des nombres de lettres par mots dans la population de l'ensemble des.
Micro-intro aux stats.
Intervalles de confiance pour des proportions L’inférence statistique
Échantillonnage (STT-2000)
Chapitre 3: Variables aléatoires réelles continues
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Chapitre 4 Variables aléatoires discrètes
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
Échantillonnage (STT-2000)
Échantillonnage (STT-2000)
ECHANTILLONAGE ET ESTIMATION
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Distributions d’échantillonnage pour des proportions
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
1 M2 Biomatériaux- Cours n°4 1 - Rappels du cours n°1 et 2 et Introduction au principe des test statistiques.
Seconde 8 Chapitre 10: Echantillonnage M. FELT 1.
Transcription de la présentation:

L’échantillonnage & Ses Fluctuations

Généralités Recensement Echantillonnage Supposons une population infiniment grande sur laquelle on veut évaluer la fréquence ou la proportion d’un caractère. Recensement Echantillonnage Une partie des sujets de la population sont « examinés » Tous les sujets de la population sont « examinés » Population

Recensement = vérité l’information que l’on désire est disponible pour tous les individus de la population étudiée. Échantillon = estimation de la vérité l’information n’est disponible que pour un sous-ensemble des individus de la population étudiée.

I- L’échantillon

on procède à ce qu’on appelle échantillonnage. En général, on procède à ce qu’on appelle échantillonnage. L’échantillon est donc un groupe restreint de la population dont il est issu. Pop Plusieurs échantillons peuvent être constitués L’échantillon en lui-même n’est pas intéressant, ce sont les conclusions sur la population que l’on peut tirer de son observation qui en font l’intérêt : Inférence.

Il s’agit là, d’un tirage non aléatoire ou biaisé. Cet échantillon est dit non représentatif si au cours du tirage, on procède à un choix préalable ou à une sélection. Pop Tirage Biaisé Echantillon non représentatif Il s’agit là, d’un tirage non aléatoire ou biaisé. Les conclusions sur la population ne peuvent pas être tirer de l’observation de tels échantillons.

Pour que l’échantillon soit représentatif, il faut que tous les individus de la population aient la même chance d’être tirés. Ceci peut être obtenu par un brassage adéquat et convenable des individus et permet de tirer véritablement au hasard un échantillon représentatif. Tirage Aléatoire

En définitif, un échantillon représentatif est un échantillon issu de façon parfaitement aléatoire, non conditionné par un choix préalable ou sélection. Tirage parfaitement au hasard

Un échantillon a pour but de représenter la population, donc être représentatif. En quelque sorte, l’échantillon est un modèle pour la population. Il n’est pas possible de déterminer si un échantillon est représentatif ou non. Un bon plan d’échantillonnage peut cependant contribuer à éliminer des échantillons non représentatifs.

Étapes à suivre Déterminer l’objectif de l’échantillonnage Déterminer la condition recherchée Définir la population à vérifier Déterminer la taille de l’échantillonnage Sélectionner les échantillons Effectuer les tests et évaluer les résultats Analyser les erreurs projetées Plans d’échantillonnage statistique

II- Le Pari

Considérons une population où la proportion théorique d’un caractère donné est pth (p théorique). Échantillon Tirage parfaitement au hasard Pobservée. Pthéorique

C’est les fluctuations de l’échantillonnage La proportion observée du caractère (sa fréquence) au niveau de l’échantillon Pobs n’est pas obligatoirement identique à la proportion théorique au niveau de la population dont il est issu, même si l’échantillon est représentatif. Population Échantillon Tirage parfaitement au hasard Elle peut prendre toutes les valeurs possibles comprise entre 0 et 1. Pobservée. Pthéorique C’est les fluctuations de l’échantillonnage

Exemple de Pari Considérons une population où la proportion théorique d’un caractère donné est pth = 0,50 (p théorique). Population p théorique = 050 Échantillon p observée Tirage parfaitement au hasard En générale pobs fluctue autour de pth et on peut calculer la probabilité pour que pobs sorte d’une certaine marge entourant pth.

a et p présente la relation a = 1 – p et p = 1 - a. on peut parier que la fréquence au niveau d’un échantillon tiré au hasard de cette population sera comprise entre 40% et 60% (0.40 ≤ pobs .≤ 0.60). Une question s’impose à ce niveau et peut poser de deux façons différentes mais complémentaires:          - Qu’elle est la probabilité pour que notre pari soit juste ? (p ?) - Quel est le risque qu’on a pris en choisissant cet intervalle [0.40-0.60] ? (a ?) a et p présente la relation a = 1 – p et p = 1 - a.

Intervalle de pari L’intervalle de pari est défini par un écart e autour de pth. ; ainsi, l’intervalle 40 à 60% autour de 50% est défini par e = 10%. Pth. 1 0,40 0,50 0,60 La table de l’écart réduit ( loi normale) ne peut être utilisée directement pour évaluer le risque du pari ; de ce fait, l’écart e est transformé en écart réduit e appelé écart réduit observé ou calculé tel que :

Dans l’exemple précédant, en supposant que l’effectif de l’échantillon est de 100, on aura :

eth = 1,96 < eos. = 2 < eth = 2,058 La table de l’écart réduit donne pour tout écart observé le risque a qui lui est associé. Pour la valeur de 2 de notre exemple, il n’y a pas de correspondance directe mais on peut remarquer que notre valeur est comprise entre deux risque : eth = 1,96 < eos. = 2 < eth = 2,058

eth=1,96 < eobs.=2 < eth=2,058 Sans chercher à interpoler,on prendra toujours la valeur la plus proche de 2 qui correspond dans ce cas à a = 5% et p = 95%. eth=1,96 < eobs.=2 < eth=2,058 Donc, lorsqu’on a parié sur l’intervalle 40%-60% sur un échantillon de 100 tiré d’une population pour laquelle la fréquence théorique est de 50%, on a 5% de chance de se tromper contre une probabilité de 95% de tomber sur cet intervalle par tirage au hasard.

En conclusion, lorsqu’on a parié sur l’intervalle 40%-60% sur un échantillon de 100 tiré d’une population pour laquelle la fréquence théorique est de 50%, on a 5% de chance de se tromper contre une probabilité de 95% de tomber sur cet intervalle par tirage au hasard. Remarque : La table de l’écart réduit ne peut être utilisée que si l’échantillon est « grand ». Pour le calcul; on considère que l’échantillon est « grand » si et seulement si Np ≥ 5 et N(1-p) ≥ 5.

III- Loi des Grands Nombres

Avec une urne présentant une fréquence pth Avec une urne présentant une fréquence pth.= 50% ; on se propose d’estimer le risque d’erreur pour un même intervalle de pari [0.40-0.60] mais pour des effectifs différents (N1=16 ; N2=100 et N3=400). N e a 16 0,125 0,10 0,80 0,47 100 0,05 2 400 0,025 4 <0,001

Ainsi, pour le même écart absolu (10%), on prend beaucoup plus de risques avec des petits échantillons. Donc, l’écart entre la composition de l’échantillon et celle de la population a d’autant moins de chance d’être dépassé lorsque la taille de l’échantillon est grande. c’est la loi des grands nombre