Distributions d’échantillonnage pour des proportions
Symboles conventionnels pour représenter des paramètres et des statistiques associées
L’échantillonnage des bonbons Reese’s Pieces
Enregistrez les résultats de vos échantillons (la variable d’intérêst est si un bonbon est de couleur orange)
Un applet pour simuler le processus d’échantillonnage des bonbons est disponible au http://www.rossmanchance.com/applets/Reeses3/ReesesPieces.html
Distributions d’échantillonnage des proportions La distribution des proportions calculées pour tous les échantillons possibles d'une taille donnée (seléctionnés à partir d'une population particulière) est un concept théorique que l'on appelle la distribution d'échantillonnage des proportions. La distribution des proportions d'échantillonnages resultant d’une simulation fournit une approximation à la distribution d'échantillonnage théorique (de la proportion d’intérêt) L'augmentation du nombre d'échantillons générés par la simulation nous permet de mieux discerner la tendance à long terme de la distribution des proportions, en nous donnant une approximation plus évidente à la distribution d’échantillonnage théorique.
Théorème limite centrale (TLC) pour des proportions d'échantillonnage Hypothèses Supposons q'un échantillon aléatoire simple de taille égale à n sera choisi à partir d'une grande population (plus de 10 fois plus grande que l'échantillon) ayant une proportion réelle (de l’attribut d'intérêt) égale à π. Supposons en outre que ce processus pourrait être répété un très grand nombre de fois essentiellement sous les mêmes conditions, générant ainsi une distribution des proportions, p-chapeau, calculées pour tous ces échantillons (l’on appelle la «distribution d’échantillonnage de la proportion»)
Théorème limite centrale (TLC) pour des proportions d'échantillonnage Conclusions Alors nous pouvons prédire que la distribution d'échantillonnage de la proportion p-chapeau aura les trois caractéristiques suivantes: Forme: Sa forme sera approximativement normale. Centre: Sa moyenne sera égale à π. Dispersion: Son écart-type sera égale à RacineCarrée([π(1-π)/n]) Conditions techniques : Cette approximation à la distribution normale devient de plus en plus précise en augmentant la taille de l'échantillon (n) ET elle est généralement considérée comme valide si deux conditions techniques sont remplies: nπ > 10 et n(1-π) > 10.