Intervalles de confiance pour des proportions L’inférence statistique et L’inférence statistique
Activité 1, Page 1
Vue que les valeurs d’une proportion d’échantillonnage aléatoire varient entre eux, on ne sait pas en quelle mesure une de ces valeurs particulières (quoi qu’elle soit) sera une bonne estimateur de la proportion réelle (et inconnue) de la population. Cependant, nous attendons que la proportion réelle de la population sera «raisonnablement proche» à chacune ou à une certaine pourcentage de ces proportions d’échantillonnage. L'objectif de l’intervalle de confiance consiste à utiliser une proportion d'échantillonnage observée pour construire un intervalle de valeurs qui est «raisonnablement susceptible» à contenir la proportion réelle de la population. Ici «raisonnablement susceptible» est définie de façon probabiliste (tendance à long terme) afin de quantifier la confiance dont tels intervalles contiennent la proportion réelle de la population.
Selon le TLC (pour des proportions) on voit que l'addition de deux écart-types à chaque côté de la proportion d'échantillonnage, p-chapeau, produit un intervalle autour d'elle qui contient la proportion réelle de la population π pour environ 95% de tous échantillons. Autrement dit, en raisonnant à l'envers on attends que 95% des fois qu'on construit tels intervalles, la proportion réelle de la population sera à une distance égale ou inférieure à 2 écarts-types de p-chapeau: Mais il y a un problème : Dans la pratique, nous ne pouvons pas utiliser cette formule parce que la valeur de π est généralement inconnue (effectivement, on cherche à construire cet intervalle afin d'estimer la valeur de π sur la base de la proportion d'échantillon observée p-chapeau)
Il est raisonnable d'utiliser p-chapeau en place de pi dans la formule de l’écart-type pour estimer l’écart-type de la distribution de p-chapeau: L'on appelle cette estimation l'erreur standard (ou l'erreur-type) de p-chapeau.
Activité 1, Page 2 Activité 1, Page 3
Intervalle de confiance (IC) pour une proportion de population : P-chapeau = proportion d’échantillonnage n = taille d’échantillon Le multiplicateur z* est dit «valeur critique» En pratique vous devez d'abord spécifier un niveau de confiance désiré (c.-à-d. une probabilité particulière), et ensuite trouver la valeur critique (un score standardisé) correspondant à ce niveau dans le tableau normale standard.
Activité 2: Détermination des Valeurs Critiques Avant de construire un intervalle de confiance, vous devez déterminer la valeur critique z* correspondant au niveau de confiance désiré. Ex. Supposons que nous voulons trouver la valeur de z* pour un intervalle de confiance de 98%. Cela est définie comme une valeur z* dont l'aire sous la courbe normale standard entre -z* et z* est égale à 0,98. Suivez ces étapes:
L’aire totale à la gauche de z* est égale à 0,98 + 0,01 = 0,99 1. Tracez la courbe standard normale et colorez la région correspondant à 98% du milieu de la distribution. Indiquez également approximativement où -z* et z* sont situées dans votre graphique. 2. Sur la base de votre courbe, quelle est l'aire totale sous la courbe est à la gauche de la valeur de z*? L’aire totale à la gauche de z* est égale à 0,98 + 0,01 = 0,99
3. Utilisez le tableau normale standard pour trouver la valeur (z 3. Utilisez le tableau normale standard pour trouver la valeur (z*) ayant cette aire (0,99) à sa gauche et sous la courbe normale standard. z* = 2.33
Trouvez la valeur critique z* pour un intervalle de confiance de 95% 1. Tracez la courbe standard normale et colorez la région correspondant à 95% du milieu de la distribution. Indiquez également approximativement où -z* et z* sont situées dans votre graphique. 2. Sur la base de votre courbe, quelle est l'aire totale sous la courbe est à la gauche de la valeur de z*? L’aire totale à la gauche de z* est égale à 0,95 + 0,025 = 0,975
3. Utilisez le tableau normale standard pour trouver la valeur (z 3. Utilisez le tableau normale standard pour trouver la valeur (z*) ayant cette aire (0,975) à sa gauche et sous la courbe normale standard. z* = 1.97
Quelques niveaux de confiance couramment utilisés et ses valeurs critiques associées
Activité 3 (en classe)