Méthodes de Biostatistique Chapitre VI Données Catégorielles STT6971-Méthodes de Biostatistique
1. Inférence statistique sur p La proportion d’une population est définie par: Où X: Le nombre de succès et N=Taille de la population. En considérant un échantillon aléatoire, un estimateur évident de la proportion de la population est donné par: Où X: Le nombre de succès dans l’échantillon et n=Taille échantillonnale. STT6971-Méthodes de Biostatistique
2. Estimation par intervalle de la proportion L’écart type de la proportion estimée est donné par Un estimateur de l’écart type est donné par L’intervalle de confiance pour une proportion à un niveau 100(1-)% est donné par STT6971-Méthodes de Biostatistique
STT6971-Méthodes de Biostatistique 3. Exemple Exemple: La proportion de patients ayant subis une chirurgie dans un échantillon de 200 patients choisis dans un hôpital régional est L’intervalle de confiance à 95% est donné par Une règle pour vérifier qu’on a un échantillon assez large pour appliquer le théorème central limite est STT6971-Méthodes de Biostatistique
4. Tests d’hypothèses sur une proportion Considérons l’hypothèse nulle suivante: On rejette l’hypothèse nulle au niveau d’erreur \alpha, si pour chacune des alternatives suivantes, on a ou Où STT6971-Méthodes de Biostatistique
5. Inférence sur la différence de deux proportions En considérant deux échantillons indépendants provenant de deux populations indépendantes, on s’intéresse à la différence de deux proportions (où la différence du risque), qu’on note Un estimateur ponctuel de la différence du risque, est donné par Où = La proportion échantillonnale dans la population i ( i =1, 2). En se basant sur des tailles échantillonnales adéquates, i.e. et L’intervalle de confiance au niveau 100(1-)% est donné par: STT6971-Méthodes de Biostatistique
3. Tests d’hypothèses sur la différence de proportions Considérons l’hypothèse suivante: En se basant sur deux échantillons de tailles respectives et ,en considérant les alternatives suivantes, on dit alors qu’on rejette l’hypothèse nulle au niveau de signifiance de %, si si ou si où STT6971-Méthodes de Biostatistique
STT6971-Méthodes de Biostatistique 4. Tests d’ajustement Pour les tests d’ajustement, l’hypothèse nulle est donnée par: La distribution des données observées suit une loi donnée. L’hypothèse nulle est rejetée si: O: Les valeurs observées, E: Les valeurs espérées. Comment calculer les valeurs espérées? (voir exemple) STT6971-Méthodes de Biostatistique
STT6971-Méthodes de Biostatistique Tests d’indépendance On applique le test chi-deux pour deux échantillons ou plus, ou deux variables catégorielles, dans le cas où on veut s’assurer si ces deux échantillons sont indépendants ou non. L’hypothèse nulle dans ce cas est donnée par Les deux variables sont indépendantes. On rejette l’hypothèse nulle si STT6971-Méthodes de Biostatistique
Détermination de la taille échantillonnale Étant donné un certain niveau de précision, la taille échantillonnale nécessaire pour estimer p est donnée par Dans le cas d’un test de deux proportions, on a où et = Nombre minimum d’observations requis pour atteindre la puissance . STT6971-Méthodes de Biostatistique