Comparaison d'une distribution observée à une distribution théorique Situation du problème : Les éléments : Généralisation de la comparaison d’un pourcentage observé à un pourcentage théorique 1 variable qualitative définissant des classes (ou quantitative mise en classes). On a la fréquence (nombre) de sujets appartenant à chaque classe. 1 distribution théorique soit empirique soit suivant une loi de probabilité théorique concernant les mêmes classes. On aboutit à une table dans laquelle pour chaque classe, on a l’effectif observé et l’effectif théorique correspondant à ce que l’on aurait observé si le caractère étudié suivait la distribution théorique. La question : La distribution observée peut-elle être considérée comme conforme à la distribution théorique ? Les écarts constatés entre valeurs observées et théoriques peuvent - ils être attribués au hasard ?
Comparaison d'une distribution observée à une distribution théorique Hypothèses : Hypothèse nulle : Les écarts constatés entre les effectifs observés et théoriques sont le fait du hasard. La distribution observée suit la loi de probabilité théorique. Hypothèse alternative La distribution observée ne suit pas la loi de probabilité théorique considérée. Eléments nécessaires au calcul Table de contingence Classe A B C D Effectif O1 O2 O3 O4 Observé Effectif Théorique T1 T2 T3 T4
Comparaison d'une distribution observée à une distribution théorique Statistique : Khi 2 “d’adéquation” Degré de liberté : Nombre de classes - 1 - Nombre de paramètres estimés de la loi théorique (si nécessaire). Conditions d’application Tous les effectifs théoriques doivent être supérieurs à 5. Si les conditions ne sont pas remplies, il faut, quand cela est possible, regrouper logiquement des classes ou prendre d’autres méthodes. Sous H0, on estime les effectifs théoriques de chaque case de la table de contingence Pour chaque case on utilise la probabilité théorique s'y rattachant multipliée par l'effectif observé total. Par exemple en cas de loi de distribution (loi normale par exemple) on calcule d'abord la probabilité d'être dans l'intervalle (Bi-Bs) de chaque classe puis l'effectif théorique. Ainsi, la probabilité d'être dans l'intervalle [ -infini; moyenne] est de 0,5. Celle d'être dans l'intervalle [-infini; moyenne - 1,96* écart type] est de 0,025... On calcule ainsi les différents effectifs théoriques en fonction de la loi de probabilité utilisée.
Comparaison d'une distribution observée à une distribution théorique Khi 2 “d’adéquation” Calcul pour chaque case des effectifs théoriques Condition d'application : tous les effectifs théoriques doivent être supérieurs à 5 sinon regroupement Calcul du Khi 2 Khi2 = S (0-T) T 2 1 p p = Nombre de classes après regroupement DDL = p -1 - Nombre de paramètres estimés Décision : Si Khi2 > Khi2 alpha => rejet de HO : la distribution n'est pas conforme à la distribution théorique. Recherche du degré de signification p. Sinon rien ne permet de dire que la distribution observée n'est pas conforme à la distribution théorique => H0 acceptée mais attention au risque ß
Comparaison d'une distribution observée à une distribution théorique Exemple 1 : Dans un essai thérapeutique, on a testé un médicament sur 200 patients. Les résultats ont été notés en bons, moyens et mauvais. On a obtenu les pourcentages de bons résultats suivants : 45% de bons résultats, 15% de résultats moyens et 40% de mauvais résultats Dans la littérature ce traitement donne 75% de bons résultats, 22% de résultats moyens et 3% de résultats mauvais. Les résultats observés sont-ils conformes à ceux de la littérature? H0 : Les résultats sont conformes H1 : Les résultats ne sont pas conformes Table de contingence Bons Moyens Mauvais Total Obs. 90 (0,45*200) 30 80 200 Théo 150 44 6 200 Khi2= (90-150) 150 2 (30-44) 30 (80 - 6) 6 + = 941,12 DDL = 2; Khi20,001 =13,82 => p<0,001 La distribution n'est pas conforme à la distribution observée dans la littérature. Les résultats obtenus sont statistiquement moins bons que ceux de la littérature. Remarque : le calcul d'un seul des termes du khi 2 (le dernier par exemple) permet de rejeter H0.
Comparaison d'une distribution observée à une distribution théorique Exemple 2 : Sur 300 étudiants en médecine, la moyenne de la taille est de 1,75m avec un écart type estimé de 0,1m. Ces deux paramètres sont estimés à partir des données de cet échantillon. Vous avez observé 8 étudiants avec une taille inférieure à 1,55m; 40 avec une taille entre 1,55 et 1,65; 102 avec une taille entre 1,65 et 1,75 et 150 avec une taille supérieure à 1,75m La distribution de la taille des étudiants en médecine peut elle être considérée comme suivant une loi normale ? Moyenne estimée = 1,75 - Écart type estimé = 0,1 < 1,55 1,55 - 1,65 1,65 - 1,175 > 1,75 Total Observé 8 40 102 150 300 Probabilité 0,025 0,135 0,34 0,5 si Loi Normale Effectif Théo 7,5 40,5 102 150 300 Terme du Khi 2 0,033 0,006 0,000 0,000 Khi 2 = 0,040 DDL = 4 - 1 - 2 = 1 Khi2 < 3,84 P > 0,05 La distribution observée ne diffère pas de manière statistiquement significative d'une loi normale de paramètre 1,75; 0,1