La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Comparaison de deux pourcentages observés Situation du problème : –2 Variables qualitatives dichotomiques La première permet de caractériser chaque groupe.

Présentations similaires


Présentation au sujet: "1 Comparaison de deux pourcentages observés Situation du problème : –2 Variables qualitatives dichotomiques La première permet de caractériser chaque groupe."— Transcription de la présentation:

1 1 Comparaison de deux pourcentages observés Situation du problème : –2 Variables qualitatives dichotomiques La première permet de caractériser chaque groupe La seconde est le critère de jugement –Comparaison de pourcentage dans deux groupes indépendants En fait, –On dispose de deux échantillons (A et B) sur lesquels on a mesuré une variable qualitative binaire –Ces deux échantillons peuvent-ils être considérés comme étant issus de la même population ? (Les deux pourcentages (P a, P b sont ils deux estimateurs du même pourcentage P ?) –Problème très fréquent –Exemple : On traite deux groupes de souris par deux goudrons par tirage au sort et on observe le pourcentage de survenue de cancers à 6 mois dans chaque groupe.

2 2 Comparaison de deux pourcentages observés Hypothèses –Hypothèse nulle H0 : Les 2 échantillons peuvent être considérés comme issus d une population ayant comme pourcentage P –P a et P b sont deux estimateurs de Pth a et Pth b avec Pth a = Pth b = P –Hypothèses alternatives : Test bilatéral –Pth a # Pth b Test unilatéral –Pth a > Pth b ou (exclusif) Pth a < Pth b Eléments nécessaires au calcul : –N a, N b = Effectifs de chaque groupe –P a et P b = Pourcentage observé dans chaque groupe Autres éléments : –N a +, N b + = Effectifs présentant le caractère dans chaque groupe N a + + N b + N a + N b = Pourcentage commun qui serait observé sous lhypothèse nulle par réunion des deux groupes –P =

3 3 Comparaison de deux pourcentages observés Statistiques utilisables –Khi 2 –Epsilon ou u (Loi normale) –Remarque : ces deux tests sont équivalents et ont les mêmes conditions d application : N a * P > 5; N b * P > 5 N a *(1-P) >5; N b *(1-P) –On approche une loi binomiale par une loi normale –Si les conditions ne sont pas remplies on prend une autre méthode

4 4 Comparaison de deux pourcentages observés Utilisation du KHI2. Test Bilatéral (unilatéral possible mais moins habituel) –Tableau des valeurs observées : –Sous lhypothèse nulle: – on aurait dû observer pour le groupe 1 : Effectif attendu de cancer : P * N a A th = A + C A + B + C + D * (A + B) = (A + C) * (A + B) N –Remarque : – Quand on a calculé un effectif théorique, on obtient les autres par différence avec les effectifs marginaux. – Pour chaque case, la différence entre leffectif théorique et leffectif observé est la même.

5 5 Comparaison de deux pourcentages observés Utilisation du KHI2. –Tableau des valeurs observées et théoriques : A A th B B th C C th D D th –Statistique : Khi 2 = (A- A th ) 2 A th + DDL = 1 (B- B th ) 2 B th + (C- C th ) 2 C th + (D- D th ) 2 D th + Khi 2 = [(A*D)-(B*C)] * N 2 (A+C) * (B+D) *(A+C) *(C+D) Remarque : La première formulation permet de vérifier les conditions dapplication : A th,B th,C th,D th doivent être supérieurs à 5

6 6 Comparaison de deux pourcentages observés Utilisation du KHI2. –Décision : Valeur critique : table du Khi 2 –Pour alpha = 0,05 Khi2 à 1 DLL = 3,84 Khi 2< Khi2 alpha Il existe une différence statistiquement significative au seuil de risque alpha. On lit dans la table le seuil de significativité p Khi 2 > Khi2 alpha On accepte H0. Attention au risque Bêta – – Remarque : les conditions dapplications sont discutées par les différents auteurs. On sera dautant plus prudent quau moins un effectif théorique est proche de 5 et que le résultat est proche de la signification.

7 7 Comparaison de deux pourcentages observés Exemple : On dispose de 100 souris qui sont réparties par tirage au sort en deux groupes de 50 souris. Le premier groupe est soumis à la fumée de cigarettes et le second à celle de cigares. On observe un pourcentage de cancer de 20% dans le groupe cigarettes et de 12% des cas dans le groupe cigare. Cette différence est-elle significative au seuil de risque 5% ? Hypothèses –HO : La différence observée est due au hasard. P a = 0,20 et P b = 0,12 sont des estimateurs de P ath et P bth tel que P ath = P bth = P –H1 : test bilatéral P ath # P bth Récapitulatifs des données P a = 0,20, P b = 0,12 N a = 50; N a + = 50 * 0,2 = 10 N b = 50; N b + = 50* 0,12= 6 P = 0,16 = (10+6)/(50+50)

8 8 Comparaison de deux pourcentages observés Utilisation du KHI2. –Tableau des valeurs observées et théoriques : Nombre de souris avec cancer Nombre de souris sans cancer Cigarettes Cigares Tous les effectifs théoriques sont supérieurs à 5 => Les conditions dapplication sont remplies Khi 2 = (10- 8) DDL = 1 (6- 8) (40- 42) (44- 42) Khi 2 = 1,19 Khi 2 alpha 5% DDL 1 = 3,84 => La différence nest pas significative au seuil de risque 5%

9 9 Comparaison de deux pourcentages observés Utilisation dune variable normale centrée réduite : u ou epsilon. Test bilatéral ou unilatéral. –Sous H0 on aurait dû observer un pourcentage théorique dont le meilleur estimateur est obtenu en regroupant les observations Soit les données : –N a = Effectif du groupe 1 –N a + = Effectif présentant le caractère dans le groupe 1 –N b = Effectif du groupe 2 –N b + = Effectif présentant le caractère dans le groupe 1 –P a = P a = P = Na+Na+ NbNb Nb+Nb+ NaNa (N a +) + (N b +) N a + N b

10 10 Comparaison de deux pourcentages observés u ou epsilon : u = |P a - P b | P * (1-P) + NaNa NbNb u alpha est lu dans la table de lepsilon. u 5% = 1,96 Décision Si u > u alpha on rejette H0. Il existe une différence statistiquement significative. On cherche le degré de signification p Si u < u alpha on ne peut pas rejeter H0. Attention au risque Beta. Remarque : le u est la racine carrée du khi 2 que lon aurait pu calculer.

11 11 Comparaison de deux pourcentages observés Exemple : On dispose de 100 souris qui sont réparties par tirage au sort en deux groupes de 50 souris. Le premier groupe est soumis à la fumée de cigarettes et le second à celle de cigares. On observe un pourcentage de cancer de 20% dans le groupe cigarettes et de 12% des cas dans le groupe cigare. Cette différence est-elle significative au seuil de risque 5% ? Hypothèses –HO : La différence observée est due au hasard. P a = 0,20 et P b = 0,12 sont des estimateurs de P ath et P bth tel que P ath = P bth = P –H1 : test bilatéral P ath # P bth Récapitulatifs des données P a = 0,20, P b = 0,12 N a = 50; N a + = 50 * 0,2 = 10 N b = 50; N b + = 50* 0,12= 6 P = 0,16 = (10+6)/(50+50)

12 12 Comparaison de deux pourcentages observés u ou epsilon : u = |0,20 -0,12| 0,16 * 0, ,16 * 0,84 u = 1,091 u 5% = 1,96 => La différence nest pas significative au seuil de risque 5% Remarque : 1,091 est la racine carrée de 1,19 valeur du khi 2 précédent.


Télécharger ppt "1 Comparaison de deux pourcentages observés Situation du problème : –2 Variables qualitatives dichotomiques La première permet de caractériser chaque groupe."

Présentations similaires


Annonces Google