La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Comparaison de plusieurs distributions observées. Indépendance de deux caractères qualitatifs Situation du problème : –On dispose de deux variables qualitatives.

Présentations similaires


Présentation au sujet: "1 Comparaison de plusieurs distributions observées. Indépendance de deux caractères qualitatifs Situation du problème : –On dispose de deux variables qualitatives."— Transcription de la présentation:

1 1 Comparaison de plusieurs distributions observées. Indépendance de deux caractères qualitatifs Situation du problème : –On dispose de deux variables qualitatives (avec C et L modalités), que lon a mesurées sur chaque sujet : exemple groupes sanguins et pays dhabitation. On a un tableau à C*L cases, un sujet est classé dans une case et une seule. –Ceci revient à la comparaison de plusieurs distributions : on désire savoir si la distribution des groupes sanguins est la même dans les différents pays. Données : –Données élémentaires : SujetGroupe SanguinPays 1 AF 2 AD 3 BGB..... –Table de contingence A B AB O Tot F Obs ij N i. D GB Tot N.j N

2 2 Comparaison de plusieurs distributions observées. Indépendance de deux caractères qualitatifs Hypothèses : –Hypothèse nulle Il y a indépendance entre les deux caractères. Sous cette hypothèse, la probabilité de présenter une modalité i,j est P ij = P i. * P.j. Leffectif attendu est alors : C ij = N * P i. * P.j. Estimation de P i. = N i. N = Effectif Total Ligne N Estimation de P.j = N.j N = Effectif Total Colonne N C ij = Effectif Total Ligne * Effectif Total Colonne Effectif Total Remarque : on doit calculer (C-1)*(L-1) C ij, les autres sobtiennent par différence avec les totaux marginaux. On peut formuler lhypothèse nulle sous la forme : les écarts constatés entre les effectifs observés O ij et théoriques C ij obtenus sous lhypothèse dindépendance sont dus aux fluctuations du hasard. –Hypothèse alternative Il ny a pas indépendance entre les caractères. La survenue de lun influence lautre

3 3 Comparaison de plusieurs distributions observées. Indépendance de deux caractères qualitatifs Statistique utilisée : –Khi 2 –DDL = (L-1)*(C -1) –Conditions dapplication : Tous les effectifs théoriques doivent être supérieurs à 5 ( C ij >5) Si lun des effectifs théoriques est inférieur à 5, on doit regrouper les modalités quand cela est pertinent. –Khi 2 = ij (O ij - C ij ) 2 C ij – Décision : –Khi 2 > Khi 2 alpha : on rejette H0. Il ny a pas indépendance entre les deux caractères. Les distributions de lun différent en fonction de lautre. Il existe une liaison entre les deux caractères. La survenue de lun influence la survenue de lautre mais on ne sait rien sur la force de la liaison ni sur la causalité. –Sinon on ne peut pas rejeter lindépendance mais attention au risque Bêta

4 4 Exemple Exemple 1 On examine la répartition des groupes sanguins entre Nancy, Metz, Dijon, Strasbourg. On obtient la table de contingence suivante : Hypothèse nulle : La répartition des groupes sanguins est indépendante des villes. Hypothèse alternative : La répartition des groupes sanguins varie en fonction des villes. Statistique utilisée : Khi 2, risque alpha choisi 5% Effectif théorique Nancy et O = * On calcule les effectifs théoriques pour toutes les cases du tableaux. Les effectifs théoriques de la ligne Strasbourg et de la colonne AB peuvent être obtenus par différence avec les totaux marginaux

5 5 Exemple Exemple 1 (suite) 489,62 396,56 86,61 27,20 411,28 333,11 72,76 22,85 280,55 227,23 49,63 15,59 186,55 151,09 33,00 10,36 Les conditions dapplication sont remplies (tous les effectifs théoriques sont supérieurs à 5). Khi 2 = ( ,62) 489, (3 - 10,36) 10,36 2 = 12,26 DDL = (4-1)*(4-1) = 9 Khi 2 5% pour DDL 9 = 16,92 On ne met pas en évidence de différence significative entre les distributions des groupes sanguins dans les 4 villes.


Télécharger ppt "1 Comparaison de plusieurs distributions observées. Indépendance de deux caractères qualitatifs Situation du problème : –On dispose de deux variables qualitatives."

Présentations similaires


Annonces Google