ASSOCIATION entre caractères qualitatifs Professeur Pascale FRIANT-MICHEL > Faculté de Pharmacie Pascale.Friant@univ-lorraine.fr
CARACTERES QUALITATIFS ASSOCIATION entre CARACTERES QUALITATIFS I - INTRODUCTION Etude de deux caractères qualitatifs appartenant à une même population Y a-t-il association entre ces caractères ou sont-ils indépendants ? Remarque : lorsqu’on conclut à une indépendance des caractères, en raison même des fluctuations d’échantillonnage, les caractères peuvent se trouver associés dans une certaine proportion de cas Problème : dans quelle mesure la proportion d’association observée est-elle significative ? Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association I – INTRODUCTION (2) Réponse : méthode applicable au cas où les caractères (l’un ou l’autre ou les deux) existent sous plusieurs modalités Exemple : caractère 1 : couleur des yeux . bleu . gris . marron . . . . caractère 2 : couleur des cheveux . blond . châtains . brun . Test du c2 . c2 d’indépendance Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association II - TEST de c2 Définition Tester l’indépendance de deux caractères Comparer deux distributions : . les fréquences expérimentales observées . les fréquences théoriques 2. Principe du test a) disposer les fréquences expérimentales dans un tableau à double entrée, dit tableau de contingence différentes colonnes : diverses modalités de l’un des caractères Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association II – TEST de c2 2. Principe du test (2) différentes lignes : diverses modalités de l’autre caractère totaux des lignes et des colonnes : nombre d’individus présentant tel aspect de l’un des caractères, indépendamment de l’état de l’autre Soient k le nombre de modalités du 1er caractère et l . . . . . . 2ème . . . Un tableau de contingence permet de présenter de façon simple et claire les résultats concernant la répartition de deux caractères Cas particulier : tableau de contingence 2 x 2 Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association II – TEST de c2 2. Principe du test (3) Car. 1 Car. 2 1 2 . . . k Totaux . l O11 O12 O1l O21 O22 O2l Ok1 Ok2 Okl n1 n2 nl n’1 n’2 n’k N Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association II – TEST de c2 2. Principe du test (4) b) . calculer les fréquences théoriques correspondant à l’indépendance rigoureuse des deux caractères Exemple : probabilité d’avoir un individu possédant le caractère 1 selon la 2ème modalité (12) et le caractère 2 selon la 1ère modalité (21) Pth = p12 . p21 Or p12 = et p21 = => Pth = Or l’effectif théorique : T21 = N . Pth donc T21 = Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association II – TEST de c2 2. Principe du test (5) . calculer : . k - 1 effectifs théoriques par ligne car = n et . l - 1 . . . . . . colonne car = n’ c) définir le nombre de degrés de liberté n (nombre de termes indépendants) . par ligne pour k colonnes, nous avons k - 1 degrés de liberté . par colonne pour l lignes, nous avons l - 1 degrés de liberté donc : n = (k - 1) . (l - 1) d) calculer l’écart entre l’effectif observé et l’effectif théorique puis le c2 Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association III - FORMULES du c2 lorsque N ≥ 30 et n ≥ 5, la formule : c2 = de K. PEARSON reste légitime lorsque 30 ≤ N < 50 et que n < 5, on utilise la formule de c2 avec correction de continuité due à YATES : c2 = EXCLUSIVEMENT, lorsque tableau de contingence 2 x 2 (n = 1) On augmente ainsi la sécurité du test en pratiquant la correction de YATES Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association IV - EXEMPLE Le tableau suivant répertorie le nombre d’accidents en une année par classe d’âge des conducteurs dans un échantillon de 500 conducteurs de 18 à 50 ans. Age du conducteur Totaux 18 - 25 26 - 40 41 - 50 Nombre d’accidents 75 120 105 300 1 50 60 40 150 2 25 20 5 200 500 Vérifier, au niveau de signification de 0,01, l’hypothèse selon laquelle le nombre d’accidents est indépendant de l’âge du conducteur. Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association IV – EXEMPLE (2) Ho : Pas de relation entre l’âge des conducteurs et le nombre d’accidents Calcul des fréquences théoriques Age du conducteur Totaux 18 - 25 26 - 40 41 - 50 Nombre d’accidents 75 120 105 300 1 50 60 40 150 2 25 20 5 200 500 90 120 90 45 60 45 15 20 15 Utilisation de la formule du c2 sans correction de YATES Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association IV – EXEMPLE (3) c2 = + + + + + + + + = + 0 + + + 0 + + + 0 + = 2,50 + 2,50 + 0,56 + 0,56 + 6,67 + 6,67 = 19,46 Chapitre – Association P. FRIANT-MICHEL
Chapitre – Association IV – EXEMPLE (4) n = (3 - 1) . (3 - 1) = 2 . 2 = 4 a = 1 % => co2 = 13,28 c2 > co2 => l’hypothèse nulle est rejetée à 1 % de risque Conclusion : Il y a une relation entre le nombre d’accidents et l’âge du conducteur Chapitre – Association P. FRIANT-MICHEL