tests relatifs aux variables qualitatives: Tests du Chi-deux
Tests du chi-deux : problèmatique Comparaison du résultat ( succès ou échec) selon le type histologique d’un cancer ? Résultats : Type histologique A : 11 vivants / 55 malades Type histologique B : 18 vivants / 63 malades Comparaison de pourcentages : taux de succès avec A : 20% à taux de succès avec B : 28% COMPARER LES EFFECTIFS: Nombre de succès avec A à Nombre de succès avec B
Tests du chi-deux : plan 1 - test de comparaison d ’une distribution observée à une distribution théorique (chi-deux de conformité) 2 - test de comparaison de deux distributions observées (chi-deux d’homogénéité ou de Pearson) 3 - Cas des séries appariées (chi-deux de Mc Nemar)
Test de comparaison d ’une distribution observée à une distribution théorique Chi - deux de conformité.
Exemple : on veut comparer la répartition de la structure par âge de la Picardie par rapport à la population française Deux groupes : observé ( population Picarde) - théorique ( population française) classes d ’âges : 0-10 ans, ans, …..
Quand choisir ce test ? comparer une distribution observée sur un échantillon à une distribution connue (population d’où est issu l’échantillon) variable : qualitative +++ paramètres étudiés : effectifs observés (échantillon) et effectifs attendus, théoriques ou calculés ( population) conditions de validité : tous effectifs attendus 5
Principes du test : soit une distribution constituée de n observations classées en k classes [ex: âge : classes de 10 ans] Deux groupes : observés - théoriques Dans chaque classe i de la distribution (ex : ans) on a :. l’effectif observé : O i. l’effectif théorique (ou attendu, ou calculé) : C i = effectif de référence
Hypothèses de départ à poser : on va tester : - Ho : la distribution observée est égale à la distribution de référence (théorique) : O 1 = C 1 O 2 = C 2 O k = C k - H1 : La distribution observée diffère de la distribution de référence (théorique)......
Construction du test de 2 sous H 0 : on va quantifier l’écart entre les valeurs observées et les valeurs théoriques (ou calculées ou attendues) +++ on calcule pour chaque classe : () i 2 ii C C O - Écart quadratique relatif
On montre que la quantité suit un 2 à (k-1) d.d.l. sous H 0 Conditions de validité : - C i 5, pour tous les i = 1,…,k ()()() k 2 kk C C O... C C O C C O
Formulation générale : pour comparer la répartition observée à la répartition théorique d’une variable qualitative à k classes, on forme : on cherche la probabilité correspondante dans la table de 2 pour le nombre de degrés de libertés d.d.l. = k-1 si > 5%, la différence n ’est pas significative si 5%, la différence est significative et mesure le degré de signification i 2 ii C C O 22
Exemple des groupes sanguins (n=1000) : Picardie Population Française 6, 22
Conditions de validité: tous les C i 5 > on rejette H 0 degré de signification p < 1% conclusion : la répartition, en Picardie, des groupes sanguins diffère de la répartition nationale 3 2 0,05 2 7,8153 0,05 2