tests relatifs aux variables qualitatives: Tests du Chi-deux
Test de comparaison d’une distribution observée à une distribution théorique Chi - deux de conformité.
Quand choisir ce test ? comparer une distribution observée sur un échantillon à une distribution connue (population d ’où est issu l’échantillon) variable : qualitative +++ paramètres étudiés : effectifs observés (échantillon) et effectifs attendus, théoriques ou calculés ( population) conditions de validité : tous effectifs attendus 5
Hypothèses de départ à poser : -Ho : la distribution observée est égale à la distribution de référence (théorique) : O 1 = C 1 O 2 = C 2 O k = C k - H1 : La distribution observée diffère de la distribution de référence (théorique)......
Construction du test de 2 sous H 0 : on va quantifier l’écart entre les valeurs observées et les valeurs théoriques (ou calculées ou attendues) +++ on calcule pour chaque classe : () i 2 ii C C O - Écart quadratique relatif
On montre que la quantité suit un 2 à (k-1) d.d.l. sous H 0 Conditions de validité : - C i 5, pour tous les i = 1,…,k ()()() k 2 kk C C O... C C O C C O
Formulation générale : pour comparer la répartition observée à la répartition théorique d’une variable qualitative à k classes, on forme : on cherche la probabilité correspondante dans la table de 2 pour le nombre de degrés de libertés d.d.l. = k-1 si > 5%, la différence n’est pas significative si 5%, la différence est significative et mesure le degré de signification i 2 ii C C O 22
Comparaison de deux distributions observées chi-deux d ’homogénéité ( ou chi-deux de Pearson)
Quand choisir ce test ? comparer les distributions observées entre deux échantillons variable : qualitative nominale, ordinale ( ou binaire) paramètres étudiés : distributions des 2 échantillons séries comparées : indépendantes +++ conditions de validité : tous effectifs attendus 5
Cas de 2 variables A et B, ayant chacune deux modalités d ’une variable binaire : Tableau 2X2 ( Tableau de contingence) 2 variables : sexe et réponse au traitement
démarche : - en cas d ’équivalence des réponses au traitement entre les deux groupes (masculin, féminin), on devrait observer une répartition identique des bonnes réponses (n = 37) entre les hommes et les femmes (18,5 et 18,5) et de mauvaises réponses (n = 23) soit (11,5 et 11,5) - les valeurs 18,5 et 11,5 sont les valeurs dites théoriques (ou calculées ou attendues)
Le test va donc consister à comparer chacune des valeurs observées à ces valeurs théoriques +++ Calcul de chacune de ces 4 valeurs théoriques ? on multiplie le total de la ligne par le total de la colonne et on divise par le nombre total de sujets et ceci pour les 4 cases de notre tableau de contingence Nombre de degrés de libertés : (nombre de lignes -1) (nombre de colonnes -1) ici (2-1) (2-1) = 1 on a tous les Ci,j > 5
un seuil de signification = 0,05 la lecture de la table du à 5% avec 1 ddl =3,84 donc ici = 0,6 < 3,84 on retient l’hypothèse H 0 il n ’existe pas d ’association entre la réponse au médicament et le sexe du malade 2 2 2 6,0 5,11 5, 10 5,11 5, 13 5,18 5, 20 5,18 5, 17C-O ,05 C
B- Cas de 2 variables A et B, où l’une des deux a plus de deux modalités 1ère variable = n modalités (n colonnes) 2ème variable = 2 modalités
On calcule de la même façon les effectifs théoriques : On en déduit de même sous l ’hypothèse H 0 nombre du ddl = (l-1) (c-1) conditions de validité : C i,j 5 pour tous les i,j N T m C 11 1,1 N Tm C 12 1,2 N Tm C ij ji, i,j 2 2 C CO
C- Cas des petits échantillons les effectifs théoriques doivent être supérieurs à 5 pour que le 2 soit interprétable Correction de Yates : conditions d’utilisation : effectifs calculés ne doivent pas être trop éloignés de 5 (entre 3 et 5) applicable que pour tableau 2 x 2 +++
C 0,5CO 2 2 Yates Exemple : échantillon de 40 souris soumis à un carcinogène : on a observé en fonction du sexe, le développement éventuel d ’un cancer 15,5 0,515,517 4,5 0,54,53 22 2 Yates
C- Cas des très petits échantillons Formule exacte : conditions d’utilisation : effectifs calculés < 3 applicable que pour tableau 2 x 2 +++
Exemple : échantillon de 13 souris soumis à un carcinogène : on a observé en fonction du sexe, le développement éventuel d ’un cancer 13! 4! 9! 8! 5! o1! o2! o3! o4! 4! 0! 1! 8! N! a! b! c! d!
Test du CHI-DEUX pour séries appariées test de Mc Nemar
100 malades, qui sont leurs propres témoins, ont pris A puis B ( ou B puis A) successivement
si a et b désignent les paires divergentes + - et - + on forme le chi-2 de Mc Nemar : (a - b) 2 2 = ( ddl =1) a + b conditions de validité du test : a + b 10 conclusion du test : si | 2 | < 3,84 = les pourcentages ne différent pas ( au risque 5%) si | 2 | 3,84 = les pourcentages différent significativement au risque 5%