La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Tests relatifs aux variables qualitatives: Tests du Chi-deux.

Présentations similaires


Présentation au sujet: "Tests relatifs aux variables qualitatives: Tests du Chi-deux."— Transcription de la présentation:

1 tests relatifs aux variables qualitatives: Tests du Chi-deux

2 Test de comparaison d’une distribution observée à une distribution théorique Chi - deux de conformité.

3 Quand choisir ce test ? comparer une distribution observée sur un échantillon à une distribution connue (population d ’où est issu l’échantillon) variable : qualitative +++ paramètres étudiés : effectifs observés (échantillon) et effectifs attendus, théoriques ou calculés ( population) conditions de validité : tous effectifs attendus  5

4 Hypothèses de départ à poser : -Ho : la distribution observée est égale à la distribution de référence (théorique) : O 1 = C 1 O 2 = C 2 O k = C k - H1 : La distribution observée diffère de la distribution de référence (théorique)......

5 Construction du test de  2 sous H 0 : on va quantifier l’écart entre les valeurs observées et les valeurs théoriques (ou calculées ou attendues) +++ on calcule pour chaque classe : () i 2 ii C C O - Écart quadratique relatif

6  On montre que la quantité suit un  2 à (k-1) d.d.l. sous H 0  Conditions de validité : - C i  5, pour tous les i = 1,…,k ()()() k 2 kk 2 2 22 1 2 11 C C O... C C O C C O - ++ - + -

7 Formulation générale : pour comparer la répartition observée à la répartition théorique d’une variable qualitative à k classes, on forme : on cherche la probabilité correspondante  dans la table de  2 pour le nombre de degrés de libertés d.d.l. = k-1 si  > 5%, la différence n’est pas significative si   5%, la différence est significative et  mesure le degré de signification     i 2 ii C C O 22

8 Comparaison de deux distributions observées chi-deux d ’homogénéité ( ou chi-deux de Pearson)

9

10 Quand choisir ce test ?  comparer les distributions observées entre deux échantillons  variable : qualitative nominale, ordinale ( ou binaire)  paramètres étudiés : distributions des 2 échantillons  séries comparées : indépendantes +++  conditions de validité : tous effectifs attendus  5

11 Cas de 2 variables A et B, ayant chacune deux modalités d ’une variable binaire : Tableau 2X2 ( Tableau de contingence) 2 variables : sexe et réponse au traitement

12 démarche : - en cas d ’équivalence des réponses au traitement entre les deux groupes (masculin, féminin), on devrait observer une répartition identique des bonnes réponses (n = 37) entre les hommes et les femmes (18,5 et 18,5) et de mauvaises réponses (n = 23) soit (11,5 et 11,5) - les valeurs 18,5 et 11,5 sont les valeurs dites théoriques (ou calculées ou attendues)

13 Le test va donc consister à comparer chacune des valeurs observées à ces valeurs théoriques +++ Calcul de chacune de ces 4 valeurs théoriques ? on multiplie le total de la ligne par le total de la colonne et on divise par le nombre total de sujets et ceci pour les 4 cases de notre tableau de contingence Nombre de degrés de libertés : (nombre de lignes -1) (nombre de colonnes -1) ici (2-1) (2-1) = 1 on a tous les Ci,j > 5

14 un seuil de signification  = 0,05  la lecture de la table du à 5% avec 1 ddl =3,84 donc ici = 0,6 < 3,84 on retient l’hypothèse H 0  il n ’existe pas d ’association entre la réponse au médicament et le sexe du malade  2  2  2   6,0 5,11 5, 10 5,11 5, 13 5,18 5, 20 5,18 5, 17C-O  2 2222 2 0,05           C

15 B- Cas de 2 variables A et B, où l’une des deux a plus de deux modalités 1ère variable = n modalités (n colonnes) 2ème variable = 2 modalités

16 On calcule de la même façon les effectifs théoriques : On en déduit de même sous l ’hypothèse H 0  nombre du ddl = (l-1) (c-1)  conditions de validité : C i,j  5 pour tous les i,j N T m C 11 1,1   N Tm C 12 1,2   N Tm C ij ji,       i,j 2 2 C CO 

17 C- Cas des petits échantillons les effectifs théoriques doivent être supérieurs à 5 pour que le  2 soit interprétable Correction de Yates : conditions d’utilisation :  effectifs calculés ne doivent pas être trop éloignés de 5 (entre 3 et 5)  applicable que pour tableau 2 x 2 +++

18      C 0,5CO  2 2 Yates  Exemple : échantillon de 40 souris soumis à un carcinogène : on a observé en fonction du sexe, le développement éventuel d ’un cancer          15,5 0,515,517 4,5 0,54,53  22 2 Yates

19 C- Cas des très petits échantillons Formule exacte : conditions d’utilisation :  effectifs calculés < 3  applicable que pour tableau 2 x 2 +++

20  Exemple : échantillon de 13 souris soumis à un carcinogène : on a observé en fonction du sexe, le développement éventuel d ’un cancer  13! 4! 9! 8! 5! o1! o2! o3! o4! 4! 0! 1! 8! N! a! b! c! d!

21 Test du CHI-DEUX pour séries appariées test de Mc Nemar

22 100 malades, qui sont leurs propres témoins, ont pris A puis B ( ou B puis A) successivement

23 si a et b désignent les paires divergentes + - et - + on forme le chi-2 de Mc Nemar : (a - b) 2  2 = -------------- ( ddl =1) a + b conditions de validité du test : a + b  10 conclusion du test : si |  2 | < 3,84 = les pourcentages ne différent pas ( au risque 5%) si |  2 |  3,84 = les pourcentages différent significativement au risque 5%


Télécharger ppt "Tests relatifs aux variables qualitatives: Tests du Chi-deux."

Présentations similaires


Annonces Google