Tests relatifs aux variables qualitatives: Tests du Chi-deux.

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

ANOVA à un facteur (Rehailia)
Principe Exemple Utilisation d’une macro
Introduction aux statistiques
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Inférence statistique
Situation du problème :
Comparaison de pourcentages : séries appariées
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
ASSOCIATION entre caractères qualitatifs
Comparaison de plusieurs moyennes Analyse de variance
Nombre de sujets nécessaires en recherche clinique
ASSOCIATION entre caractères qualitatifs
Les TESTS STATISTIQUES
Les tests d’hypothèses
Comparaison de plusieurs moyennes Analyse de variance
Indépendance & Khi-deux ²
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Tests de comparaison de moyennes
Les liens entre les variables et les tests d’hypothèse
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Nombre de sujets nécessaires en recherche clinique
Groupe 1: Classes de même intervalle
Test 2.
Problème Autre formulation :
Howell, Chap. 1 Position générale
L’Analyse de Variance 1 Généralités Le modèle Calculs pratiques
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
Statistiques Séance 10 N. Yamaguchi.
Méthodes de Biostatistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
N. Yamaguchi1 Statistiques Séance 6 – 16 Nov 2005.
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
M2 Sciences des Procédés - Sciences des Aliments
Séance 8 30 novembre 2005 N. Yamaguchi
Intervalles de confiance pour des proportions L’inférence statistique
Statistiques analytiques sous STATA
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Problème Autre formulation :
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Test 2.
La statistique ?? Non ! C’est facile.
ou comment savoir si les différences observées sont significatives
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
BIOSTATISTIQUES Définitions.
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Chapitre 6 Les tests d ’ hypoth è se 2 – Les tests du  2 (chi 2)
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
Chap. III Statistiques inférentielles
Comparaison de deux pourcentages.
Transcription de la présentation:

tests relatifs aux variables qualitatives: Tests du Chi-deux

Test de comparaison d’une distribution observée à une distribution théorique Chi - deux de conformité.

Quand choisir ce test ? comparer une distribution observée sur un échantillon à une distribution connue (population d ’où est issu l’échantillon) variable : qualitative +++ paramètres étudiés : effectifs observés (échantillon) et effectifs attendus, théoriques ou calculés ( population) conditions de validité : tous effectifs attendus  5

Hypothèses de départ à poser : -Ho : la distribution observée est égale à la distribution de référence (théorique) : O 1 = C 1 O 2 = C 2 O k = C k - H1 : La distribution observée diffère de la distribution de référence (théorique)......

Construction du test de  2 sous H 0 : on va quantifier l’écart entre les valeurs observées et les valeurs théoriques (ou calculées ou attendues) +++ on calcule pour chaque classe : () i 2 ii C C O - Écart quadratique relatif

 On montre que la quantité suit un  2 à (k-1) d.d.l. sous H 0  Conditions de validité : - C i  5, pour tous les i = 1,…,k ()()() k 2 kk C C O... C C O C C O

Formulation générale : pour comparer la répartition observée à la répartition théorique d’une variable qualitative à k classes, on forme : on cherche la probabilité correspondante  dans la table de  2 pour le nombre de degrés de libertés d.d.l. = k-1 si  > 5%, la différence n’est pas significative si   5%, la différence est significative et  mesure le degré de signification     i 2 ii C C O 22

Comparaison de deux distributions observées chi-deux d ’homogénéité ( ou chi-deux de Pearson)

Quand choisir ce test ?  comparer les distributions observées entre deux échantillons  variable : qualitative nominale, ordinale ( ou binaire)  paramètres étudiés : distributions des 2 échantillons  séries comparées : indépendantes +++  conditions de validité : tous effectifs attendus  5

Cas de 2 variables A et B, ayant chacune deux modalités d ’une variable binaire : Tableau 2X2 ( Tableau de contingence) 2 variables : sexe et réponse au traitement

démarche : - en cas d ’équivalence des réponses au traitement entre les deux groupes (masculin, féminin), on devrait observer une répartition identique des bonnes réponses (n = 37) entre les hommes et les femmes (18,5 et 18,5) et de mauvaises réponses (n = 23) soit (11,5 et 11,5) - les valeurs 18,5 et 11,5 sont les valeurs dites théoriques (ou calculées ou attendues)

Le test va donc consister à comparer chacune des valeurs observées à ces valeurs théoriques +++ Calcul de chacune de ces 4 valeurs théoriques ? on multiplie le total de la ligne par le total de la colonne et on divise par le nombre total de sujets et ceci pour les 4 cases de notre tableau de contingence Nombre de degrés de libertés : (nombre de lignes -1) (nombre de colonnes -1) ici (2-1) (2-1) = 1 on a tous les Ci,j > 5

un seuil de signification  = 0,05  la lecture de la table du à 5% avec 1 ddl =3,84 donc ici = 0,6 < 3,84 on retient l’hypothèse H 0  il n ’existe pas d ’association entre la réponse au médicament et le sexe du malade  2  2  2   6,0 5,11 5, 10 5,11 5, 13 5,18 5, 20 5,18 5, 17C-O  ,05           C

B- Cas de 2 variables A et B, où l’une des deux a plus de deux modalités 1ère variable = n modalités (n colonnes) 2ème variable = 2 modalités

On calcule de la même façon les effectifs théoriques : On en déduit de même sous l ’hypothèse H 0  nombre du ddl = (l-1) (c-1)  conditions de validité : C i,j  5 pour tous les i,j N T m C 11 1,1   N Tm C 12 1,2   N Tm C ij ji,       i,j 2 2 C CO 

C- Cas des petits échantillons les effectifs théoriques doivent être supérieurs à 5 pour que le  2 soit interprétable Correction de Yates : conditions d’utilisation :  effectifs calculés ne doivent pas être trop éloignés de 5 (entre 3 et 5)  applicable que pour tableau 2 x 2 +++

     C 0,5CO  2 2 Yates  Exemple : échantillon de 40 souris soumis à un carcinogène : on a observé en fonction du sexe, le développement éventuel d ’un cancer          15,5 0,515,517 4,5 0,54,53  22 2 Yates

C- Cas des très petits échantillons Formule exacte : conditions d’utilisation :  effectifs calculés < 3  applicable que pour tableau 2 x 2 +++

 Exemple : échantillon de 13 souris soumis à un carcinogène : on a observé en fonction du sexe, le développement éventuel d ’un cancer  13! 4! 9! 8! 5! o1! o2! o3! o4! 4! 0! 1! 8! N! a! b! c! d!

Test du CHI-DEUX pour séries appariées test de Mc Nemar

100 malades, qui sont leurs propres témoins, ont pris A puis B ( ou B puis A) successivement

si a et b désignent les paires divergentes + - et - + on forme le chi-2 de Mc Nemar : (a - b) 2  2 = ( ddl =1) a + b conditions de validité du test : a + b  10 conclusion du test : si |  2 | < 3,84 = les pourcentages ne différent pas ( au risque 5%) si |  2 |  3,84 = les pourcentages différent significativement au risque 5%