Statistiques: mesures de liaisons tests d’hypothèse Witold Jarzebowski Hôpital Charles Foix Université Paris 6
Lien entre deux variables Quelle type de liaison Mesures de dépendance Mesures de concordance Quel type de variables? Quantitative X quantitative Qualitative X qualitative Quantitative X qualitative
Mesure de dépendance ≠ mesure de concordance Dépendance : coefficient de corrélation, RR, … A quel point la connaissance d’une variable nous informe sur une autre : Sexe et taille ; Date de naissance et taille Tabagisme et cancer Concordance : ICC, biais-précision; kappa, Se Sp… A quel point deux variables sont identiques : note par correcteur A et par correcteur B DFG par Cockcroft ou par MDRD Diagnostic de cancer par clinicien A et par clinicien B ; par mammographie et par anatomopathologie
Mesure de dépendance … Mesures de dépendance monotone : coefficient de corrélation La taille du bras est très corrélée à la taille de la jambe. Le revenu par ménage est corrélé (négativement) au nombre d’enfants Mesures de dépendance non monotone : Le pH artériel est lié au score de Glasgow (coma) : Glasgow élevé entre 7.38 et 7.42, abaissé en dehors de cet intervalle …
Mesures de dépendance Quantitative X quantitative -> corrélation Qualitative X qualitative -> risque relatif ou odds ratio Quantitative X qualitative -> ANOVA à 1 facteur
Coefficient de corrélation traduit une dépendance monotone Compris entre -1 et 1 Proche de zéro si pas de dépendance monotone
Association entre variables qualitatives : RR et OR Prévalence : P=(a+c)/(a+b+c+d) Risque absolu : Chez les exposés : P1 = a/(a+b) Chez les non exposés : P0 = c/(c+d) Attention : pas si cas/témoin Risque relatif : RR = P1/P0 Cote (« odds ») : Chez les exposés : c1 = a/b Chez les non exposés : c0 = cd Odds Ratio (rapport de cotes): OR = ad/bc malades Non malades Exposés a b Non exposés c d
Réduction absolue du risque et Nombre de sujets à traiter (NNT) RAR = P0-P1 NNT = 1/RAR
Principe des tests d’hypothèse COMPARER
Base théorique
Objectiver des différences malgré la variabilité Test par intervalle de pari = aide objective à la décision Exemple : comparer 2 traitements A et B Essai randomisé contrôlé (2 groupese de 100) Résultats (30vs30? 30 vs 29? 97 vs 3? 45 vs 30?) Test pour décréter si il y a différence d’efficacité significative.
Raisonnement par intervalle de pari
Principe des tests:
Principe des tests Règle de décision : Si p< 0,05 : on rejette H0 : la différence est significative, on peut conclure que H1 est vraie on maîtrise le risque de se tromper : alpha = 5%. Si p> 0,05 : on ne rejette pas H0 : on n’a pas pu mettre en évidence une différence statistiquement significative
Principe des tests:
Alpha et Beta p< 5% p> 5% p> 5% p< 5% Où est la vérité ? 2 hypothèses … H0 (statu quo) est vraie Risque alpha de la rejeter 1-alpha chance de ne pas la rejeter H1 (qu’on veut montrer) est vraie Risque beta de na pas rejeter H0 Puissance 1-beta de conclure à H1 p< 5% p> 5% p> 5% p< 5%
En pratique: Très bon guide et calcul en ligne sur BIOSTATTGV
Interpréter Différence statistiquement significative … ≠ causale ≠ cliniquement pertinente Causalité : cf niveaux de preuve Importance du contrôle expérimental de l’exposition (essai randomisé idéalement)
Biais 2 types d’erreur dans une étude : 3 types de biais : Aléatoire : manque de fiabilité Systématique (=biais) : manque de validité 3 types de biais : Biais de sélection : la population diffère de la population cible (ex: tolérance digestive d’un AINS) Biais de classement : erreur de mesure (ex: maladies à partir du PMSI) Biais de confusion : tiers facteur qui est lié à la fois à la maladie et à l’exposition sans participer à la chaîne causale
Facteur de Confusion Définition : Comment le limiter : tiers facteur lié à la fois à la maladie et à l’exposition sans participer à la chaîne causale Comment le limiter : Design de l’étude : Idéalement contrôle de l’exposition par randomisation Appariement Stratification Lors de l’analyse: Sous groupes Ajustement