Faculté de Médecine de Marseille, Université de la Méditerranée Laboratoire d’Enseignement et de Recherche sur le Traitement de l’Information Médicale Dr Julien Mancini Épidémiologie étiologique prise en compte des facteurs de confusion
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Biais de confusion l Seul biais qui peut-être corrigé lors de l’analyse statistique stratification analyse multivariée : régression logistique E M F
Stratification
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Exemple : enquête fictive l On constate début 2004 une hausse brutale du nombre des malformations congénitales l On suspecte rapidement 2 nouveaux traitements mis sur le marché en début d’année...
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Fichier disponible 4 variables : Malformation : oui / non Age maternel Trt A (antihypertenseur) : oui / non Trt B (antalgique) : 0 / 10 / 100mg
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Confusion ? Trt AMalformations Âge ?
Analyses univariées : Trt A Trt A Risque de Malformation (p<0,001) Prescrit chez les femmes de plus de 35 ans (p<0,001) Hors, le R de malformation est plus fréquent chez les femmes âgées (p<0,001)
Stratification l Femmes < 35 ans : Quasi absence de prescription de A, pas d’effet l Femmes > 35 ans : Absence d’effet du traitement A (p=0,662)
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Confusion ? Trt AMalformations Âge Oui !!!
Régression logistique
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Modèles multivariés l Étudient les relations entre : 1 variable dépendante Y Et plusieurs var explicatives X i l On devrait plutôt employer le terme « multivariables » ou « multifactoriels » car une seule var. dépendante
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Modélisation l Remplace la « stratification » avantageusement dès qu’il y a plusieurs strates l Suppose que la réalité soit « proche » de la modélisation Si on modélise une relation sous forme linéaire, les conclusions des analyses dépendront du bien-fondé de cette hypothèse de départ
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Utilisation croissante (Horton NEJM 05)
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Principaux modèles l Variable dépendante Y = quantitative (normale) Régression linéaire multiple l Variable dépendante Y = qualitative Binaire : Régression logistique 3 classes et + : Régression polytomique 3 classes et + ordonnées : Régression ordinale l Variable dépendante Y = incidence instantanée (Données censurées (de survie)) Modèle de Cox
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Régression logistique l Très utilisée en épidémiologie Liens entre Maladie et Facteurs de risque +++ l Étudie les relations entre : 1 variable expliquée Y (dépendante) binaire (0/1) Et 1 (RLog simple) ou plusieurs (Rlog multiple) var explicatives X i X i aussi bien qualitatives que quantitatives
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Variable dépendante Y l Le + souvent : Maladie = oui/non l Toute var. binaire : Pronostic = favorable/défavorable Décès = oui/non … l Toute var. quantitative dichotomisée : Hb <10 / 10 g/dl …
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Modèle l Probabilité d’être malade fonction de n différents facteurs de risque X i : l Y = P (M + / X 1, X 2, …, X n )
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Fonction logistique l P (M+ / X) = f(x) = 1 / [1+exp(-( + X)] l Varie entre 0 et 1 (proba) x f(x) 1 0
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Fonction logit l Logit(P) = Ln(Odd(P)) = Ln(P/(1-P)) l Logit(P) = + X l On peut écrire: l Ln ([Odd(P(M+/X=x 1 ))] / [Odd(P(M+/X= x 0 ))]) = Ln (ORx 1 /x 0 ) = (x 1 - x 0 ) l Exposition E dichotomique : E 1 = 1 et E 0 = 0 l on a : OR E 1 /E 0 = exp( )
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Extension à plusieurs variables l Modéle multiplicatif l P (M+ / X 1, X 2, …, X n ) = 1 / [1+exp(-( +Σ i X i )] l Ou : Logit(P) = + Σ i X i l Exposition E (X 1 ) dichotomique (0/1) l Ln OR E = Logit P 1 - Logit P 0 = ( + +Σ 1 i X i ) - ( +Σ 0 i X i ) = si les X i sont fixés (i.e. Σ 1 =Σ 0 ) l OR E 1 /E 0 ajusté sur X 2, …, X n = exp( 1 (E 1 - E 0 )) = exp( 1 )
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Estimation des paramètres et tests l et estimés par la méthode du maximum de vraisemblance (V = proba d’observer l’échantillon) et qui maximisent la vraisemblance du modèle l On peut alors tester les paramètres de 2 modèles emboités: H 0 : OR = 1 ou = 0 Modèle 1 (V 1 ) : Logit(P) = + 1 X 1 + 2 X 2 Modèle 2 (V 2 ) : Logit(P) = ’ + ’ 1 X 1 + ’ 2 X 2 + ’ 3 X 3 ’ 3 significativement différent de 0 si V 1 significativement inférieure à V 2 Test : 2Ln(V 1 /V 2 ) = 2Ln(V 2 ) - 2Ln(V 1 ) suit une loi du Chi ² à 1 ddl
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Codage des variables à k classes l On doit recoder les variables à k classes en (k-1) variables binaire en 0/1 l On peut ainsi interpréter les différents coefficients à partir d’une référence l Codage standard (par défaut dans les logiciels de stats) : XY1Y1 Y2Y2 Y3Y
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Codage (E 0 = ref) l Modèle1 : Logit(P) = + E OR E 2 /E 0 = exp( (E 2 - E 0 ) = exp(2 ) = (OR E 1 /E 0 )² !!! l Modèle 2 : Logit(P) = + 1 X 1 + 2 X 2 + 3 X 3 OR X 2 /X 0 = exp( 2 (X 2 - X 0 ) = exp( 2 ) EX1X1 X2X2 X3X
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Codage des variables quantitatives l Soit tel quel : Suppose effet linéaire sans seuil de la var explicative l Soit recodage en k classes : plus prudent interprétation plus facile l Choix en fonction : De la vraisemblance des modèles, de l’adéquation du modèle aux observations De la facilité d’interprétation
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Exemple : enquête fictive l Régressions logistiques univariées : association significative entre trt A et malformation association significative entre âge et malformation
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Exemple : enquête fictive (2) l Régression logistique multivariée : Disparition de l’association significative entre trt A et malformation après ajustement sur l’âge
Dr Julien Mancini, LERTIM, Faculté de Médecine, Université de la Méditerranée Exemple : Lee SJ et al. Jama 2006: 295(7): l Recherche de facteurs indépendamment prédictifs de la mortalité à 4 ans, pour création d’un index l Tous les facteurs inclus sont ici significativement liés à la mortalité car OR > 1 avec IC95% qui ne contient pas 1