Comparaison de quatre méthodes d’estimation d’un effet direct et exploration de l’importance des biais potentiels : étude par simulation Benoît Lepage 1,2,3, Dominique Dedieu 1, Nicolas Savy 4, Thierry Lang 1,2,3 1.Inserm UMR 1027, Toulouse 2.Service d’Epidémiologie, CHU de Toulouse 3.Faculté de médecine, Université Toulouse III Paul Sabatier 4.Institut de Mathématiques de Toulouse et Université de Toulouse 5 ème conférence francophone d’Epidémiologie clinique, ADELF6 mai 2011
Introduction Analyse de la médiation : évaluer le rôle de facteurs intermédiaires M Méthode utilisée couramment : régression ajustée sur l’exposition X et le médiateur M le coefficient X permet d’estimer l’effet direct de X sur Y effet direct = effet résiduel de X sur Y quand le chemin passant par M est bloqué Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M
La méthode d’ajustement sur le médiateur M peut être biaisée – Robins & Greenland (1992), potential outcomes – Cole & Hernan (2002), graphes acycliques dirigés « collider stratification bias » D-séparation (Pearl, 2001) : ajuster sur une collision crée une association non causale entre les parents directs Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z M est le médiateur d’intérêt
La méthode de simple ajustement sur le médiateur M peut être biaisée – Robins & Greenland (1992), potential outcomes – Cole & Hernan (2002), graphes acycliques dirigés « collider stratification bias » D-séparation (Pearl, 2001) : ajuster sur une collision crée une association non causale entre les parents directs Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z M est le médiateur d’intérêt Effet direct estimé est biaisé Effet « direct » d’intérêt
Dans ce type de structure causale, des méthodes alternatives ont été proposées pour estimer sans biais l’effet direct : – Modèles structurels marginaux (VanderWeele, 2009) Inverse probability treatment weighting (IPTW) – Méthode séquentielle (Vansteelandt, 2009) Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z M est le médiateur d’intérêt
Hypothèse explorée : importance du biais observé avec la méthode d’ajustement sur M dépend de la force des effets causaux de Z M et de X M Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z
Hypothèse explorée : importance du biais observé avec la méthode d’ajustement sur M dépend de la force des effets causaux de Z M et de X M importance du biais ne dépend pas des autres effets causaux Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z
Structure causale étudiée : Objectif : Estimer l’effet direct contrôlé et comparer l’importance du biais dans chaque scénario entre la méthode d’ajustement sur M et trois méthodes alternatives Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z C jj ii hh gg dd bb ee aa cc ff Différents scénarios définis en faisant varier les effets causaux des arcs entre X, Z, M et Y
Méthodes : Exploration de 50 scénarios : 1050 échantillons simulés, de taille 1000 Variables C, X, Z, M et Y définies par : où C = X = Z = M = Y = 0 et Ci, Xi, Zi, Mi et Yi générés selon N(0,1) Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF
Méthodes : Exploration de 50 scénarios : 1050 échantillons simulés, de taille 1000 16 scénarios où a = 0 et b et e varient {0; 0,1 ; 0,3 ; 0,5} 16 scénarios où a = 0,3 et b et e varient {0;0,1;0,3;0,5} 9 scénarios où a = 0, b = e = 0,1 et c = f et d varient {0,1 ; 0,3 ; 0,5} 9 scénarios où a = 0,3, b = e = 0,1 et c = f et d varient {0,1 ; 0,3 ; 0,5} Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF aa bb ee aa dd cc ff
Méthodes d’estimation de l’effet direct contrôlé 1.Méthode d’ajustement sur M L’effet direct contrôlé de X sur Y pour une valeur fixée de M est estimé par 2.Analyse du chemin L’effet direct contrôlé est estimé par Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF (1) (2) XY M Z C dd bb ee aa cc ff
Méthodes d’estimation de l’effet direct contrôlé 3.Modèles structurels marginaux L’effet direct contrôlé est estimé par le coefficient dans la régression pondérée Poids pour chaque unité i : où Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z C dd bb ee aa cc ff
Méthodes d’estimation de l’effet direct contrôlé 4.Méthode séquentielle L’effet direct contrôlé est estimé en deux étapes : 1 ère étape : Estimation de l’effet causal de M sur Y 2 ème étape : soustraire l’effet du médiateur sur Y pour chaque unité : L’effet direct contrôlé est estimé par le coefficient de la régression Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z C dd bb ee aa cc ff
Intervalles de confiance à 95% des effets directs contrôlés estimés : bootstrap Performances des estimations – Biais dans un échantillon – Biais moyen par scénario – Erreur standard de l’estimation – Biais standardisé – Couverture : pourcentage d’intervalles de confiance à 95% qui contiennent la valeur théorique de l’effet direct contrôlé Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF
Introduction Méthodes Résultats Discussion Résultats Les effets estimés par méthode séquentielle étaient égaux aux effets estimés par analyse du chemin Quand a passait de 0 à 0,3, on observait : – Une légère augmentation du biais – Une couverture légèrement moins bonne – Mais les conclusions, restaient les mêmes Erreur standard avec modèles structurels marginaux plus élevée qu’avec la méthode séquentielle 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF aa
Résultats b et e varient parmi {0 ; 0,1 ; 0,3 ; 0,5} a = 0,3 ; c = d = f = 0,3 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF bb ee
Introduction Méthodes Résultats Discussion Résultats c = f et d varient parmi { 0,1 ; 0,3 ; 0,5} a = 0,3 ; e = f = 0,1 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF dd cc ff
Discussion 1) le biais observé avec la méthode d’ajustement sur M est fortement influencé par la force des effets de X M et Z M, et peu influencé par les autres effets causaux 2) les modèles structurels marginaux sont moins biaisés que la méthode d’ajustement sur M, mais moins efficace (ES ++) que la méthode séquentielle 3) Dans ce type de structure causale : préférer la méthode séquentielle ou d’analyse du chemin Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF
Discussion autre méthode alternative : G-computation (Robins) – package « g-formula », Rhian Daniel, mars 2011 – GFORMULA SAS MACRO, Sarah Taubman, mars 2011 la méthode d’ajustement sur M est également biaisée dans d’autres structures causales : – l’analyse du chemin ne peut pas être utilisée +++ – contrairement aux MSM, méthode séquentielle et G-computation Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF XY M Z U + Interaction possible entre X et M
Robins JM, Greenland S. Identifiability and exchangeability for direct and indirect effects. Epidemiology 1992; 3: Cole SR, Hernan MA. Fallibility in estimating direct effects. Int J Epidemiol 2002; 31: Pearl J. Direct and indirect effects. In Direct and indirect effects. Morgan Kaufmann: San Francisco, CA, Robins JM, Hernan MA, Brumback B. Marginal structural models and causal inference in epidemiology. Epidemiology 2000; 11: VanderWeele TJ. Marginal structural models for the estimation of direct and indirect effects. Epidemiology 2009; 20: Cole SR, Hernan MA. Constructing inverse probability weights for marginal structural models. Am J Epidemiol 2008; 168: Vansteelandt S. Estimating direct effects in cohort and case-control studies. Epidemiology 2009; 20: Kaufman JS, Maclehose RF, Kaufman S. A further critique of the analytic strategy of adjusting for covariates to identify biologic mediation. Epidemiol Perspect Innov 2004; 1: 4. Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF Merci de votre attention
Introduction Méthodes Résultats Discussion Résultats influence de la taille d’échantillon : N= 500 ; N=1000 ; N=3000 ; N= mai ème conférence francophone d’Epidémiologie clinique, ADELF biais moyen couverture bb ee b = e =0 b = e =0,1 b = e =0,3 b = e =0,5
Introduction Méthodes Résultats Discussion Résultats OR entre Z et M et X et M varient parmi {1,2 ; 1,5 ; 1,8 ; 2,0 ; 3,0} 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF bb ee
Introduction Méthodes Résultats Discussion Résultats b et e varient parmi {0 ; 0,1 ; 0,3 ; 0,5} a = 0,3 ; c = d = f = 0,3 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF bb ee
Introduction Méthodes Résultats Discussion Résultats c = f et d varient parmi { 0,1 ; 0,3 ; 0,5} a = 0,3 ; e = f = 0,1 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF dd cc ff
Discussion Ces méthodes alternatives décrites dans la littérature sur l’inférence causale en statistique Hypothèses (non vérifiables) – Consistance ou cohérence (consistency) : On peut définir un résultat contrefactuel Y x quelle que soit la valeur x – Absence de confusion résiduelle non mesurée entre X et Y ou entre M et Y – Positivité : l’exposition n’est pas attribuée de manière déterministe selon certaines valeurs des facteurs de confusion Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF
Discussion – Application : cohorte IHPAF Introduction Méthodes Résultats Discussion 6 mai ème conférence francophone d’Epidémiologie clinique, ADELF Age Sexe EtudePAS Comportements délétères -tabac, OH, - obésité CSP, famille, précarité