Evaluation de l’effet des traitements en situation observationnelle par utilisation des modèles structuraux marginaux Une application à l’évaluation de l’impact des antirétroviraux sur le devenir clinique des patients infectés par le VIH Emilie Lanoy INSERM U720; UPMC Univ Paris 06 GDR Statistique et Santé 14 novembre 2008 Université Paris V Descartes
Bibliographie sélective Robins. Marginal Structural Models and Causal Inference in Epidemiology Hernán. Marginal Structural Models to Estimate the Causal Effect of Zidovudine on the Survival of HIV-Positive Men Epidemiology 2000; 11:550-70 Hernán. A structural Approach to Selection Bias. Epidemiology 2004; 15:615-25 Sterne. Long-term effectiveness of potent antiretroviral therapy in preventing AIDS and death: a prospective cohort study Lancet 2005; 366:378-84 Hernán. Estimating causal effects from epidemiological data JECH 2006; 60:578-86 Robins and Hernán. Causal inference book. Causal Inference (Chapman & Hall/CRC, 2009) à paraître http://www.hsph.harvard.edu/causal/
Problématique (1) Exemple (VIH) : effet du traitement antirétroviral sur la survie ajusté sur le taux de CD4 Le taux de CD4 est dépendant du temps Le taux de CD4 est influencé par l’administration du traitement antirétroviral Le taux de CD4 influence la survie et la prescription de traitement antirétroviral (en épidémiologie, on parle alors de biais d’indication)
Problématique (2) Estimation de l’effet d’un facteur dépendant du temps (exposition, traitement), ajusté sur des covariables, quand une des covariables : est dépendante du temps prédit l’événement mais aussi les valeurs du facteur étudié (1) est influencée par les valeurs antérieures du facteur (2) Cette covariable est un facteur de confusion (confounder)
Problématique (3) Le facteur de confusion entraîne un biais de causalité* Association structurelle entre une exposition (ex: traitement) et un événement (le décès) qui ne découle pas de l’effet causal de l’exposition sur l’événement Exposition (ex: traitement) et événement (le décès) ont des causes communes (taux de CD4 ) Exposés (traités) et non exposés (non traités) ne sont pas interchangeables *biais d’indication Epidémiologie biais de causalité Statistique, Econométrie
Problématique (4) Représentation graphique : causal Directed Acyclic Graphs* On veut estimer l’effet du traitement sur la survenue de décès At : traitement antirétroviral reçu au temps t Lt : taux de lymphocytes CD4 au temps t, facteur de confusion° sur le chemin causal Y : événement : décès U : réel niveau d’immunosuppression A et L sont des covariables dépendantes du temps ° confounder *Judea Pearl, UCLA (1988,1995,2000)
Problématique (5) Comment bloquer le chemin causal pour mesurer l’effet de A sur Y? Design de l’étude Dans les essais thérapeutiques, on tire au sort l’attribution du traitement : L, le taux de CD4, facteur de confusion, n’est alors plus sur le chemin causal Analyse (si le biais de causalité n’a pu être prévenu, par exemple si utilisation de données observationnelles) Modèles structuraux marginaux pondérés sur la probabilité inverse de traitement
Principe (1) Blocage du chemin causal sur lequel se trouve le facteur de confusion L par création d’une pseudo-population dans laquelle, à chaque instant, la probabilité d’être traité n’est plus liée aux facteurs pronostiques mesurés Dans la pseudo-population Les facteurs de confusion sont supprimés* L’effet de l’exposition est le même que dans la population cible *NB : il s’agit uniquement des facteurs mesurés
Principe (2) Calcul pour chaque sujet à chaque temps du rapport de risque causal Pr[Ya=1=1]/Pr[Ya=0=1] en supposant l’interchangeabilité conditionnelle au sein de chaque niveau des facteurs de confusion L Introduction du contrefactuel : quel serait l’événement si le traitement était contraire à celui effectivement observé ? Pondération par l’inverse de probabilité de traitement en fonction de ses antécédents cliniques L Effet du traitement sur la survenue de l’événement mesuré par un modèle de Cox à risques proportionnels pondérés par l’inverse de probabilité de traitement
Hypothèses Prise en compte uniquement de ce qui est mesuré tirage au sort dans un essai qui contrôle ce qui est mesuré et ce qui ne l’est pas. Hypothèse de calcul des probabilités inverses de mise au traitement : recueil au cours du temps de toutes les variables décrivant les facteurs associés à la prescription du traitement (taux de lymphocytes CD4, charge virale, survenue d’événements cliniques) Condition de positivité : dans chaque niveau de L, il doit y avoir dans l’échantillon, des patients exposés et non exposés au traitement
Glossaire IPW : Inverse probability weighting , pondération par inverse de probabilité, méthode appropriée d’ajustement sur tous les facteurs de confusion mesurés avant la mise au traitement MSMs : Marginal Structural Models, nouvelle classe de modèles causaux utilisés pour estimer l’effet d’un facteur dépendant du temps en présence de facteurs de confusion (confunders) IPTW: inverse-probability-of-treatment- weighted estimator estimateur des MSM
Illustration Evaluer l’effet de l’AZT sur la survie en estimant les paramètres IPTW d’un modèle de Cox à structure marginale Modélisation et estimation des paramètres du modèle de Cox MSM Programmation logicielle (SAS) Hernán. Marginal Structural Models to Estimate the Causal Effect of Zidovudine on the Survival of HIV-Positive Men Epidemiology 2000; 11:550-70
Population sélectionnée 2 178 hommes VIH+ ayant eu un suivi dans la MACS entre mars 86 et oct 94 Patients non SIDA et naïfs d’ARV à leur 1ère visite éligible Suivi médian = 69 mois 1 296 patients ont reçu de l’AZT 750 décès
Cofacteurs étudiés Variable d’intérêt : administration d’AZT* Cofacteurs biologiques : âge+, taux de CD4+*, de CD8+*, de globules blancs+*, de globules rouges+* et de plaquettes+* Facteurs cliniques : présence oui/non d’un symptôme+* (parmi fièvre, candidose orale, diarrhée, perte de poids, leucoplasie chevelue, herpès, zona); survenue oui/non d’une affection classant SIDA* Mesurés en baseline+ et/ou au cours du temps*
Modèle de Cox classique (1) Modèle de Cox classique avec le traitement dépendant du temps, estimation du risque de décès proportionnel en t T(t/Ā(t),V ) = 0(t) exp(1A(t) + 2 V ) où T est le délai entre l’inclusion et le décès du sujet A(t) est l’exposition à l’AZT du sujet au temps t Ā(t) est l’antécédent d’exposition du sujet à l’AZT au temps t V est le vecteur des covariables en baseline
Modèle de Cox classique (2) 1 , obtenu par maximisation de la vraisemblance du Cox partiel, est un estimateur sans biais de 1 Mais, l’estimation de l’effet causal de l’AZT sur la survie est biaisée quand on introduit les facteurs de confusion notées L ^ ^
Hypothèses pour la démonstration Hypothèses pour la suite de la démonstration Dès qu’1 sujet est mis sous AZT, il reste sous AZT jusqu’à la fin du suivi Le pas de temps est mensuel : les covariables dépendantes du temps changent au plus une fois par mois
Ecriture du modèle de Cox causal (1) Introduction des facteurs de confusion dépendants du temps notés L dans un modèle de Cox classique Biais de causalité Ajustement du modèle par pondération par la probabilité de traitement inverse (IPW : Inverse probability weighting) (cf. Robins)
Ecriture du modèle de Cox causal (2) Notion de contrefactuel «conditionnel contraire aux faits qui sont observés : nous avons observé quelqu’un à C1 mais il aurait pu être à C0» (Cox) Soient T délai observé jusqu’au décès, le traitement observé et les antécédents des autres covariables Considérons le paramètre inconnu 0 dans le délai U à l’issue duquel le sujet serait décédé si, éventuellement contrairement aux faits observés, le traitement n’avait pas été reçu. 0 peut être contrefactuel (Robins) On souhaite reconstituer ce qui se serait passé si le patient n’avait pas eu de traitement (hypothèse qui peut être contraire à l’observation)
Ecriture du modèle de Cox causal (3) Formalisation des effets contrefactuels : Pour chaque antécédent d’exposition à l’AZT, ā = a(t),t ≥ 0, soit Tā (V.A.) le délai jusqu’au décès : ā, antécédent d’AZT depuis le début du suivi (peut être contrefactuel de l’antécédent observé) Ta n’est observé que pour les ā qui correspondent aux antécédents d’AZT observés (Tā =T ) Risque proportionnel du modèle de Cox causal MSM Tā(t,V ) = 0(t) exp(1a(t) + 2 V )
Ecriture du modèle de Cox causal (4) où Tā(t,V), risque de décès à t, parmi les sujets avec les covariables V en baseline, issus d’une population source contrefactuelle où tous les sujets ont un antécédent ā d’AZT jusque t où 1 et 2, inconnus et 0 risque de décès en baseline Estimateur de 1 pondéré par la probabilité inverse de traitement (IPTW: inverse-probability-of-treatment-weighted estimator) Tā(t,V ) = 0(t) exp(1a(t) + 2 V )
Calculs des poids stabilisés (1) Etape 1 : calcul des poids stabilisés sous l’hypothèse que tous les décès sont observés (pas de censure à droite) int(t) , le plus grand entier inférieur ou égale à t k , entier indiquant le nombre de mois complets depuis le début du suivi Par définition, Ā(-1)=0 Chaque facteur du dénominateur est la probabilité que le sujet reçoive son traitement observé au mois k sachant ses antécédents de traitement et de facteurs pronostiques Chaque facteur du numérateur est la probabilité que le sujet reçoive son traitement observé sachant ses antécédents thérapeutiques et ses covariables en baseline (mais pas ses facteurs pronostiques dépendant du temps, V L(0) ) swi(t) = int(t) k = 0 pr (A(k) = ai(k)/A(k-1) = ai(k-1) , V = vi ) pr (A(k) = ai(k)/A(k-1) = ai(k-1) , L(k) = li (k) ) où
Calculs des poids stabilisés (2) Etape 2: Introduction de la censure à droite Soit C indicateur de censure à droite (C(t)=1 si censure, 0 sinon), pour estimer 1, le modèle de Cox pondéré est ajusté par une nouvelle pondération Où A(-1)=0 et C(-1)=0 par définition swi(t) = t k = 0 pr [C(k)=0/C(k-1)=0, A(k-1)=ai(k-1) , V=vi ) pr [C(k)=0/C(k-1)=0, A(k-1)=ai(k-1) , L(k-1)=li(k-1) )
Calculs des poids stabilisés (3) Etape 3: Produit des poids stabilisés swi(t) x swi(t) a pour dénominateur la probabilité du sujet i d’avoir eu jusque en t ces antécédents d’AZT et de censure estimateur du paramètre causal 1 pondéré par le produit swi(t) x swi(t) est consistant sous l’hypothèse qu’il permet aussi d’ajuster en fonction des biais de sélection dus à la perte de vue
Propriétés du modèle structural marginal (1) La pondération permet d’obtenir une estimation IPTW de la vraisemblance partielle. Si les facteurs dépendants du temps sont tous mesurés et inclus dans L(t) alors la pondération crée, à un temps t pour un ensemble de facteurs de risque, une pseudo-population où : L(t) ne prédit plus la mise sous AZT en t L’association causale entre AZT et mortalité est la même que dans la population cible étudiée 1, estimateur IPTW du paramètre 1 du modèle de Cox classique, convergera vers 1 qui peut être interprété comme l’effet causal de l’AZT sur la mortalité (sur une échelle log rate ratio) ^
Propriétés du modèle structural marginal (2) Pour chaque V , le modèle est structuré (causal) pour la distribution marginale des variables contrefactuelles Tā : C’est un modèle MSM (Marginal Structural Model) où 1, causal log rate ratio pour l’AZT exp(1), interprétation causale du ratio du taux de décès en t des patients exposés à l’AZT comparés aux non exposés estimateur IPTW de 1 consistant sous l’hypothèse que L(t) contienne toutes les covariables associées à la mise sous traitement Tā(t,V ) = 0(t) exp(1a(t) + 2 V )
Estimation de swi(t) x swi(t) par régression logistique pondérée poolée (1) Délai de mise sous AZT considéré comme un délai de survie (où décès = mise sous AZT) Modélisation de la probabilité de mise sous AZT par un modèle logistique poolé (1 observation = 1 personne-mois) avec un intercept dépendant du temps ex : modèle logit pr[A(k)=0/Ā(k-1)=0,L(k)] = 0(k)+1L(k)+2V(k) sujets vivants et non censurés au mois k sujets ayant déjà commencé l’AZT au mois k pi(k)=expit (0(k)+1L(k)+2V(k)) : probabilité estimée du sujet i de ne pas être mis sous AZT au mois k sachant qu’il n’est pas sous AZT au mois k-1 ajusté sur ^
Estimation de swi(t) x swi(t) par régression logistique pondérée poolée (2) Estimation du produit dénominateur de swi(t) pi(u) si le sujet n’est pas sous AZT au mois k [1- pi(t)] pi(u) si le sujet est sous AZT depuis t k Remarques Même démarche pour estimer le numérateur (sans L(k)) L’estimateur du dénominateur devant être consistant, on ne peut avoir d’estimateur individualisé pour chaque mois k de l’intercept 0(k) et il faut «emprunter la puissance» des sujets mis sous AZT les autres mois : En supposant 0(k) constant sur une fenêtre de 3 mois En lissant k (courbes de régression, courbes de lissage,…) pour swi(t), même démarche (censure prise en compte) k u=0 ^ ^ t-1 u=0
Quelques remarques sur la programmation logicielle Les programmes logiciels standards ne permettant pas une pondération dépendante du temps, les estimateurs IPTW ne peuvent être calculés directement, il faut donc : Programmer les régressions logistiques poolées pondérées avec une observation par personne-mois Ne pas utiliser les pondérations sur la modélisation de Cox standard du logiciel (proc phreg) car les corrélations intra-sujets invalident les résultats Tenir compte du fait qu’il y a des mesures répétées par sujet en utilisant les programmes GEE* (proc genmod) qui fournissent des estimateurs robustes de la variance pour les données corrélées et donc des intervalles de confiance à 95% correctes pour les paramètres *Generalized Estimating Equations
Effet causal de l’AZT : données de la MACS (1) Risque relatif de décès associé à l’AZT dans le modèle de Cox univarié standard : RRAZT = 3,6 IC95%(RRAZT) = [3,0 ; 4,3] Risque relatif de décès associé à l’AZT dans le modèle de Cox ajusté sur V, vecteur des covariables en baseline : RRAZT = 2,3 IC95%(RRAZT) = [1,9 ; 2,8]
Effet causal de l’AZT : données de la MACS (2) Calcul des poids stabilisés swi(t) x swi(t) pour chaque patient-mois Préparation d’un fichier trié de données MAIN avec un enregistrement par patient et par mois Calcul des swi(t) x swi(t) comme moyennes de 4 régressions logistiques poolées : 2 où la variable réponse binaire «mis sous AZT» donne la probabilité du patient d’avoir ses propres antécédents d’AZT observés jusqu’au mois t étant donnés : V covariables en baseline (/*model 1*/) V , et L covariables dépendantes du temps (/*model 2*/) 2 où la variable réponse binaire indique la censure en ajoutant la variable dépendante du temps binaire indiquant si le patient a été mis sous AZT à t-1 V covariables en baseline (/*model 3*/) V , et L covariables dépendantes du temps (/*model 4*/)
Effet causal de l’AZT : données de la MACS (3) Noms des variables des modèles dans SAS® : en baseline AGE_0 (âge) YEAR_01 YEAR_02 YEAR_03 (année d’inclusion) CD4_01 CD4_02 (CD4) CD8_01 CD8_02 (CD8) WBC_01 WBC_02 (globules blancs) RBC_01 RBC_02 (globules rouges) PLAT_01 PLAT_02 (plaquettes) SYMPT_0 (symptômes) MONTH (mois) MONTH1-MONTH3 (fonctions polynômiales spéficifiques de MONTH calculées avec une macro RCSPLINE : lissage permettant d’estimer l’intercept dépendant du temps) Dépendant du temps CD4_1 CD4_2 CD8_1 CD8_2 WBC_1 WBC_2 RBC_1 RBC_2 PLAT_1 PLAT_2 SYMPT AIDS (SIDA) A mise sous AZT et C censure (mois de mise sous AZT noté ZDV_M)
Effet causal de l’AZT : données de la MACS (4) /* MODEL 1 */ PROC LOGISTIC data=MAIN; where MONTH<=ZDV_M or ZDV__M=.; model A=AGE_0 YEAR_01 YEAR_02 YEAR_03 CD4_01 CD4_02 CD8_01 CD8_02 WBC_01 WBC_02 RBC_01 RBC_02 PLAT_01 PLAT_02 SYMPT_0 MONTH MONTH1-MONTH3; output out=model1 p=pzdv_0; run; /* MODEL 2 */ PROC LOGISTIC data=MAIN; where MONTH<=ZDV_M or ZDV_M=.; model A=AGE_0 YEAR_01 YEAR_02 YEAR_03 CD4_01 CD4_02 CD8_01 CD8_02 WBC_01 WBC_02 RBC_01 RBC_02 PLATE_01 PLATE_02 SYMPT_0 CD4_1 CD4_2 CD8_1 CD8_2 WBC_1 WBC_2 RBC_1 RBC_2 PLAT_1 PLAT_2 SYMPT AIDS MONTH MONTH1-MONTH3; output out=model2 p=pzdv_w; run; /* MODEL 3 */ PROC LOGISTIC data=MAIN; model C=A AGE_0 YEAR_01 YEAR_02 YEAR_03 CD4_01 CD4_02 CD8_01 CD8_02 WBC_01 WBC_02 RBC_01 RBC_02 PLATE_01 PLATE_02 SYMPT_0 MONTH MONTH1-MONTH3; output out=model3 p=punc_0; run; /* MODEL 4 */ PROC LOGISTIC data=MAIN; model C=A AGE_0 YEAR_01 YEAR_02 YEAR_03 CD4_01 CD4_02 CD8_01 CD8_02 WBC_01 WBC_02 RBC_01 RBC_02 PLATE_01 PLATE_02 SYMPT_0 CD4_1 CD4_2 CD8_1 CD8_2 WBC_1 WBC_2 RBC_1 RBC_2 PLAT_1 PLAT_2 SYMPT AIDS MONTH MONTH1-MONTH3; output out=model4 p=punc_w; run;
Effet causal de l’AZT : données de la MACS (5) 4 fichiers de données créés par patient-mois avec les variables d’origine et celle prédite par le modèle (1 : pzdv_0,2: pzdv_w, 3 : punc_0 et 4 : punc_w) Dans une étape DATA, jointure des 4 fichiers dans le fichier MAIN_W et calcul, en multipliant pour chaque patient, les valeurs prédites mois après mois, : du numérateur k2_0 et du dénominateur k2_w de swi(t) (à partir de punc_0 et punc_w des modèles 3 et 4) du numérateur k1_0 et du dénominateur k1_w de swi(t) (à partir pzdv_0 et pzdv_w des modèles 1 et 2) : jusqu’au mois de mise sous AZT inclus en multipliant par [1-pzdv_w] le mois de mise sous AZT Obtention du poids stabilisé swi(t) x swi(t) : stabw = k1_0 x k2_0 k1_w x k2_w
Effet causal de l’AZT : données de la MACS (6) DATA MAIN_W; merge model1 model2 model3 model4;by ID MONTH; /* variables ending with 0 refer to the numerator of the weights variables ending with w refer to the denominator of the weights */ /* reset the variables for a new patient */ if first.id then do;k1_0=1; k2_0=1; k1_w=1; k2_w=1;end; retain k1_0 k2_0 k1_w k2_w; /* Inverse probability of censoring weights */ k2_0=k2_0*punc_0;k2_w=k2_w*punc_w; /* Inverse probability of treatment weights */ /* patients not on zidovudine */ if zdv_m>day or zdv_m =. then do; k1_0=k1_0*pzdv_0;k1_w=k1_w*pzdv_w;end; /* patients that start zidovudine this month */ else if zdv_m=day then do; k1_0=k1_0*(1-pzdv_0);k1_w=k1_w*(1-pzdv_w);end; /* patients that have already started zidovudine */ else do;k1_0=k1_0;k1_w=k1_w;end; stabw=(k1_0*k2_0)/(k1_w*k2_w); /*Stabilized weights */ run;
Effet causal de l’AZT : données de la MACS (7) Estimation des paramètres du modèle de Cox MSM PROC GENMOD où la variable dichotomique réponse D indique si le patient est décédé ou non au cours du mois L’option repeated permet d’obtenir des estimations robustes des erreurs standards Spécification de la variable ID identifiant le patient subject = ID et du type de matrice de corrélations indépendante type = ind Pondération par stabw par l’instruction scwgt=stabw; proc genmod data=MAIN_W; class id; model D=A AGE_0 YEAR_01 YEAR_02 YEAR_03 CD4_01 CD4_02 CD8_01 CD8_02 WBC_01 WBC_02 RBC_01 RBC_02 PLAT_01 PLAT_02 SYMPT_0 MONTH MONTH1-MONTH3/link=logit dist=bin; scwgt stabw;repeated subject=ID/type=ind; run;
Le risque relatif de décès associé à l’AZT estimé par le modèle de Cox MSM est : RRAZT = 0,7 IC95%(RRAZT) = [0,6 ; 1,0]
Perspectives (1) Evaluation de l’impact des antirétroviraux sur la survenue d’événements neurologiques classant SIDA Problématique pénétration des antirétroviraux dans le système nerveux central diminution de la réplication virale dans le liquide céphalo-rachidien Est-ce que les traitements antirétroviraux de meilleure pénétration dans le système nerveux central permettent de limiter le risque de survenue d’un événement neurologique classant SIDA ? Letendre et al. Arch Neurol 2008
Perspectives (2) Objectif : estimer l’influence de la pénétration des antirétroviraux dans le système nerveux central sur la survenue d’un événement neurologique classant SIDA Population d’étude : données issues du projet HIV Causal Collaboration de cohortes européennes et nord-américaines (participation de ANRS CO4-FHDH) 119 929 patients inclus Grandes variétés de thérapeutiques administrées (différents systèmes de soins)