PLACE DU SCORE DE PROPENSION EN EPIDEMIOLOGIE CLINIQUE Christophe Clec’h Présentation IAB, 21 Décembre 2007
PLAN Introduction Théorie du score de propension (SP) Construction Utilisation Conclusion
Comparaisons directes impossibles INTRODUCTION-I- Etudes observationnelles fréquentes But: estimer (suggérer) relation causale entre TTT ou exposition et devenir Problème: non randomisation Différences de distribution des caractéristiques de base (covariables-facteurs de confusion) responsables d’une estimation biaisée de l’effet du TTT ou exposition Comparaisons directes impossibles
Comparaisons directes impossibles INTRODUCTION-II- Appariement, stratification: techniques courantes mais limitées Quand nombre élevé de covariables, exponentielle du nombre de strates (2k strates pour k covariables dichotomiques) Strates contenant que sujets TTT ou expo Comparaisons directes impossibles
INTRODUCTION-III- Ajustement sur facteurs de confusion: autre technique mais 2 inconvénients: Chevauchement insuffisant entre les groupes pour une covariable donnée visible immédiatement avec stratification mais « transparente » dans un modèle donc dangereux (biais dans l’estimation des paramètres) Modèles supposent une forme particulière de la relation entre covariables et devenir (linéarité, loglinéarité) pas toujours effective ni vérifiée
INTRODUCTION-IV- Succès des modèles viennent de leur apparente facilité d’utilisation avec les logiciels de stat et des difficultés à apparier ou stratifier sur un grand nombre de covariables Mais risque d’interprétation erronée
THEORIE DU SP-I- Idée de base Remplacement de toutes les covariables par une variable unique (SP) qui est une fonction de ces covariables (condensation de l’information) Utilisation comme une covariable de confusion unique Rosenbaum P, Rubin DB; Biometrika 1983
THEORIE DU SP-II- SP dérive de la prédiction de l’assignement à un groupe de TTT ou d’exposition Chaque sujet a X covariables et un indicateur de TTT Z, Z=1 si TTT et Z=0 si contrôle e(X)=SP, probabilité pour un sujet i d’être dans groupe TTT connaissant les valeurs des X e(X)=prob(Z=1/X) Randomisation: e(X)=1/2 (distribution égale des X) Études observationnelles (randomisation=0): e(X)≠1/2 (prédiction du TTT fonction des X)
THEORIE DU SP-III- 2 sujets: sujet 1 avec Z=1 et sujet 2 avec Z=0, même SP alors même proba d’appartenir au groupe TTT ou contrôle « Pièce » 2 groupes de sujets: groupe 1 avec Z=1 et groupe 2 avec Z=0, n strates de SP alors distribution identique du SP dans chaque strate entre sujets Z=1 et Z=0 Essai pseudo randomisé avec répartition identique des covariables dans chaque strate
THEORIE DU SP-IV- Comparaison directe possible entre les strates Preuves théoriques et pratiques Rosenbaum P, Rubin DB; Biometrika 1983 Rubin DB, Thomas N; Biometrika 1992 Rubin DB, Thomas N; Biometrics 1996
DEFINITION Probabilité conditionnelle d’appartenir à un groupe de TTT connaissant les X Score d’équilibration permettant d’avoir une distribution égale des X entre les groupes (strates) et donc d’estimer avec le minimum de biais l’effet d’un traitement dans une étude observationnelle
CONSTRUCTION DU SP-I- Modèle de régression logistique (analyse discriminante) Variable dépendante: TTT ou exposition Variables explicatives: caractéristiques de base Guidelines pour construction et évaluation des modèles de régression logistique Bagley SC et al. J Clin Epidemiol 2001 Applicabilité au SP? (but différent)
CONSTRUCTION DU SP-II- Quelles variables? Variables liées au devenir ++++ Rubin DB, Thomas W; Biometrics 1996 Variables liées au devenir et à l’exposition/TTT (« true counfounders ») Variables liées à l’exposition uniquement
CONSTRUCTION DU SP-III- Quelles variables? Variables liées au devenir: diminution du biais et de la variance de l’estimation de l’effet exposition/TTT Variables liées uniquement à l’exposition/TTT: augmentation du biais et de la variance de l’estimation de l’effet exposition/TTT Brookhart MA et al.; Am J Epidemiol 2006
CONSTRUCTION DU SP-IV- Quelles variables? Variables liées uniquement à l’exposition/TTT modèle trop discriminant Brookhart MA et al.; Am J Epidemiol 2006 Et donc problèmes: - pour la stratification (peu de sujets non traités ou non exposés dans les strates élevées de SP et inversement peu de sujets traités ou exposés dans les strates basses d’où comparaisons impossibles) - pour l’appariement (perte d’un grand nombre de sujets lié au faible nombre d’appariements possibles) Efficacité moindre du SP Austin PC et al.; Stat med 2007
CONSTRUCTION DU SP-V- Quelles variables? SP estimé supérieur au SP « vrai » Robins JM et al; Biometrics 1992 Rosenbaum PR; J Am Stat Assoc 1987 But différent: équilibrer la distribution des FDC et non prédire précisément l’exposition/TTT
CONSTRUCTION DU SP-VI- Sélection des variables Plusieurs méthodes: Modèle non parcimonieux A priori (choix basé sur études antérieures) Avis d’experts Variables maximisant GOF du modèle Différence en analyse univariée Sélection ascendante, descendante ou pas à pas Weitzen S et al. Pharmacoepidemiol Drug Saf 2004
CONSTRUCTION DU SP-VII- Sélection des variables Meilleure méthode? Analyse univariée, stepwise non recommandées: risque de sélection de variables liées uniquement à l’exposition/TTT Greenland S. Am J Public Health 1989 GOF: trop discriminant, de plus ne permet pas de détecter omission de covariables importantes (risque de confusion résiduelle dans l’estimation de l’effet du traitement non écarté) Weitzen S et al. Pharmacoepidemiol Drug Saf 2005
CONSTRUCTION DU SP-VIII- Sélection des variables Meilleure méthode? Modèle non parcimonieux avec toutes les variables liées au devenir: risque d’estimation biaisée si SP construit avec trop peu de variables Seeger JD et al.; Med Care 2007 Avis d’expert (Delphi)
CONSTRUCTION DU SP-IX- Validation Vérification de l’équilibre de la distribution des covariables entre les groupes ( = but du SP, préalable indispensable à toute analyse) Soit par appariement soit par stratification
CONSTRUCTION DU SP-X- Validation Si différences importantes de distribution des covariables, reformuler le modèle: Carré des variables (variance élevée) Interaction ( corrélation entre 2 covariables importantes différente dans les 2 groupes) Parfois chevauchement trop faible, pas d’équilibration possible (échec)
Utilisation du SP-I- Construction du SP = étape intermédiaire Ensuite Appariement Stratification, en 5 classes, élimine 90% du biais D’agostino RB. Stat Med 1998 Ajustement: SP introduit dans le modèle soit comme variable quantitative soit comme variable qualitative à 4 classes (5-classe de référence); attention à collinéarité (pas de variables comprises dans le SP) Mixte: appariement sur SP puis ajustement sur FDC
Utilisation du SP-II- Appariement > stratification: moins de biais et de variance dans l’estimation de l’effet de l’exposition/TTT Austin PC; Stat Med 2007 SP « reverse »: utilisation a posteriori dans les essais randomisés où les groupes sont différents pour rééquilibrer et réévaluer l’effet de l’exposition/TTT Berger WV; Stat Med 2005
INTERETS Synthèse de l’information contenue dans les covariables en un score unique Equilibre de la distribution des covariables entre les groupes: estimation non biaisée (ou biais minime) de l’effet du TTT (situation proche de la randomisation) Facilitation à la fois de la stratification et de l’appariement
LIMITES-I- Pas d’équilibration pour les covariables non observées (≠ randomisation; pour les covariables observées, SP supérieur à randomisation) GOF élevé n’élimine pas le risque de biais d’interprétation (n’élimine pas formellement la possibilité d’omission d’une covariable majeure de confusion) Analyse de sensibilité Techniques de simulation Rosenbaum PR, Rubin DB. J R Stat Soc 1983 Connors AF et al. JAMA 1996 Construction et comparaison de plusieurs modèles Confrontation aux données de la littérature
LIMITES-II- Peu efficace sur les petites cohortes: risque de déséquilibre résiduel dans la distribution des covariables (idem randomisation) Biais inhérents au manque de maîtrise de la technique
UTILISATION DU SP DANS LA LITTÉRATURE-I- Sur 47 études: Méthode de choix des covariables explicitée dans 23 cas (49%) dont 11 (48%) inappropriée (univariée, stepwise) Aucune information sur l’équilibre de la distribution des covariables dans 22 cas (47%) Collinéarité jamais explorée Information sur la forme de la relation entre covariables continues et devenir dans un seul cas Weitzen S et al. Pharmacoepidemiol Drug Saf 2004
UTILISATION DU SP DANS LA LITTÉRATURE-II- Sur 60 études: Pas d’information sur la construction du SP ni sur l’appariement dans 31 cas (50%) Aucune information sur l’équilibre de la distribution des covariables dans 11 cas (18%) Utilisation explicite de tests statistiques inappropriés dans 39 cas (65%) Austin PC J Thorac Cardiovasc Surg 2007
CONCLUSION Technique séduisante (équivalent de randomisation pour les covariables observées) Efficace Mal utilisée souvent Connaissance de la théorie, des avantages et des limites de la technique nécessaire à sa bonne utilisation
Je vous remercie de votre attention