1 Utilisation des scores de propension dans les régressions logistiques : comparaison de 5 méthodes Adrien Français IAB - INSERM Équipe 11 3 novembre 2008.

1 Utilisation des scores de propension dans les régressions logistiques : comparaison de 5 méthodes Adrien Français IAB - INSERM Équipe 11 3 novembre 2008

2 Article sélectionné Results of Multivariable Logistic Regression, Propensity Matching, Propensity Adjustment, and Propensity- based Weighting under Conditions of Nonuniform Effect Tobias Kurth, Alexander M. Walker, Robert J. Glynn, K. Arnold Chan, J. Michael Gaziano, Klaus Berger and James M. Robins Harvard (Boston) Paru dans American Journal of Epidemiology en 2006;163:262–270

3 Introduction On ne peut pas toujours travailler avec des données provenant d’un essai randomisé. Efficacité réelle d’un traitement sur un évènement (pneumonie, mort, asthme) dans une étude observationnelle (non randomisée) ? Événement (E) <= Traitement (Z) Nombreux Facteurs confondants (X)

4 Introduction Technique la plus utilisée pour une variable dichotomique :  Régression logistique avec comme facteurs Le traitement Et une sélection de covariables en ajustement Score de propension (Propensity score) Probabilité qu’un individu reçoive un traitement à partir de plusieurs covariables Premiers papiers en 1983 par Rosenbaum  Rosenbaum P, Rubin DB; Biometrika 1983

5 Objectif Comparer différentes méthodes d’utilisation du score de propension pour  Mesurer l’impact du t-PA (tissue plasmogen activator)  Sur la mortalité hospitalière  Chez les patients d’AVC ischémique Résultats divergent selon le type d’étude :  Observationnelles traitement augmente le risque de décès  Randomisées pas de lien établi

6 Base de travail Base allemande  Registre des AVC en Westphalie  42 hôpitaux  Variables disponibles Caractéristiques socio-démographiques, FDR d’AVC dans la littérature, comorbidités, type d’AVC, sévérité, détails sur le traitement…  Étude : 6269 patients avec un AVC ischémique

7 Flowchart 6269 patients avec un AVC ischémique 212 avec t-PA6057 sans t-PA 16% de décès hospitalier 5.4% de décès hospitalier

8 Score de propension Probabilité qu’un individu soit traité basé sur les variables antérieures au traitement  Probabilité conditionnelle d’être traité sachant des covariables  Avantage : on crée une variable à une dimension qui résume X covariables multidimensionnelles  e(X) = P(Z=1/X)

9 Création du score Régression logistique On inclut de nombreux facteurs potentiels  Pas de précision sur la sélection des variables Toutes les variables proposées? Sélection automatique? AIC ? Précautions à prendre  Si on exclut des prédicteurs clés Confusion résiduelle importante  Si on inclut trop de variables et d’interactions Estimation effet traitement biaisé (Harrell)

10 Création du score AUC du modèle 0.94 Propension moyenne  0.252 (0.193) T+  0.026 (0.070) T-

11 Effet du SP sur la mortalité par strate Trop peu d’effectif pour certaines classes Pourcentages délirants et conclusions quelque peu biaisées OR entre 0.25 à 25.11, p=0.008 à 4df

12 5 Méthodes pour contrôler les FC RL multi variée ajustée (de base) Avec le score de propension (SP)  RL conditionnelle après matching sur le SP  RL avec ajustement sur le SP  2 régressions ajustées pondérées IPTW : probabilité inverse SMR : ratio de mortalité standardisé

13 RL multi variée ajustée E = αZ + βX E : Décès hospitalier Z : traitement t-PA X : l’ensemble des covariables à disposition Pourquoi celles-ci et pas d’autres, on ne sait pas!

14 RL conditionnelle après matching sur le SP Matching entre individus  Avec traitement t-PA  Sans traitement t-PA Selon le SP à plus ou moins 5%  Le plus communément utilisé  Équilibres raisonnables sur les covariables incluses  Limite le nombre d’individus avec t-PA non matchés  Test à ± 10% mais différences non ‘relevant’ Un pour un  Pourquoi pas du 1 pour n ?  Pourquoi pas du n pour m (avec des déciles de SP) ?

15 RL conditionnelle après matching sur le SP (2) Quelle procédure SAS?  Non précisé 212 avec traitement  203 paires  9 non matchés (qui sont-ils?, pourquoi?) Propension moyenne  0.233 (0.174) T+  0.220 (0.177) T- Les tests réalisés ont-ils été faits en régression logistique conditionnelle ? Pas précisé donc pas sûr!

16 RL avec ajustement sur le SP E = αZ + βe(X) E : Décès hospitalier Z : traitement t-PA e(X) : score de propension  En brut de pommes  En décile

17 Méthode pondérée sur la probabilité inverse IPTW : Inverse Probability of Treatment Weighting  Rubin (2001) On assigne un poids individuel à toutes les observations :  1 / e(X) pour les traités  1 / (1-e(X))pour les non traités  Ce sont les patients avec SP« extrêmes » qui ont un poids important  On obtient ps_weight Proc GENMOD  Fonction de lien logit  Erreurs standards robustes (‘sandwich’)  Option weight ps_weight  On ajoute quand même les FDR de traitement dans le modèle  Bootstrap de taille 10000 pour les IC Mesure de l’effet standardisé avec la population globale comme groupe d’étude

18 Méthode pondérée sur le SMR SMR : Standard Mortality Ratio On assigne un poids individuel à toutes les observations :  1 pour les traités  e(X) / (1-e(X))pour les non traités Élevé (>1) quand le SP est > 0.5 Bas (<1) quand le SP est <0.5 Effet standardisé : groupe exposé comme référence SAS : même démarche Mesure de l’effet standardisé en considérant que le groupe des individus traités est la population standard

19 Résultats des différentes méthodes Sans ajustement, l’effet du traitement est surestimé Résultats très différents selon la méthode

20 Les patients avec un SP < 5% Poids énorme pour ces quelques patients (outliers), d’où l’OR à 10.77 pour IPTW Les patients avec un SP < 5% sont supprimés de l’étude

21 Même chose mais en enlevant les SP<5% Résultats beaucoup plus proches les uns des autres Les patients avec un SP<5% ‘faussaient’ les résultats On perd tout de même 84% de l’effectif!!! Toutes les méthodes donnent un effet non significatif

22 Principales conclusions Beaucoup de variabilité dans les résultats  Méta analyse : RR=1.16 [0.95 ; 1.43]  L’estimation de l’effet dépend de l’inclusion du SP dans le modèle Conclut que aucune des 5 méthodes n’est forcément la meilleure (ne se mouille pas trop!) SMR pondéré semblable au SP matché  Mais SMR utilise toutes les données  Plus de puissance, pas de perte d’individus traités  Résultats les plus proches des essais cliniques Ne garder que les patients avec un SP >5%  Quelque peu arbitraire, légitimité pas vraiment justifiée  Choix arrangeant pour obtenir des résultats comme dans la littérature?  Beaucoup de perte de puissance  Ils ont esquivé dans la discussion le problème de la perte d’effectif monstrueuse Après avoir tenu compte des facteurs confondants  Le t-PA n’a pas d’effet significatif sur le décès

23 Principales conclusions (2) RL ajusté à la fois sur le SP et des variables d’ajustement change l’OR  Crée sans doute des biais  Redondance de plusieurs variables Score de propension permet de résumer l’info en une seule variable  Moins de degrés de liberté utilisé  Se rapproche de la randomisation  Permet de voir la variation du décès selon la classe de SP (impossible avec plusieurs cofacteurs) Attention aux méthodes pondérées  Pose des problèmes quand les poids sont très importants sur un nombre limité d’individus  SP <5% et traités : du à des facteurs confondants non mesurés La conclusion de l’étude dépend de l’inclusion des patients avec un faible SP  Les 2 tableaux de résultats peuvent convenir  Tout dépend de la question qu’on se pose

24 Principales conclusions (3) Quelles variables inclure dans le SP : liées au devenir ou à l’exposition?  Papier parle plus de l’utilisation du SP et non de la sélection des variables  Ils n’ont pas tenu compte des FDR de décès !  SP modélisé uniquement sur les FDR de t-PA ! On a 200 cas  20 variables environ incluses pour le SP Beaucoup tout de même! Calibration du modèle de SP non précisé!

25 Merci de votre attention J’espère que vous avez tout compris ! C’était trop bien… …Mais j’ai rien compris!

1 Utilisation des scores de propension dans les régressions logistiques : comparaison de 5 méthodes Adrien Français IAB - INSERM Équipe 11 3 novembre 2008.

Présentations similaires

Présentation au sujet: "1 Utilisation des scores de propension dans les régressions logistiques : comparaison de 5 méthodes Adrien Français IAB - INSERM Équipe 11 3 novembre 2008."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

1 Utilisation des scores de propension dans les régressions logistiques : comparaison de 5 méthodes Adrien Français IAB - INSERM Équipe 11 3 novembre 2008.

Présentations similaires

Présentation au sujet: "1 Utilisation des scores de propension dans les régressions logistiques : comparaison de 5 méthodes Adrien Français IAB - INSERM Équipe 11 3 novembre 2008."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back