PLACE DU SCORE DE PROPENSION EN EPIDEMIOLOGIE CLINIQUE Christophe Clec’h Présentation IAB, 21 Décembre 2007 Présentation IAB, 21 Décembre 2007.

Slides:



Advertisements
Présentations similaires
Le score de propension (ou méthode de la probabilité prédite)
Advertisements

Dr DEVILLE Emmanuelle J D V 12/07/2006
PLACE DU SCORE DE PROPENSION EN EPIDEMIOLOGIE CLINIQUE
Journées du GDR "Statistique et Santé" 13 et 14 novembre 2008
13/12/07JRJC décembre 20071/14 Étude de la structure du noyau à halo Li et du sous-système non lié Li (à l’aide de la cible active MAYA)
Auteur : Patrice LEPISSIER Les probabilités  Notions de base Notions de base  Variable aléatoire Variable aléatoire  La loi Normale La loi Normale.
Comparaison des méthodes de calcul de quartiles On considère la série statistique ci-dessous : Effectif total : 12.
LES DIFFICULTÉS DES INTERNES À DIRE « NON » À LEURS PATIENTS ÉTUDE QUALITATIVE AUPRÈS DES INTERNES DE MÉDECINE GÉNÉRALE DE PARIS VII Thèse pour le diplôme.
Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
PERFORMANCES D’TEST DE DEPISTAGE Dr S.AMAROUCHE Maître assistante Epidémiologie Université 3 Constantine SEMEP CHU Constantine.
La résolution de problèmes ouverts au cycle 2 et cycle 3 « Mettre les élèves en situation d’essayer, conjecturer, tester, prouver. » (IREM de Lyon)
1. Le modèle IS - LM  Point de départ : article de J. Hicks « Mister Keynes and the classics » (Econometrica – avril 1937)  Interrogation sur la pertinence.
Suites ordonnées ou mettre de l’ordre
Corrélation et régression linéaire simple
Etude des performances d’un nouveau dispositif de biologie délocalisée pour la mesure du taux de fibrinogène MEMOIRE POUR L'OBTENTION DU DIPLOME D'ETUDES.
Chapitre 1 Généralités sur les données
Analyse, Classification,Indexation des Données ACID
Statistiques descriptives univariées
Les distributions en classes
Comparaison de deux pourcentages.
Cours d’Econométrie de la Finance (STA202 – IV 4-5)
pour la réanimation du choc septique, étude pilote.
Chapitre 1 Généralités sur les données
Loi Normale (Laplace-Gauss)
Analyse en Composantes Principales A.C.P. M. Rehailia Laboratoire de Mathématiques de l’Université de Saint Etienne (LaMUSE).
Coefficient de corrélation linéaire
POL1803: Analyse des techniques quantitatives
Adaptation d’un test de mesure d’attitude implicite à la mesure du tempérament alimentaire de l’enfant.
Cyber-Sphinx Séance 2.
La Conclusion.
LES mesures des déplacements et des déformations
Plans d’experiences : plans de melanges
Technologies de l’intelligence d’affaires Séance 11
Introduction aux Statistiques Variables aléatoires
Objectifs du chapitre 5: Plans corrélationnels
Pharmaco-épidémiologie Exemples
Technologies de l’intelligence d’affaires Séance 12
Méthodologie de la recherche Programme du module.
Cyber-Sphinx Séance 2.
4.2 Estimation d’une moyenne
REVUE DE LITTERATURE. Introduction Première partie majeure dans la rédaction du mémoire, la réalisation d’une revue de littérature consiste à effectuer.
Mathématiques et Sports. La course à pied La course à pied  Les mathématiques, sont un outil qui permet d’analyser, de simuler, de prédire et d’optimiser.
Analyse de la variance et de la covariance Analyse de la variance à 1 facteur ANOVA à 2 facteurs Conditions d’utilisation.
Enquêtes étiologiques (Analytiques)
Programme financé par l’Union européenne
La méthode scientifique
POL1803: Analyse des techniques quantitatives
CHAPITRE 5: Méthodes multivariables
sur la philosophie des tests et des modèles en statistiques
Comment analyser en fonction du genre et du sexe?
LES MODELES MACROECONOMIQUES DE LA SYNTHESE
Présentation 5 : Sondage à probabilités inégales
Présentation 8 : Redressement des estimateurs
Présentation 9 : Calcul de précision des estimateurs complexes
Centre d’études et de recherches sur les qualifications
Data Mining Fait par : Belhaj Nadia Derouich Maryem.
Position, dispersion, forme
Réalisé par: Benjeddou Nasser Module: Modélisation des SI.
Janvier 2019 IA-IPR Physique-Chimie
Contribution du LHyGeS
Moteurs de recherches Data mining Nizar Jegham.
Présentation 6 : Sondage à plusieurs degrés
Les effets du mode de collecte des données sur la mesure de l'emploi : une comparaison entre le web et le téléphone Johann Neumayr Joachim Schork Guillaume.
Programme d’appui à la gestion publique et aux statistiques
PROGRAMMATION SCIENTIFIQUE EN C
Utiliser le modèle log-linéaire pour mettre au jour la structure du lien entre les deux variables d’un tableau de contingence : un exemple d’application.
Matrices.
Les méthodes quantitatives en éducation
Objectifs du chap. 5: Plans quasi-expérimentaux
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Transcription de la présentation:

PLACE DU SCORE DE PROPENSION EN EPIDEMIOLOGIE CLINIQUE Christophe Clec’h Présentation IAB, 21 Décembre 2007 Présentation IAB, 21 Décembre 2007

PLAN Introduction Introduction Théorie du score de propension (SP) Théorie du score de propension (SP) Construction Construction Utilisation Utilisation Conclusion Conclusion

INTRODUCTION-I- Etudes observationnelles fréquentes Etudes observationnelles fréquentes But: estimer (suggérer) relation causale entre TTT ou exposition et devenir But: estimer (suggérer) relation causale entre TTT ou exposition et devenir Problème: non randomisation Problème: non randomisation Différences de distribution des caractéristiques de base (covariables-facteurs de confusion) responsables d’une estimation biaisée de l’effet du TTT ou exposition Comparaisons directes impossibles

INTRODUCTION-II- Appariement, stratification: techniques courantes mais limitées Appariement, stratification: techniques courantes mais limitées Quand nombre élevé de covariables,  exponentielle du nombre de strates (2 k strates pour k covariables dichotomiques) Quand nombre élevé de covariables,  exponentielle du nombre de strates (2 k strates pour k covariables dichotomiques) Strates contenant que sujets TTT ou expo Comparaisons directes impossibles

INTRODUCTION-III- Ajustement sur facteurs de confusion: autre technique mais 2 inconvénients: Ajustement sur facteurs de confusion: autre technique mais 2 inconvénients: 1. Chevauchement insuffisant entre les groupes pour une covariable donnée visible immédiatement avec stratification mais « transparente » dans un modèle donc dangereux (biais dans l’estimation des paramètres) 2. Modèles supposent une forme particulière de la relation entre covariables et devenir (linéarité, loglinéarité) pas toujours effective ni vérifiée

INTRODUCTION-IV- Succès des modèles viennent de leur apparente facilité d’utilisation avec les logiciels de stat et des difficultés à apparier ou stratifier sur un grand nombre de covariables Succès des modèles viennent de leur apparente facilité d’utilisation avec les logiciels de stat et des difficultés à apparier ou stratifier sur un grand nombre de covariables Mais risque d’interprétation erronée Mais risque d’interprétation erronée

THEORIE DU SP-I- Idée de base Remplacement de toutes les covariables par une variable unique (SP) qui est une fonction de ces covariables (condensation de l’information) Remplacement de toutes les covariables par une variable unique (SP) qui est une fonction de ces covariables (condensation de l’information) Utilisation comme une covariable de confusion unique Utilisation comme une covariable de confusion unique Rosenbaum P, Rubin DB; Biometrika 1983

THEORIE DU SP-II- SP dérive de la prédiction de l’assignement à un groupe de TTT ou d’exposition SP dérive de la prédiction de l’assignement à un groupe de TTT ou d’exposition Chaque sujet a X covariables et un indicateur de TTT Z, Z=1 si TTT et Z=0 si contrôle Chaque sujet a X covariables et un indicateur de TTT Z, Z=1 si TTT et Z=0 si contrôle e(X)=SP, probabilité pour un sujet i d’être dans groupe TTT connaissant les valeurs des X  e(X)=prob(Z=1/X)  e(X)=SP, probabilité pour un sujet i d’être dans groupe TTT connaissant les valeurs des X  e(X)=prob(Z=1/X)  Randomisation: e(X)=1/2 (distribution égale des X) Randomisation: e(X)=1/2 (distribution égale des X) Études observationnelles (randomisation=0): e(X)≠1/2 (prédiction du TTT fonction des X) Études observationnelles (randomisation=0): e(X)≠1/2 (prédiction du TTT fonction des X)

THEORIE DU SP-III- 2 sujets: sujet 1 avec Z=1 et sujet 2 avec Z=0, même SP alors même proba d’appartenir au groupe TTT ou contrôle 2 sujets: sujet 1 avec Z=1 et sujet 2 avec Z=0, même SP alors même proba d’appartenir au groupe TTT ou contrôle« Pièce » 2 groupes de sujets: groupe 1 avec Z=1 et groupe 2 avec Z=0, n strates de SP alors distribution identique du SP dans chaque strate entre sujets Z=1 et Z=0 2 groupes de sujets: groupe 1 avec Z=1 et groupe 2 avec Z=0, n strates de SP alors distribution identique du SP dans chaque strate entre sujets Z=1 et Z=0 Essai pseudo randomisé avec répartition identique des covariables dans chaque strate

THEORIE DU SP-IV- Comparaison directe possible entre les strates Comparaison directe possible entre les strates Preuves théoriques et pratiques Preuves théoriques et pratiques Rosenbaum P, Rubin DB; Biometrika 1983 Rubin DB, Thomas N; Biometrika 1992 Rubin DB, Thomas N; Biometrics 1996

DEFINITION Probabilité conditionnelle d’appartenir à un groupe de TTT connaissant les X Probabilité conditionnelle d’appartenir à un groupe de TTT connaissant les X Score d’équilibration permettant d’avoir une distribution égale des X entre les groupes (strates) et donc d’estimer avec le minimum de biais l’effet d’un traitement dans une étude observationnelle Score d’équilibration permettant d’avoir une distribution égale des X entre les groupes (strates) et donc d’estimer avec le minimum de biais l’effet d’un traitement dans une étude observationnelle

CONSTRUCTION DU SP-I- Modèle de régression logistique (analyse discriminante) Modèle de régression logistique (analyse discriminante) Variable dépendante: TTT ou exposition Variable dépendante: TTT ou exposition Variables explicatives: caractéristiques de base Variables explicatives: caractéristiques de base Guidelines pour construction et évaluation des modèles de régression logistique Guidelines pour construction et évaluation des modèles de régression logistique Bagley SC et al. J Clin Epidemiol 2001 Applicabilité au SP? (but différent) Applicabilité au SP? (but différent)

CONSTRUCTION DU SP-II- Quelles variables? Variables liées au devenir ++++ Variables liées au devenir ++++ Rubin DB, Thomas W; Biometrics 1996 Variables liées au devenir et à l’exposition/TTT (« true counfounders ») Variables liées au devenir et à l’exposition/TTT (« true counfounders ») Variables liées à l’exposition uniquement Variables liées à l’exposition uniquement

CONSTRUCTION DU SP-III- Quelles variables? Variables liées au devenir: diminution du biais et de la variance de l’estimation de l’effet exposition/TTT Variables liées au devenir: diminution du biais et de la variance de l’estimation de l’effet exposition/TTT Variables liées uniquement à l’exposition/TTT: augmentation du biais et de la variance de l’estimation de l’effet exposition/TTT Variables liées uniquement à l’exposition/TTT: augmentation du biais et de la variance de l’estimation de l’effet exposition/TTT Brookhart MA et al.; Am J Epidemiol 2006

CONSTRUCTION DU SP-IV- Quelles variables? Variables liées uniquement à l’exposition/TTT  modèle trop discriminant Variables liées uniquement à l’exposition/TTT  modèle trop discriminant Brookhart MA et al.; Am J Epidemiol 2006 Brookhart MA et al.; Am J Epidemiol 2006 Et donc problèmes: Et donc problèmes: - pour la stratification (peu de sujets non traités ou non exposés dans les strates élevées de SP et inversement peu de sujets traités ou exposés dans les strates basses d’où comparaisons impossibles) - pour l’appariement (perte d’un grand nombre de sujets lié au faible nombre d’appariements possibles) Efficacité moindre du SP Efficacité moindre du SP Austin PC et al.; Stat med 2007

CONSTRUCTION DU SP-V- Quelles variables? SP estimé supérieur au SP « vrai » SP estimé supérieur au SP « vrai » Robins JM et al; Biometrics 1992 Robins JM et al; Biometrics 1992 Rosenbaum PR; J Am Stat Assoc 1987 But différent: équilibrer la distribution des FDC et non prédire précisément l’exposition/TTT But différent: équilibrer la distribution des FDC et non prédire précisément l’exposition/TTT

CONSTRUCTION DU SP-VI- Sélection des variables Plusieurs méthodes: Plusieurs méthodes: Modèle non parcimonieux Modèle non parcimonieux A priori (choix basé sur études antérieures) A priori (choix basé sur études antérieures) Avis d’experts Avis d’experts Variables maximisant GOF du modèle Variables maximisant GOF du modèle Différence en analyse univariée Différence en analyse univariée Sélection ascendante, descendante ou pas à pas Sélection ascendante, descendante ou pas à pas Weitzen S et al. Pharmacoepidemiol Drug Saf 2004

CONSTRUCTION DU SP-VII- Sélection des variables Meilleure méthode? Meilleure méthode? Analyse univariée, stepwise non recommandées: risque de sélection de variables liées uniquement à l’exposition/TTT Analyse univariée, stepwise non recommandées: risque de sélection de variables liées uniquement à l’exposition/TTT Greenland S. Am J Public Health 1989 GOF: trop discriminant, de plus ne permet pas de détecter omission de covariables importantes (risque de confusion résiduelle dans l’estimation de l’effet du traitement non écarté) GOF: trop discriminant, de plus ne permet pas de détecter omission de covariables importantes (risque de confusion résiduelle dans l’estimation de l’effet du traitement non écarté) Weitzen S et al. Pharmacoepidemiol Drug Saf 2005

CONSTRUCTION DU SP-VIII- Sélection des variables Meilleure méthode? Meilleure méthode? Modèle non parcimonieux avec toutes les variables liées au devenir: risque d’estimation biaisée si SP construit avec trop peu de variables Modèle non parcimonieux avec toutes les variables liées au devenir: risque d’estimation biaisée si SP construit avec trop peu de variables Seeger JD et al.; Med Care 2007 Avis d’expert (Delphi) Avis d’expert (Delphi)

CONSTRUCTION DU SP-IX- Validation Vérification de l’équilibre de la distribution des covariables entre les groupes ( = but du SP, préalable indispensable à toute analyse) Vérification de l’équilibre de la distribution des covariables entre les groupes ( = but du SP, préalable indispensable à toute analyse) Soit par appariement soit par stratification Soit par appariement soit par stratification

CONSTRUCTION DU SP-X- Validation Si différences importantes de distribution des covariables, reformuler le modèle: Si différences importantes de distribution des covariables, reformuler le modèle: 1. Carré des variables (variance élevée) 2. Interaction ( corrélation entre 2 covariables importantes différente dans les 2 groupes) Parfois chevauchement trop faible, pas d’équilibration possible (échec) Parfois chevauchement trop faible, pas d’équilibration possible (échec)

Utilisation du SP-I- Construction du SP = étape intermédiaire Construction du SP = étape intermédiaireEnsuite Appariement Appariement Stratification, en 5 classes, élimine 90% du biais Stratification, en 5 classes, élimine 90% du biais D’agostino RB. Stat Med 1998 Ajustement: SP introduit dans le modèle soit comme variable quantitative soit comme variable qualitative à 4 classes (5- classe de référence); attention à collinéarité (pas de variables comprises dans le SP) Ajustement: SP introduit dans le modèle soit comme variable quantitative soit comme variable qualitative à 4 classes (5- classe de référence); attention à collinéarité (pas de variables comprises dans le SP) Mixte: appariement sur SP puis ajustement sur FDC Mixte: appariement sur SP puis ajustement sur FDC

Utilisation du SP-II- Appariement > stratification: moins de biais et de variance dans l’estimation de l’effet de l’exposition/TTT Appariement > stratification: moins de biais et de variance dans l’estimation de l’effet de l’exposition/TTT Austin PC; Stat Med 2007 SP « reverse »: SP « reverse »: utilisation a posteriori dans les essais randomisés où les groupes sont différents pour rééquilibrer et réévaluer l’effet de l’exposition/TTT Berger WV; Stat Med 2005

INTERETS Synthèse de l’information contenue dans les covariables en un score unique Synthèse de l’information contenue dans les covariables en un score unique Equilibre de la distribution des covariables entre les groupes: estimation non biaisée (ou biais minime) de l’effet du TTT (situation proche de la randomisation) Equilibre de la distribution des covariables entre les groupes: estimation non biaisée (ou biais minime) de l’effet du TTT (situation proche de la randomisation) Facilitation à la fois de la stratification et de l’appariement Facilitation à la fois de la stratification et de l’appariement

LIMITES-I- Pas d’équilibration pour les covariables non observées (≠ randomisation; pour les covariables observées, SP supérieur à randomisation) Pas d’équilibration pour les covariables non observées (≠ randomisation; pour les covariables observées, SP supérieur à randomisation) GOF élevé n’élimine pas le risque de biais d’interprétation (n’élimine pas formellement la possibilité d’omission d’une covariable majeure de confusion) GOF élevé n’élimine pas le risque de biais d’interprétation (n’élimine pas formellement la possibilité d’omission d’une covariable majeure de confusion) Analyse de sensibilité Analyse de sensibilité Techniques de simulation Techniques de simulation Rosenbaum PR, Rubin DB. J R Stat Soc 1983 Connors AF et al. JAMA 1996 Construction et comparaison de plusieurs modèles Construction et comparaison de plusieurs modèles Confrontation aux données de la littérature Confrontation aux données de la littérature

LIMITES-II- Peu efficace sur les petites cohortes: risque de déséquilibre résiduel dans la distribution des covariables (idem randomisation) Peu efficace sur les petites cohortes: risque de déséquilibre résiduel dans la distribution des covariables (idem randomisation) Biais inhérents au manque de maîtrise de la technique Biais inhérents au manque de maîtrise de la technique

UTILISATION DU SP DANS LA LITTÉRATURE-I- Sur 47 études: Méthode de choix des covariables explicitée dans 23 cas (49%) dont 11 (48%) inappropriée (univariée, stepwise) Méthode de choix des covariables explicitée dans 23 cas (49%) dont 11 (48%) inappropriée (univariée, stepwise) Aucune information sur l’équilibre de la distribution des covariables dans 22 cas (47%) Aucune information sur l’équilibre de la distribution des covariables dans 22 cas (47%) Collinéarité jamais explorée Collinéarité jamais explorée Information sur la forme de la relation entre covariables continues et devenir dans un seul cas Information sur la forme de la relation entre covariables continues et devenir dans un seul cas Weitzen S et al. Pharmacoepidemiol Drug Saf 2004

UTILISATION DU SP DANS LA LITTÉRATURE-II- Sur 60 études: Pas d’information sur la construction du SP ni sur l’appariement dans 31 cas (50%) Pas d’information sur la construction du SP ni sur l’appariement dans 31 cas (50%) Aucune information sur l’équilibre de la distribution des covariables dans 11 cas (18%) Aucune information sur l’équilibre de la distribution des covariables dans 11 cas (18%) Utilisation explicite de tests statistiques inappropriés dans 39 cas (65%) Utilisation explicite de tests statistiques inappropriés dans 39 cas (65%) Austin PC J Thorac Cardiovasc Surg 2007

CONCLUSION Technique séduisante (équivalent de randomisation pour les covariables observées) Technique séduisante (équivalent de randomisation pour les covariables observées) Efficace Efficace Mal utilisée souvent Mal utilisée souvent Connaissance de la théorie, des avantages et des limites de la technique nécessaire à sa bonne utilisation Connaissance de la théorie, des avantages et des limites de la technique nécessaire à sa bonne utilisation

Je vous remercie de votre attention