La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Régression segmentée pour lanalyse de données longitudinales interrompues Aurélien VESIN – U823 – Equipe 11 : « Epidémiologie des cancers et affections.

Présentations similaires


Présentation au sujet: "Régression segmentée pour lanalyse de données longitudinales interrompues Aurélien VESIN – U823 – Equipe 11 : « Epidémiologie des cancers et affections."— Transcription de la présentation:

1 Régression segmentée pour lanalyse de données longitudinales interrompues Aurélien VESIN – U823 – Equipe 11 : « Epidémiologie des cancers et affections graves »

2 Introduction Comment mesurer leffet dun ou plusieurs évènements sur une série de mesures répétées dans le temps : Comment mesurer leffet dun ou plusieurs évènements sur une série de mesures répétées dans le temps : …Si en plus il nest pas possible davoir un groupe contrôle en parallèle (pour raisons éthiques, financières ou autres) …Si en plus il nest pas possible davoir un groupe contrôle en parallèle (pour raisons éthiques, financières ou autres) Effet de la mise en vente du vaccin pour la prévention du cancer du col de lutérus sur lincidence des dépistages de ces cancers Effet de la mise en vente du vaccin pour la prévention du cancer du col de lutérus sur lincidence des dépistages de ces cancers Effet de lattentat du World Trade Center sur lindice du Dow Jones Effet de lattentat du World Trade Center sur lindice du Dow Jones Lévènement peut être : Lévènement peut être : Intervention volontaire (ex : campagne de prévention)Intervention volontaire (ex : campagne de prévention) Imprévu (ex : un attentat)Imprévu (ex : un attentat) La variable dintérêt peut être quantitative : La variable dintérêt peut être quantitative : Continue (ex : Taux dinfections) Continue (ex : Taux dinfections) Discrète (ex : Nombre de naissances) Discrète (ex : Nombre de naissances) La variable dintérêt doit être mesurée à intervalles réguliers dans le temps La variable dintérêt doit être mesurée à intervalles réguliers dans le temps

3 Concepts Série chronologique : Séquence de valeurs dune mesure particulière prise à intervalle réguliers dans le temps Série chronologique : Séquence de valeurs dune mesure particulière prise à intervalle réguliers dans le temps Temps Taux dinfections nosoc.

4 Concepts Segment : Portion de série chronologique. Les segments sont reliés aux points de transitions («Change points») Segment : Portion de série chronologique. Les segments sont reliés aux points de transitions («Change points») Taux dinfections nosoc. Temps

5 Concepts Points de transitions : Point spécifiques où les valeurs montrent des changements de comportement liés à des évènements précis (intervention…) Points de transitions : Point spécifiques où les valeurs montrent des changements de comportement liés à des évènements précis (intervention…) Taux dinfections nosoc. Campagne nationale de prévention des infections nosocomiales Temps

6 Concepts Chaque segment est défini par : Chaque segment est défini par : Le niveau (level, baseline) Le niveau (level, baseline) Une tendance (trend) Une tendance (trend) Le principe de la régression segmentée est de mesurer les changements de niveau et de tendance qui suivent une intervention Le principe de la régression segmentée est de mesurer les changements de niveau et de tendance qui suivent une intervention Intervention

7 Organisation des données Collectées à intervalles réguliers (ex: toutes les années, mois, semaines…) Collectées à intervalles réguliers (ex: toutes les années, mois, semaines…) Dans le cas de données orientées Patient (1 observation = 1 patient), il est nécessaire dagréger en données orientées Temps (1 observation = 1 mois) Dans le cas de données orientées Patient (1 observation = 1 patient), il est nécessaire dagréger en données orientées Temps (1 observation = 1 mois) Ex : Age du patient p Age moyen des patients dans la semaine s Ex : Age du patient p Age moyen des patients dans la semaine s La variable dintérêt (Outcome) peut être une moyenne, un taux, une proportion… La variable dintérêt (Outcome) peut être une moyenne, un taux, une proportion… Un nombre suffisant dobservations « contrôles » cad avant lintervention (et entre les interventions) Un nombre suffisant dobservations « contrôles » cad avant lintervention (et entre les interventions)

8 Régression segmentée standard Modèle de régression linéaire Modèle de régression linéaire /!\ Fait lhypothèse dun lien linéaire entre le temps et la variable dintérêt dans chaque segment /!\ Fait lhypothèse dun lien linéaire entre le temps et la variable dintérêt dans chaque segment Considérons 1 seule intervention Considérons 1 seule intervention Le modèle sécrit sous la forme : Le modèle sécrit sous la forme : YtYt Taux dinfection nosocomiale au temps t Temps t numéro de la semaine t Intervention t égal à 0 avant lintervention, égal à 1 au début de lintervention Temps après intervention t Numéro de la semaine depuis le début de lintervention

9 Régression segmentée standard β 0 = Niveau initial β 1 = Variation de Y pour 1 unité de temps β 2 = Variation immédiate suivant lintervention β 3 = Variation de la tendance β 1 après intervention YtYt t

10 Exemple Intervention à t = 15

11 Exemple proc reg data=reg; model yt = t intervention t2; run; Cest beau !

12 Améliorations possibles : Auto-corrélation Le modèle de régression fait une hypothèse dindépendance entre les observations ! Le modèle de régression fait une hypothèse dindépendance entre les observations ! Peu réaliste pour des données longitudinales Peu réaliste pour des données longitudinales Sous estime les écarts types Sur estime la significativité des estimateurs Sous estime les écarts types Sur estime la significativité des estimateurs Comment le vérifier ? Comment le vérifier ? Représenter graphiquement les résidus Vs le temps, une tendance suggère une autocorrélation Représenter graphiquement les résidus Vs le temps, une tendance suggère une autocorrélation Calculer la statistique de Durbin-Watson pour tester la présence dautocorrélation (sous SAS proc autoreg) Calculer la statistique de Durbin-Watson pour tester la présence dautocorrélation (sous SAS proc autoreg) Comment y remédier ? Comment y remédier ? Estimer le paramètre dautocorrélation et lintroduire dans le modèle si nécessaire Estimer le paramètre dautocorrélation et lintroduire dans le modèle si nécessaire Il est possible de corriger pour des autocorrélations saisonnières Il est possible de corriger pour des autocorrélations saisonnières

13 Autres améliorations possibles La variable dintérêt peut être influencée par des facteurs autres que lintervention et le temps La variable dintérêt peut être influencée par des facteurs autres que lintervention et le temps Ex : Nombre dinterventions chirurgicales est lié au taux d infections nosocomiales Ex : Nombre dinterventions chirurgicales est lié au taux d infections nosocomiales On peut introduire des co-variables dajustement On peut introduire des co-variables dajustement Possibilité de faire des analyses stratifiées en sous groupes Possibilité de faire des analyses stratifiées en sous groupes Possibilité dintroduire plusieurs interventions Possibilité dintroduire plusieurs interventions

14 Etapes de développement dun modèle de régression segmentée (Suggestions) Observer graphiquement les données Observer graphiquement les données Construire un modèle complet Construire un modèle complet Supprimer les variables non significatives Supprimer les variables non significatives Ajouter les variables dajustement Ajouter les variables dajustement Tester autocorrélation et ajouter un terme si besoin Tester autocorrélation et ajouter un terme si besoin Vérifier autres points de contrôles spécifiques au modèle (résidus, normalité…) Vérifier autres points de contrôles spécifiques au modèle (résidus, normalité…)

15 Conclusion Avantages Avantages Quand il est impossible davoir un groupe contrôle en parallèle Quand il est impossible davoir un groupe contrôle en parallèle Simple à mettre en place Simple à mettre en place Méthodologie et résultats intelligibles Méthodologie et résultats intelligibles Coefficients = variation immédiate et dans le tempsCoefficients = variation immédiate et dans le temps Obtention dintervalles de confiance pour les variations associées aux interventionsObtention dintervalles de confiance pour les variations associées aux interventions Présentation sous forme graphiquePrésentation sous forme graphique Facilement extensible : Facilement extensible : Plusieurs interventions possiblesPlusieurs interventions possibles Prise en compte saisonnalité, auto corrélation, ajustementsPrise en compte saisonnalité, auto corrélation, ajustements Transformation de variables en cas de non linéarité ou non normalitéTransformation de variables en cas de non linéarité ou non normalité

16 Inconvénients Inconvénients : Inconvénients : Contraintes liées aux hypothèses du modèle : Contraintes liées aux hypothèses du modèle : Relation linéaire entre le temps et la variable dintérêtRelation linéaire entre le temps et la variable dintérêt NormalitéNormalité Agrège les données patients en données temps Agrège les données patients en données temps Perte dinformation (précision)Perte dinformation (précision) Ne permet pas dajuster par des variables orientées patient mais des variables agrégéesNe permet pas dajuster par des variables orientées patient mais des variables agrégées Nombre dobservation conseillé min.10 obs par variables rentrées dans le modèle Nombre dobservation conseillé min.10 obs par variables rentrées dans le modèle Alternative : Modèles ARIMA Alternative : Modèles ARIMA

17 Bibliographie A.K Wagner and al. ; « Segmented regression analysis of interrupted time series studies in medication use research » ; Journal of clinical Pharmacy an Therapeutics (2002) 27, A.K Wagner and al. ; « Segmented regression analysis of interrupted time series studies in medication use research » ; Journal of clinical Pharmacy an Therapeutics (2002) 27, Weinberg and al. ; « Reducing infections among women undergoing cesarean section in columbia by means of continuous quality improvment methods » ; Arch Intern Med (2001) 161, Weinberg and al. ; « Reducing infections among women undergoing cesarean section in columbia by means of continuous quality improvment methods » ; Arch Intern Med (2001) 161, Ansari and al. ; « Outcomes of an intervention to improve hospital antibiotic prescribing : Interrupted time series with segmented regression analysis » ; Journal of antimicrobial chemotherapy (2003) 52, Ansari and al. ; « Outcomes of an intervention to improve hospital antibiotic prescribing : Interrupted time series with segmented regression analysis » ; Journal of antimicrobial chemotherapy (2003) 52, Morgan and al. ; « Interrupted time-series analysis of regulations to reduce paracetamol (acetainophen) poisoning » ; PLOS medicine (2007) 4, Morgan and al. ; « Interrupted time-series analysis of regulations to reduce paracetamol (acetainophen) poisoning » ; PLOS medicine (2007) 4, Shardell and al. ; « Statistical analysis and application of Quasi Experiments to antimicrobial resistance intervention Studies » ; Antimicrobial resistance (2007) 45, Shardell and al. ; « Statistical analysis and application of Quasi Experiments to antimicrobial resistance intervention Studies » ; Antimicrobial resistance (2007) 45,


Télécharger ppt "Régression segmentée pour lanalyse de données longitudinales interrompues Aurélien VESIN – U823 – Equipe 11 : « Epidémiologie des cancers et affections."

Présentations similaires


Annonces Google