Appariement de la base de données PMSI-MCO à celle des causes médicales de décès via le SNIIR-AM Séminaire Appariements sécurisés 19 janvier 2012 Agathe.

Slides:



Advertisements
Présentations similaires
Patients hospitalisés pour accident vasculaire cérébral en France :
Advertisements

Le statut social des enfants de 0 à 5 ans influe-t-il sur la prise en charge de leurs problèmes de santé ? A partir d'une étude réalisée en médecine générale.
Risques d’erreur statistique et test statistique
RECONNAISSANCE DE FORMES
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Appariement Pres. 7.
Atelier sur lanalyse approfondie des migrations à partir des données de recensement: Ouagadougou novembre 2011 Bonayi Hubert DABIRE, UO/ISSP
Collecte de données F. Kohler.
Inférence statistique
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
4 février 2005DESS Economie et Gestion des Cliniques et Etablissements pour personnes âgées 1 La prise en compte des critères économiques dans lanalyse.
1 La mesure de la mortalité prématurée : comparaison des décès avant 65 ans et des années espérées de vie perdues A. Lapostolle a,*, A. Lefranc b,c, I.
Application de réseaux bayésiens à la détection de fumées polluantes
Les TESTS STATISTIQUES
LES CANCERS : FREQUENCES ET DEPISTAGES Point de vue épidémiologique
1 Bases de sondages multiples et redressement des poids extrêmes Le cas de lenquête auprès des intervenants au domicile de personnes fragilisées (IAD –
Piecewise Affine Registration of Biological Images
Dr DEVILLE Emmanuelle J D V 12/07/2006
13/11/2008Conférence des directeurs des affaires financières de la FHF / Ile-de-France Congrès dautomne de la FHF / Ile-de-France Vers une évolution du.
Étude comparative randomisée d’une action de santé pour améliorer les pratiques diagnostiques et d’antibiothérapie des infections urinaires et pulmonaires.
Disparités de chirurgie élective en Belgique Jessica Jacques Service des Informations Médico-Economiques.
Octobre 2005 Éléments de connaissance sur lorganisation territoriale de la santé dans le secteur de Saint-Amand-Longpré 6 juin 2012.
ETABLISSEMENT DE SANTE EHPAD : QUELLES ALLIANCES ?
Vendredi 28 mars 2014 EPSG Assemblée plénière Leuven
Pilotage de l’activité des établissements de santé
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Réalisé avec le soutien de la Communauté française
SEMINAIRE DE CONTACT novembre 2008 Outils de gestion de projet.
La régression multiple
Disparités régionales des décès dus aux AVC
Conférence de presse du 21 août 2014 Perspectives démographiques à horizon 2040 Le Valais et ses régions Maurice Tornay Chef du Département des finances.
Remontées des RPU Max Bensadon - ATIH.
Approches de Santé publique, épidémiologie
La gestion de l’éducation dans le contexte de l’Education Pour Tous Alain Dhersigny - Séminaire AGEPA – NIAMEY, 16 février 2009.
Méthodes non expérimentales E4P workshop Lisbonne – 25 mars, 2014 Lodewijk Smets Université Catholique de Louvain (KUL) Université d’Anvers (UA)
Docteur Christophe SCHMITT CH de Jury lès Metz
Surcoût des évènements indésirables associés aux soins à l’hôpital
Pauvreté et autres formes d’exclusion sociale en Aquitaine
La Culture de sécurité des professionnels de santé
Réunion du 24/11/2009 Télétransmission et téléservices.
JUIN 2014 AGENCE NATIONALE DE LA STATISTIQUE ET DE LA DEMOGRAPHIE.
Rencontre inter ORU 24 mai 2013
François VOILLET DESC 1 ère Année Décembre  Taux de survie après arrêt cardiaque extrahospitalier faible surtout chez les patients qui n’ont pas.
VARIABLES ET MESURES DE FREQUENCES Pr. KELLIL M 1.
Exemple démarche Aquitaine Taux de recours hospitaliers Chirugie Bouche Dents 24 avril 2013.
La satisfaction au travail des professionnels des établissements de santé.
Prévalence de la sclérose en plaques en France en 2012 et mortalité associée en 2013 à partir des données du SNIIRAM-PMSI Stéphanie Foulon1, Alain Weill1,
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Paraclinique 2e doc Paramètres génétiques des chevaux de concours complet en France.
La Culture de sécurité des professionnels de santé.
11 octobre 2006 Projet d’étude Le retour à l’emploi à Paris.
Mardi 26 novembre 2002 mpbroker 03/06/2015 Introduction Loi sur la pension complémentaire (LPC) du 15 mai Rappel : assurance groupe / dirigeant Aspects.
Auteur Fonction Date Offre Insee Observation du domaine médico-social.
Pôle Information Médicale Evaluation Recherche Plateforme d’étude et de partage de l’information hospitalière Augmentation estivale de la mortalité associée.
Le projet CLARTE (1) Cadre
K. Cosker, S. Samson, A. Fagot-Campagna, F. Woimant, P. Tuppin
An efficient validation method of Probabilistic Record Linkage including readmissions and twins M. Tromp, A.C.J. Ravelli et al. Methods Inf Med 2008; 47.
Introduction Comparaisons d’accès au soin entre Paris et d’autres métropole (NYC, Londres) Meilleur accès au soin Moins de variation géographiques Intérêt.
CSPS PV ANN. 2 CELLULE STATISTIQUES NAISSANCES - DECES INTRODUCTION & TRAITEMENT DES CERTIFICATS.
CPCMU Le 11 avril 2014 Gilles MOALIC
Ministère des finances et des comptes publics Ministère des affaires sociales, de la santé et des droits des femmes Ministère du travail, de l’emploi,
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tableau à double entrée ou Tableau de contingence ou … 1.
LES CONTRACTUELS AU CENTRE HOSPITALIER DE LA COTE BASQUE LES CONTRACTUELS AU CENTRE HOSPITALIER DE LA COTE BASQUE Julien ROSSIGNOL, Directeur Adjoint,
Tarification à l ’activité T2A Geneviève Botti Hôpital Timone adultes Marseille 2004.
1 Ménages et familles : le recensement et les autres sources de données Laurent Toulemon Le recensement rénové de la population : résultats statistiques.
Jean-Luc LIPATZ INSEE DG Division « Etudes territoriales » Recensement et sources administratives et si on parlait géographie?
Mortalité des personnes hospitalisées à la suite d’un incendie, en France en 2007 Une estimation par la méthode capture-recapture Linda Lasbeur, Annabel.
Prédiction du niveau de certification des établissements de santé Soutenance de stage 12 septembre 2012 Benjamin Robillard.
Transcription de la présentation:

Appariement de la base de données PMSI-MCO à celle des causes médicales de décès via le SNIIR-AM Séminaire Appariements sécurisés 19 janvier 2012 Agathe Lamarche-Vadel Grégoire Rey Eric Jougla 1

Cadre du projet XIXème s. : 1 ères utilisations de la mortalité hospitalière pour évaluer la qualité des soins An : indicateurs/établissement produits en routine dans qq pays (RU,EU, All, Hol …) Fin 2008 : demande du Président de la République de disposer d’indicateurs de mortalité en établissements de santé en France 2009 : instruction des aspects méthodologiques (pilotage DREES, en lien DGOS et HAS) -> nécessité d’inclure les décès après la sortie 27/10/2010 : signature d’une convention de partenariat scientifique sur trois ans entre DREES - CNAMTS - CépiDc visant à évaluer la faisabilité d’indicateur de mortalité faisant suite à une hospitalisation 2

Appariement nécessaire à la réalisation du projet AMPHI Projet nommé AMPHI : Analyse de la Mortalité Post-Hospitalière à la recherche d’Indicateurs de mortalité représentatifs de la qualité des soins Nécessite l’appariement au niveau individuel – des données hospitalières : PMSI-MCO – aux données de causes médicales de décès Absence d’identifiant direct dans la base CépiDc -> appariement indirect Via le SNIIRAM qui chaine le PMSI avec des données administratives individuelles AM Date de décès pour les bénéficiaires du Régime Général (hors SLM) -> restriction de l’étude au RG (~70% de la population française ) Mois et année de naissance Lieu de domicile ‘en code INSEE’ 3

Appariement nécessairement sécurisé Données individuelles doublement sensibles : – Données de santé à caractère personnel : diagnostics hospitaliers, actes … du PMSI-MCO – Causes médicales de décès confidentielles Données individuelles indirectement identifiantes : – Dates de soins / de naissance / de décès – Lieux de soins / de résidence Etude expérimentale autorisée par l’IDS et la CNIL – Après mise en place d’un protocole sécurisé particulier – Restrictive : PMSI MCO , CMUC et décès – Non généralisable 4

Méthodes (1) Appariement indirect portant sur les variables communes aux deux bases : Sexe - mois et année de naissance - jour, mois et année de décès - dpt et commune de domicile La variable commune de domicile du SNIIRAM a posé plusieurs difficultés : – de nombreuses valeurs manquantes (16% en 2008, 4% en 2009) – un mélange de codes Insee et de codes postaux Appariement uniquement avec le logiciel automatique – Premier appariement : sexe, mois et année de naissance, jour mois et année de décès, département de domicile. – Deuxième appariement : idem + la commune de domicile Appariement avec traitements spécifiques de la commune de domicile 5

Méthodes (2) Expression des résultats d’appariement Le résultat d’une tentative d’appariement d’un cas de décès du SNIIRAM à la base CépiDc sur un ensemble défini de variables d’appariement est dit : Non trouvé si 2 variables au moins discordent ou Partiel si une seule variable dicorde … Total si toutes les variables concordent … et Unique … pour une seule observation de la base CépiDc Multiple … pour plus d’une observation de la base CépiDc Donc 5 résultats possibles : Non trouvé – Total unique – Total multiple – Partiel unique – Partiel multiple Règle de décision : sont considérés comme appariés les ‘Total unique’ et les ‘Partiel Unique’ 6

Résultat du 1 er appariement : (sexe – m/a naissance – j/m/a décès – depdom) 7

Résultat du 2ème appariement : (sexe–m/a naissance–j/m/a décès–depdom comdom) 8

Méthodes (3) Stratégie d’appariement en deux temps avec traitements spécifiques de la commune de domicile 1 er temps : appariement sur les variables : sexe - mois et année de naissance - jour, mois et année de décès – département de domicile 2 ème temps : utilisation de la variable commune de domicile pour -départager les doublons (Total et partiels multiples) Parmi les doublons de la base CépiDc Repérer ceux dont le code (insee) de commune de domicile correspond au code (insee ou postal) de domicile du cas Considérer le cas apparié si la comdom d’un seul des doublons correspond -trancher les cas douteux (Partiels uniques) Exclure ceux dont la commune diverge Sauf si la divergence portait déjà sur le département de domicile 9

10 Méthodes (4) Stratégie d’appariement en deux temps

Résultat de la stratégie en deux temps avec prise en compte spécifique de la variable commune de domicile Total N%N%N% Non apparié178255,0%187145,1%365395,1% dontanciennement Non Trouvé8650,2%10550,3%19200,3% Partiel unique9940,3%10050,3%19990,3% Total ou Partiel multiple159664,5%166544,6%326204,5% Apparié ,0% ,9% ,9% dontanciennement Partiel unique21670,6%24390,7%46060,6% Total ou Partiel multiple79942,2%91972,5%171912,4% Total unique ,2% ,7% ,9% Total ,0% ,0% ,0%

Résultats (4) Représentativité de l’appariement Par sexe : pas de différence notable Par âge : Taux d’appariement ≥ 94% pour toutes les classes d’âge sauf < 1 an : 93% et 1-20 ans : 93% Par département de domicile : Taux d’appariement ≥ 92% pour tous les départements sauf : - ceux de la région parisienne, en particulier Paris : 86% - domiciliation à l’étranger : 27% 12

Résultats (5) Taux d’appariement par département de domicile 13

Résultats (6) Par département : taux d’appariement en fonction du pourcentage de résidents étrangers 14 A l'échelle des départements de domicile, le taux d’appariement est inversement associé au % de résidents de nationalité étrangère.

Conclusion Réalisation effective et taux d’appariement de 94,9% satisfaisants. Variables d’appariement disponibles globalement suffisantes pour discriminer les observations aux âges élevés. Problème de faible taux d’appariement à Paris et région parisienne 15

Appariement : perspectives L’utilisation de variables supplémentaires devrait améliorer ce résultat. Cependant, la qualité des différentes données d’état civil est vraisemblablement corrélée. Paradoxe : avec la méthode déterministe utilisée, plus le nombre de variables est élevé, plus la probabilité d’apparier les données diminue Possibilité de faux appariés : Erreur dans le RG correspondant à un unique (hors RG dans la base CépiDc) Partiels uniques même règle pour toutes les variables  Appariement probabiliste 16

Appariement probabiliste ≠ appariement déterministe (exact) Méthode de Fellegi et Sunter Considère comme appariées des observations j et k maximisant le rapport Dépendant des poids : Détermination d’un seuil à partir duquel le couple est considéré apparié

Appariement probabiliste En pratique, poids inconnus Méthode d’estimation des poids EM (Expectation, Maximisation) Utilisation du logiciel FRIL  Hypothèse d’indépendance conditionnelle, calcul des poids séparés pour chaque variable i :  Nb d’observations élevés : comparaison par bloc (par exemple par date de décès)

Appariement probabiliste Plusieurs problèmes : -Pas d’ensemble d’apprentissage -Hypothèse d’indépendance fausse -Choix des blocs ne permet pas une erreur sur les variables de base, mais sinon temps de calcul trop élevé -Pas de mesure de la qualité de l’appariement (pas de référence) -Seuils à déterminer -Résultats obtenus incohérents pour l’instant