Journées EMOIS Nancy 2001 Fiabiliser l’identification des patients dans les bases de données du PMSI DIM du CHU de POITIERS Jean-Loup HURET, MCU-PH Virginie MIGEOT, PH Francis PRADEAU, PH Pierre INGRAND, PU-PH EMOIS Nancy 29-30 mars 2001
Identification patient et PMSI : contexte Recueil PMSI centré sur le séjour Absence d’identification du patient dans le RUM RUM indirectement nominatif : liaison n°RSS avec n° hospitalisation et gestion administrative Gestion administrative orientée facturation des séjours Généralisation du chaînage des séjours Orientation santé publique de l’utilisation des bases de données du PMSI La question de la qualité de l’identification du patient dans le contexte du PMSI n’a pas toujours été vue comme une priorité. Le recueil d’informations du PMSI est en effet centré sur le séjour et non sur le patient. De fait, le format du RUM, au moins dans les établissements publics, ne contient aucune information d’identification du patient. Le RUM est indirectement nominatif par la liaison établie entre le numéro de RSS et le numéro administratif d’hospitalisation, sachant que la gestion administrative est elle-même tournée vers la facturation, donc le séjour. Des éléments viennent modifier ce schéma, d’une part la généralisation du chaînage des séjours qui vise à unifier une identification anonyme du patient à travers l’ensemble de sa trajectoire de prise en charge dans le champ de l’hospitalisation MCO, d’autre part, une tendance à une orientation de santé publique des utilisations des bases de données du PMSI. En effet l’impact de l’utilisation du PMSI par les ARH se démarque de plus en plus d’une stricte utilisation aux fins d’allocation budgétaire pour évoluer vers un outil d’aide à la planification et à l’évaluation des établissements EMOIS Nancy 29-30 mars 2001
Identification patient : organisations Modèle du SIH intégré « centré sur le patient » Diversité des conditions locales de recueil : Liaison avec informatique administrative Dossier patient structuré hiérarchique Saisie non redondante Gestion d’un NIP unique commun Assurance qualité de l’information Souvent le recueil PMSI strict constitue le seul SIH médicalisé La capacité des DIM à gérer l’identification des patients et à en maîtriser la fiabilité dépend très étroitement des modalités organisationnelles propres à leurs établissements. Le patient est clairement au centre du modèle universel de système d’information hospitalier intégré. Localement les conditions peuvent s’avérer très éloignées de ce modèle avec une grande diversité de situations dans les conditions de recueil de l’information patient. Quelques déterminants essentiels sont la liaison uni ou bidirectionnel avec l’informatique administrative L’existence d’un dossier patient structuré qui hiérarchise le patient par rapport au séjour La mise en œuvre d’une saisie non redondante La gestion d’un identifiant patient unique et commun La mise en œuvre de procédures continues d’assurance qualité de l’information administrative Dans beaucoup d’établissements, le PMSI, réduit à sa plus simple expression, constitue encore le seul SIH médicalisé. EMOIS Nancy 29-30 mars 2001
Identification patient : rationnels Pourquoi identifier le patient et pas seulement le séjour ? Séquencement des RUM, contrôle qualité Chaînage des séjours (circulaire à paraître) Indicateurs d’activité internes ou transversaux : réhospitalisation, cancers, trajectoires de soins Santé publique, épidémiologie : registres Réseaux de soins coordonnés Les raisons de s’intéresser particulièrement à l’identification des patients, et pas uniquement des séjours sont multiples et, pour la plupart évidentes. En premier lieu, le séquençage des RUM nécessite le contrôle de leur appartenance au même patient. A cet égard, on remarquera que le Guide Méthodologique de production des résumés de sortie du MCO inclut dans le contrôle de la qualité la prise en compte des données administratives, incluant l’identité des malades, alors m^me que cette information n’appartient pas au format du RUM (paradoxe !) Une deuxième raison, plus forte est liée à la généralisation du chaînage des séjours. Mais des développements encore plus importants sont liés à l’intérêt de dériver de nouveaux indicateurs d’activité prenant pour unité le patient, qu’il s’agisse d’indicateurs à l’usage interne des établissements ou d’indicateurs à vocation transversale : taux de réhospitalisation, prise en charge des cancers, étude de trajectoires de soins, etc. Les bases de données du PMSI suscitent des attentes très fortes en matière d’épidémiologie et de santé publique, mais butent souvent sur la non pertinence de données dont l’unité est le séjour. Les difficultés rencontrées dans le cas des registres ont déjà été étudiées par l’équipe de Catherine QUANTIN à Dijon. A cela s’ajoute encore la montée en puissance des réseaux de soins coordonnés. EMOIS Nancy 29-30 mars 2001
Établir une mesure de validité du NIP Fiabilité de l’identification des patients dans les bases de données du PMSI : OBJECTIFS Quantifier le niveau de qualité de l’identification des patients dans une base de données gérée par un DIM Établir une mesure de validité du NIP Identifier les principaux mécanismes d’erreurs Développer des procédures de contrôle et de détection facilement généralisables Je vous présente aujourd’hui un travail dont l’objectif initial était de quantifier le niveau de qualité de l’identification des patients telle qu’elle est actuellement disponible dans une base de données gérée par un DIM. Une part essentielle de l’étude visait donc à établir une mesure de la validité du numéro d’identification du patient. En complément, une approche plus qualitative visait reconnaître et typer les principaux mécanismes d’erreurs L’objectif final, en cours de réalisation, consiste à développer les procédures de contrôle et de détection des erreurs facilement généralisables. EMOIS Nancy 29-30 mars 2001
Détection d’erreurs d’identification : matériel et méthodes Bases de données PMSI des années 1997, 1998 et 1999 totalisant 298 490 résumés de sortie RSS Variables d’identification traitées : Nom Prénom Nom de naissance pour les femmes mariées Date de naissance Sexe Numéro administratif d’identification patient NIP Pour conduire cette étude, en l’absence d’autorisation spécifique, nous avons exploité l’ensemble des données du PMSI-MCO du CHU de Poitiers de trois années 1997, 1998, 1999 qui totalisent près de 300 000 RSS. Les variables d’identification individuelle traitées étaient le nom Le prénom Le nom de naissance pour les femmes mariées La date de naissance Le sexe Le code postal n’a pas été pris en compte En parallèle, le NIP, numéro administratif d’identification du patient, a été exploité EMOIS Nancy 29-30 mars 2001
Détection d’erreurs d’identification : procédures SGBD Access : requêtes de regroupement : Sur l’ensemble des variables ; Sur combinaisons de 3 ou 2 variables Sur parties de variables Contrôle systématique avec retour au dossier administratif. Dossier médical en cas d’ambiguïté persistante Fusion manuelle sur NIP Traçabilité des traitements, historique Le développement des procédures de détection des erreurs d’identification a conduit à créer dans une base Access des requêtes SQL de regroupement visant à détecter l’existence de plus d’un enregistrement possédant des critères communs. Ces regroupements, d’abord effectués sur l’ensemble des variables portaient ensuite sur combinaisons variables de trois voire deux variables ou sur des parties de ces variables. Aucune fusion n’a été réalisée automatiquement. Chaque cas détecté a fait l’objet d’un contrôle systématique avec un retour au dossier administratif, voir même au dossier médical en cas d’ambiguïté non résolue. Toutes les modifications des informations initiales ont été repérées à l’aide de pointeurs et historiées pour en conserver la traçabilité. EMOIS Nancy 29-30 mars 2001
Résultats (1) Bilan initial : 92303 enregistrements distincts Variations d’identité pour un même NIP 1414 cas soit 1,58 % 7 cas partage NIP par des patients différents NIP différents pour un même patient 1338 cas au total soit 1,49 % dont 716 = 0,78 % avec une même identité Dans son état initial, la base des trois années contenait 92303 enregistrements distincts. Des variations d’identité autour d’un même identifiant ont été repérées dans 1414 cas soit un taux de 1,58%. Il s’agit pour la grande majorité d’erreurs orthographiques mineures mais qui pourraient suffire à désunir des séjours-patients en l’absence de NIP valide. Cependant 7 cas correspondaient à des anomalies graves de partage d’un même identifiant par plusieurs patients (appelées erreurs d’homonymie) A l’inverse, une multiplicité de l’identifiant pour un même patient a été reconnue dans 1338 cas soit un taux de 1,49% (erreurs de synonymie). Pour la moitié d’entre elles, ces erreurs n’étaient associées à aucune discordance d’identité. EMOIS Nancy 29-30 mars 2001
Résultats (2) : concordances partielles Exemple : mêmes nom, date de naissance, sexe et 1ère lettre prénom : 333 vrais doublons / 355 Erreurs les plus fréquentes : Prénom : composé, usuel vs. état civil Nom de naissance : omission, intégré au nom usuel Nom usuel : dysorthographie, composé Date de naissance Sexe Non indépendance, erreurs multiples La détection de concordances partielles représente un travail particulièrement fastidieux dans lequel se mêlent vrais et faux doublons. Par exemple, la requête contrôlant l’unicité du regroupement sur nom, date de naissance, sexe et première lettre du prénom, a ramené 355 enregistrements dont 333 soit 94% sont des doublons à corriger et les 22 restant une majorité de jumeaux. Il serait trop long d’en donner les résultats détaillés. D’une façon générale, les erreurs concernaient par ordre de fréquence décroissante : le prénom avec, à côté des problèmes orthographiques, des variabilité d’usage des prénoms composés, et quelques fluctuations entre prénom d’usage et prénom d’état civil Le nom de naissance des femmes mariées, avec de fréquentes omissions et des intégrations au nom usuel Le nom usuel : dysorthographies, en particulier des noms à consonance étrangère, et problèmes liés aux noms composés La date de naissance : erreurs ou imprécisions (1er jour du mois) Le sexe Un point à noter est la non indépendance des erreurs. Les erreurs multiples apparaissant plus nombreuses que ne le voudrait le seul hasard. EMOIS Nancy 29-30 mars 2001
8,5% des enregistrements contrôlés Résultats (3) : bilan Bilan « final » : 89378 patients dédoublonnés constituant une table des patients historiée 8,5% des enregistrements contrôlés dont 3,2 % ont fait l’objet de corrections Un taux d’erreur du NIP de 1,5% identique à celui observé au CHU de St Etienne par Quantin et Coll. (2000) Rendement inégal des requêtes de détection En fin de compte, par rapport aux 92303 enregistrements initiaux, 89378 patients dédoublonnés restent en présence, sans qu’il puisse être affirmé, bien évidemment que tous les doublons ont été éliminés. 8,5% des enregistrements ont été contrôlés Et 3,2% d’entre eux ont fait l’objet de corrections D’un point de vue opérationnel, il faut signaler un rendement très inégal des différentes requêtes proposées pour la détection des doublons. EMOIS Nancy 29-30 mars 2001
Organiser un traitement séquentiel : Perspectives Intérêt prospectif : analyser l’efficacité de procédures automatisées (sensibilité, spécificité) Organiser un traitement séquentiel : orthographique : doublements, omissions, inversions, noms et prénoms composés : décomposition, concaténation, relations croisées intégrer une démarche probabiliste différenciée Elargir le projet au niveau régional : CORIM Poitou-Charentes EMOIS Nancy 29-30 mars 2001
6,4% des noms portés par 50% des patients Martin Moreau Brunet Bernard Roy Rousseau . . . Hussé Husseau Hupel 6,4% des noms portés par 50% des patients plus de 50% des noms présents une seule fois EMOIS Nancy 29-30 mars 2001
Conclusion : biais d’estimation Des indicateurs biaisés en l’absence contrôle strict des identifiants patients : +1,5% à +3,1% à Poitiers Un biais accentué chez les patients qui ont fait l’objet de prises en charge multiples exemple des cancers : la proportion de dossiers comportant des identifications erronées est significativement plus élevée chez les patients cancéreux que chez les autres patients (p<0,001) EMOIS Nancy 29-30 mars 2001