La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Soutenance de thèse 2/12/2008 Indexation multi-terminologique de concepts en santé Suzanne Pereira Encadrée par : É lisabeth Serrot, Michel Joubert et.

Présentations similaires


Présentation au sujet: "Soutenance de thèse 2/12/2008 Indexation multi-terminologique de concepts en santé Suzanne Pereira Encadrée par : É lisabeth Serrot, Michel Joubert et."— Transcription de la présentation:

1 Soutenance de thèse 2/12/2008 Indexation multi-terminologique de concepts en santé Suzanne Pereira Encadrée par : É lisabeth Serrot, Michel Joubert et Stefan J. Darmoni LITIS, Universit é de Rouen - É quipe CISMeF, CHU de Rouen LERTIM, Facult é de m é decine, Marseille Vidal, Issy les Moulineaux 1

2 Soutenance de thèse 2/12/2008 Plan Introduction Indexation de documents en santé Trois contextes Vers une indexation automatique Objectifs État de lart F-MTI, un extracteur multi-terminologique pour laide à lindexation Conception Évaluation Applications Discussion Conclusion et perspectives 2

3 Soutenance de thèse 2/12/2008 Introduction 3

4 Soutenance de thèse 2/12/2008 Principe « consiste à repérer des mots ou des expressions particulièrement significatifs (appelés termes) dans un contexte donné, et à créer un lien entre ces termes et le texte original. » 4 Document diabète de type 2 enfant santé publique épidémie obésite Etats-Unis Royaume-Uni épidemiologiques cours diagnostique France mal prévention Recherche dinformation Aide à la décision Statistique, budget, suivi médical du patient Indexation contrôlée Indexation de documents en santé Terminologies adaptées De qualité

5 Soutenance de thèse 2/12/2008 Trois contextes CISMeF ( le Catalogue et Index des Sites Médicaux Francophones ) Projet initié en 1995 (http://www, cismef.org) ~ ressources Web professionnels de santé, étudiants, patients Indexation manuelle à laide du MeSH 5 Diffusion dinformation sur les médicaments et aide à la prescription (société Vidal) Débuts en médicaments (RCP) Indexation manuelle à laide de 4 terminologies et bientôt du TUV Dossier Médicaux (travaux LERTIM) Réflexion depuis 1990 ~ 4 millions de comptes rendus hospitaliers (CRH) pour CHU de Rouen Indexation manuelle à laide de la CIM10, de la CCAM et bientôt de la SNOMED 3.5

6 Soutenance de thèse 2/12/2008 Cinq terminologies 6 MeSH (Me dical S ubject H eading ) TUV (T hésaurus U nifié V idal ) CIM10 (C lassification s tatistique I nternationale des M aladies et des problèmes de santé connexes 10 ème révision ) CCAM (C lassification C ommune des A ctes M édicaux ) SNOMED 3.5 (N omenclature S ystématique de M É decine humaine et vétérinaire version 3.5) UMLS (U nified M edical L anguage S ystem ) SNOMED 3.5 CIM10 TUV CCAM MeSH UMLS

7 Soutenance de thèse 2/12/2008 Vers une indexation automatique Indexation humaine, automatique ou semi- automatique : Semi-automatique : le compromis CritèresHumaineAutomatique Variabilité inter-indexeursélevéenon Synthèseouibas Problème dambiguïtébasélevé Connaissancesélevéesbasses Temps dindexationélevébas 7

8 Soutenance de thèse 2/12/2008 Objectifs Continuité de projets communs (CISMeF – Vidal – LERTIM) UMLF : Lexique médical unifié français (Ministère de la Recherche ACI 2002) VUMeF : Terminologies françaises et aide à lindexation (Ministère de la Recherche RNTS 2003) Faciliter lindexation des documents Concevoir des méthodes dindexation automatique Évaluer ces méthodes Proposer des applications pour CISMeF, Vidal et LERTIM 8

9 Soutenance de thèse 2/12/2008 État de lart 9

10 Soutenance de thèse 2/12/ A. Baneyx (SPIM) D. Nakache (CEDRIC) A. Névéol (CISMeF) A. Aronson (NLM) MTI MAIF Medckare CIREA ? Medsight ® SNOCODE ? MeSH TUV Indexation de comptes rendus SNOMED 3.5 CIM10 CCAM Indexation de sites Web Indexation de RCP Outils existants

11 Soutenance de thèse 2/12/2008 État de lart Indexation mono-terminologie directe CIREA (CIM10), MAIF (MeSH), Snocode (SNOMED 3.5) Indexation mono-terminologie indirecte (à partir dun transcodage) MedCKARe (ontologie pneumologie->CIM10), Indexation multi-terminologique Indexation directe et indirecte pour plusieurs terminologies (une seule terminologie considérée) MTI (UMLS) : indexation en MeSH et CIM9-CM 11 Terminologie 1 à indexer Terminologie 2 Lien de transcodage Terminologie 1 à indexer Terminologie 1 à indexer Lien de transcodage Terminologie X

12 Soutenance de thèse 2/12/2008 F-MTI, un extracteur multi-terminologique pour laide à lindexation 12

13 Soutenance de thèse 2/12/2008 F-MTI 13 Indexation multi-terminologique (inspiré de MTI) Indexation directe : CIM10, SNOMED, CCAM, MeSH, TUV Projection vers les terminologies désirées grâce aux transcodages (recherche de termes équivalents) Indexation multi-document : dépendante du type de document Traitement particulier des CRH, des sites médicaux et des RCP Indexation basique pour les autres documents (convertibles au format texte) Indexation multi-tâche : dépendante de la tâche à effectuer (règles dindexation) Paramétrable (terminologies à utiliser, terminologies en sortie)

14 Soutenance de thèse 2/12/2008 F-MTI 14 Termes MeSH, CCAM, SNOMED, TUV et CIM10 NOOJ + dico de constituants Restriction à (une ou plusieurs terminologies) Proposition dindexation à laide dune ou plusieurs terminologies Algo SDM Agrégation Un Document Un ensemble de documents (RCP, lettre de sortie, site Internet, ou autres convertis au format.txt) NOOJ + dico de termes Identification des rubriques, paragraphes et phrases + localisations Phrases Ensemble de phrases (corpus) Base de données multi- terminologique Post-traitement

15 Soutenance de thèse 2/12/2008 Base de données multi-terminologique Principe / Motivation Interrogation rapide des cinq terminologies Structure de données simple et générique contenant des terminologies de structure différente Méthode Modélisation de la structure de chaque terminologie Élaboration du modèle général à partir des modélisations unitaires (inspiré du metathesaurus de lUMLS) Base de données multi- terminologique 15

16 Soutenance de thèse 2/12/2008 F-MTI 16 Termes MeSH, CCAM, SNOMED, TUV et CIM10 NOOJ + dico de constituants Restriction à (une ou plusieurs terminologies) Proposition dindexation à laide dune ou plusieurs terminologies Algo SDM Agrégation Un Document Un ensemble de documents (RCP, lettre de sortie, site Internet, ou autres convertis au format.txt) NOOJ + dico de termes Identification des rubriques, paragraphes et phrases + localisations Phrases Ensemble de phrases (corpus) Base de données multi- terminologique Post-traitement

17 Soutenance de thèse 2/12/2008 Découpage en rubriques, paragraphes et phrases 17 Principe / Motivation Identifier les unités dindexation : les phrases Prise en compte du contexte (rubriques et paragraphes) Indexation du document = agrégation de lensemble des indexations pour toutes les phrases du document Méthode Découpage en phrase Découpage Découpage en rubriques Découpage en paragraphes Liste de noms de rubriques Balises, retour chariot etc… Transducteur NooJ Logiciel NOOJ (M, Silberztein)

18 Soutenance de thèse 2/12/2008 Découpage en rubriques, paragraphes et phrases 18 Exemple Antécédents11Ulcère gastrique opéré il y a 20 ans. Antécédents 12Tabagisme à 40 paquets/an. Antécédents 13Maladie d'Osler. Antécédents 14Arythmie complète par fibrillation auriculaire en 90, 94 et en EXAMEN CLINIQUE EXAMEN CLINIQUE 12Pouls à 70. EXAMEN CLINIQUE1352 kg. EXAMEN CLINIQUE 14Asymptomatique. EXAMEN CLINIQUE 15Bruits du cœur réguliers avec un souffle d'insuffisance mitrale résiduel 1 à 2/6ème maximal au foyer mitral. Antécédents Ulcère gastrique opéré il y a 20 ans. Tabagisme à 40 paquets/an. Maladie d'Osler. Arythmie complète par fibrillation auriculaire en 90, 94 et en EXAMEN CLINIQUE : Pouls à kg. Asymptomatique. Bruits du cœur réguliers avec un souffle d'insuffisance mitrale résiduel 1 à 2/6ème maximal au foyer mitral.

19 Soutenance de thèse 2/12/2008 Création de libellés dindexation Principe / Motivation 3 méthodes de TAL basées sur les libellés des termes Libellés de chaque terme non élaborés à lorigine pour faciliter leur indexation Exemple : « angine, sans autre précision » Méthode Création de libellés dindexation Application à la CIM10 Élimination des expressions « sans précision » « sans autre indication » Élimination des exclusions Création de 2 libellés dindexation pour les alternatives en « ou » Traitement des précisions entre parenthèses 19

20 Soutenance de thèse 2/12/2008 F-MTI 20 Termes MeSH, CCAM, SNOMED, TUV et CIM10 NOOJ + dico de constituants Restriction à (une ou plusieurs terminologies) Proposition dindexation à laide dune ou plusieurs terminologies Algo SDM Agrégation Un Document Un ensemble de documents (RCP, lettre de sortie, site Internet, ou autres convertis au format.txt) NOOJ + dico de termes Identification des rubriques, paragraphes et phrases + localisations Phrases Ensemble de phrases (corpus) Base de données multi- terminologique Post-traitement

21 Soutenance de thèse 2/12/2008 Lalgorithme du sac de mots 21 Principe / Motivation Utilisé à lorigine dans CISMeF pour retranscrire les requêtes des utilisateurs en termes MeSH Phrase considérée comme un sac de mots (les plus signifiants) rendus à leur forme la plus simple (lemme ou stème) Termes des différentes terminologies (TUV, SNOMED, MeSH, CIM10, CCAM) considérés comme des sacs de mots Algorithme revu pour lindexation de documents

22 Soutenance de thèse 2/12/2008 Lalgorithme du sac de mots 22 Désuffixation ou lemmatisation Rangement (ordre alphabétique) Méthode de lalgorithme du sac de mots Normalisation (ponctuation, minuscules…) Découpage en mots Mise en correspondance avec les termes des différentes terminologies Élimination des mots vides et mots non pertinents Sémiographe (Memodata ®) Frenchstemmer (Lucene) Base de données multi- terminologique

23 Soutenance de thèse 2/12/2008 Lalgorithme du sac de mots 23 Ulcère gastrique opéré il y a 20 ans. ulcère gastrique opéré il y a 20 ans ulcère gastrique opéré 20 ans 20;an;gastrique;opérer; ulcère ou 20;an;gastric;opér; ulcèr + ajouts selon la rubrique rattachée (antécédent ou anteced) Toutes les combinaisons sont générées : 20;an;gastrique;opéré; ulcère an;gastrique;opéré; ulcère gastrique;opéré; ulcère an;gastrique;opéré etc… Et comparées aux termes des différentes terminologies traités de la même façon ulcère gastriquePE1192TUV;gastrique;ulcère;;gastric;ulcer; ulcère gastriqueD013276MSH;gastrique;ulcère;;gastric;ulcer; ulcère gastriqueD SNMI;gastrique;ulcère;;gastric;ulcer; Résultats : Exemple : Lemmatisation Désuffixation

24 Soutenance de thèse 2/12/2008 Lalgorithme du sac de mots 24 Avantages / Inconvénients Méthode simple nécessitant peu de ressources Ordre des mots non important (erreurs possibles) Méthode pour le moment limitée Gestion des termes complexes et des négations difficile

25 Soutenance de thèse 2/12/2008 F-MTI 25 Termes MeSH, CCAM, SNOMED, TUV et CIM10 NOOJ + dico de constituants Restriction à (une ou plusieurs terminologies) Proposition dindexation à laide dune ou plusieurs terminologies Algo SDM Agrégation Un Document Un ensemble de documents (RCP, lettre de sortie, site Internet, ou autres convertis au format.txt) NOOJ + dico de termes Identification des rubriques, paragraphes et phrases + localisations Phrases Ensemble de phrases (corpus) Base de données multi- terminologique Post-traitement

26 Soutenance de thèse 2/12/ Le dictionnaire de termes Motivation Inspiré de lapproche TAL de MAIF (A.Névéol) Variantes validées en amont Contient les différentes formes textuelles des termes : leurs dérivations (ex : asthme - asthmatique), exions (ex : bactérie - bactéries) et synonymes Méthode très rapide Possibilité de gérer les termes complexes et la négation Principe Format DELA ( D ictionnaires E lectroniques du LA DL*) FormeTextuellePossibleDuTerme,LibelléDuTerme,InformationsDivers Application NOOJ 26 *Laboratoire d'Analyse et de Description Linguistique

27 Soutenance de thèse 2/12/ Le dictionnaire de termes Exemple 27 Ulcère gastrique opéré il y a 20 ans. Dictionnaire de termes ulcère gastrique,Ulcère gastrique,TUV ulcères gastriques,Ulcère gastrique,TUV ulcère de lestomac,Ulcère gastrique,TUV ulcère gastrique,Ulcère gastrique,MSH ulcères gastriques,Ulcère gastrique,MSH ulcère de lestomac,Ulcère gastrique,MSH ulcère gastrique,Ulcère gastrique,SNMI ulcères gastriques,Ulcère gastrique,SNMI ulcère de lestomac,Ulcère gastrique,SNMI ulcère gastrique,Ulcère gastrique,EII2048+TUV ulcère gastrique,Ulcère gastrique,D MSH ulcère gastrique,Ulcère gastrique,D SNMI

28 Soutenance de thèse 2/12/ Le dictionnaire de termes 28 Constitution manuelle dun dictionnaire = fastidieux Méthode de construction automatique de dictionnaires Reprise de lexistant Variantes des différentes terminologies Variantes provenant de précédents travaux (UMLF, dictionnaire MeSH de MAIF, lexiques du projet VUMeF)

29 Soutenance de thèse 2/12/ Construction automatique de dictionnaires Recueil automatique de nouvelles variantes Extraction de variantes à partir de corpus Utilisation de patrons dextraction et dun dictionnaire de mots Création de nouvelles variantes (pluriels et singuliers) 29 Exemple : « diminution des facteurs de coagulation » Application au TUV Création de transducteurs liés à un dictionnaire variantes de mots Corpus de documents : recueillies dont pour le TUV (validation à 55%) Création de pluriels/singuliers (validation à 92,3%)

30 Soutenance de thèse 2/12/2008 Prise en compte du contexte 30 Négations Négation verbale Négation postérieure Négation antérieure

31 Soutenance de thèse 2/12/2008 F-MTI 31 Termes MeSH, CCAM, SNOMED, TUV et CIM10 NOOJ + dico de constituants Restriction à (une ou plusieurs terminologies) Proposition dindexation à laide dune ou plusieurs terminologies Algo SDM Agrégation Un Document Un ensemble de documents (RCP, lettre de sortie, site Internet, ou autres convertis au format.txt) NOOJ + dico de termes Identification des rubriques, paragraphes et phrases + localisations Phrases Ensemble de phrases (corpus) Base de données multi- terminologique Post-traitement

32 Soutenance de thèse 2/12/2008 Le dictionnaire de constituants 32 Principe / Motivation Prendre en compte les éléments constitutifs du terme et non les mots seuls ou le terme dans sa globalité Un constituant est déni comme toute variante incluse dans un terme, Ex : le terme « angine de poitrine sévère » comprend plus de 6 constituants : « angine », « angines », « poitrine », « sévère », « aigu », « angor » etc… Un terme est indexé si la phrase couvre lensemble des constituants requis (calcul dun score) Application NOOJ

33 Soutenance de thèse 2/12/2008 Le dictionnaire de constituants 33 Exemple « Le patient est atteint dun syndrome sévère, le syndrome de Down accompagné dasthme. » syndrome, syndrome de Down, 1+TUV syndrome, syndrome de X, 1+TUV syndrome, syndrome de Down,1+TUV syndrome, syndrome de X, 1+TUV down, syndrome de Down, 1+TUV asthme, asthme,1+TUV Après élimination des doublons et ajout des scores pour chaque termes : – 2 pour « syndrome de Down » – 1 pour « syndrome de X » – 1 pour « asthme » syndrome de Down2 syndrome de X 2 Asthme1 Dictionnaire de constituantsBase de données multi-terminologique Seuls les termes « syndrome de Down » et « asthme » sont indexés

34 Soutenance de thèse 2/12/2008 F-MTI 34 Termes MeSH, CCAM, SNOMED, TUV et CIM10 NOOJ + dico de constituants Restriction à (une ou plusieurs terminologies) Proposition dindexation à laide dune ou plusieurs terminologies Algo SDM Agrégation Un Document Un ensemble de documents (RCP, lettre de sortie, site Internet, ou autres convertis au format.txt) NOOJ + dico de termes Identification des rubriques, paragraphes et phrases + localisations Phrases Ensemble de phrases (corpus) Base de données multi- terminologique Post-traitement

35 Soutenance de thèse 2/12/ Projection et restriction vers une ou plusieurs terminologies Principe Restriction aux termes équivalents appartenant aux terminologies désirées Méthode Les différents transcodages utilisés : MeSH, CIM10, SNOMED : UMLS et SFINM* CCAM->MeSH créé par CISMeF (P. Massari et B. Thirion) CIM10->CCAM de TOTHEM (enlevé) TUV->MeSH créé par CISMeF et validé par Vidal (enlevé) TUV->CIM10 créé par Vidal (enlevé) *Secrétariat Francophone International de Nomenclature Médicale

36 Soutenance de thèse 2/12/2008 Projection et restriction vers une ou plusieurs terminologies Exemple : « Ulcère gastrique opéré il y a 20 ans. » ulcère gastriquePE1192TUV ulcère gastriqueD013276MSH ulcère gastriqueD SNMI Résultats Indexation directe : ulcère de l'estomac | non précisé comme étant aiguK25.9CIM10 ou chronique, sans hémorragie ni perforation ulcère gastrique sans hémorragie ni perforationD SNMI ou obstruction estomacD013270MSH tumeur maligne estomac, sans précisionC16.9CIM10 Résultats Indexation indirecte : 36

37 Soutenance de thèse 2/12/ Post-traitements Élimination des doublons (mêmes termes ou un terme et son synonyme de la même terminologie) Application des règles dindexation Règles générales Indexation au plus précis : père/fils, termes dont le sac de mots est inclus dans un autre Règles spéciques à chaque terminologie MeSH : élimination des termes peu pertinents, appariement terme/qualificatif, élimination des qualificatifs non appariés Aucune pour CCAM/TUV/SNOMED 3.5/CIM10 Proposition dindexation à laide dune ou plusieurs terminologies Post-traitement

38 Soutenance de thèse 2/12/2008 Évaluation de lindexation de termes CIM10 et CCAM pour les dossiers patients 38 Méthode Comparaison de lindexation automatique (F-MTI - algorithme du sac de mots) et lindexation medico-économique ou descriptive manuelle Matériels Corpus de 794 CRH du CHU de Rouen 490 de Cardiologie 304 de Pneumologie Indexation manuelle médico-économique CCAM et CIM10 Corpus de 100 CRH 50 de Cardiologie 50 de Pneumologie Indexation descriptive par un expert (en aveugle) Mesures Précision (inverse du bruit), rappel (inverse du silence), F-mesure

39 Soutenance de thèse 2/12/2008 Évaluation de lindexation de termes CIM10 et CCAM pour les dossiers patients Résultats Cardiologie Pneumologie 794 CRH 100 CRH + diagnostics ou symptômes Pneumologie + diagnostics ou symptômes 39 Restriction des termes Cardiologie 51,375,4 Précision % Rappel % 3,429,7 15,476,4 4,019,9 3,035,7 41,096,1 39,397,5 Indexation médico-économique Indexation descriptive Précision % Rappel % F-mesure % Précision % Rappel % F-mesure % 2,638,04,93,732,95,8

40 Soutenance de thèse 2/12/2008 Évaluation de lindexation de termes CIM10 et CCAM pour les dossiers patients Discussion Précision faible Problème des contextes (négations, proche concerné) Problème des transcodages Problème du nombre de termes proposés –> difficultés à déterminer ce qui est important Rappel faible Problème de la rédaction des CRH (manque précision, abréviations etc.) Dispersion des informations Méthode dévaluation discutable 18% de consensus inter indexeur Peu de formation à lindexation Restriction spécialité/diagnostic/symptôme : différentes vues pour lindexation semi-automatique CCAM résultats ~0% (F-MTI inadapté) 40

41 Soutenance de thèse 2/12/2008 Évaluation de lindexation de termes SNOMED pour les dossiers patients Principe Comparaison de deux indexations automatiques SNOMED : F-MTI et Snocode Difficulté dobtenir une référence manuelle (indexation manuelle fastidieuse) Choix dun transcodage vers une terminologie moins complexe : CIM10 Matériel 100 CRH indexés manuellement à laide de la CIM10 41

42 Soutenance de thèse 2/12/2008 Évaluation de lindexation de termes SNOMED pour les dossiers patients Résultats 42 SNOMED CIM10 transcodage F-MTI extrait 2 fois plus de codes que Snocode Pourcentage de codes F-MTI couvrant les codes Snocode 29,9 Pourcentage de codes Snocode couvrant les codes F-MTI 51,5 Mesure de Hooper % 31,3 Précision % Rappel % F-mesure % F-MTI4,430,78,7 Snocode6,124,79,8

43 Soutenance de thèse 2/12/2008 Évaluation de lindexation de termes MeSH pour les sites Web Principe Comparaison entre lindexation automatique (F-MTI) pour les titres et lindexation manuelle (indexeurs CISMeF) de la ressource Matériel Corpus CISMeF ( ressources) indexé manuellement par quatre indexeurs CISMeF 43

44 Soutenance de thèse 2/12/2008 Évaluations F-MTI DésuffixationF-MTI Lemmatisation (%) Précision – Rappel Termes dindexation Tous 25,9 - 13,5Tous 26,7 - 13,1 44 F-MTI Mono-terminoF-MTI Multi-termino Termes dindexation MC/Q Tous 29,4 - 13,0Tous 25,9 - 13,5 Descripteurs MC Tous 37,7 - 21,3 Enseign 43,7 - 17,9 Recos 51,6 - 24,7 Patient 42,4 - 27,5 Tous 35,5 - 23,1 Enseign 39,9 - 18,7 Recos 44,4 - 25,7 Patient 38,3 - 27,8 Lemmatisation/Désuffixation sous-analyse des variantes sur-analyse des termes Évaluation secondaire (1 000 ressources) : Peu pertinent : 15,9%, pertinent : 4,5%, impact négatif : 79,6% Mono/Multi-terminologie

45 Soutenance de thèse 2/12/2008 Évaluation de lindexation de termes TUV pour les RCP Principe Évaluation du dictionnaire de terme (approche mono-teminologique) Comparaison de lindexation automatique de F-MTI avec lindexation manuelle de léquipe du Vidal Matériels Corpus de RCP indexés manuellement à laide des quatre thésauri Vidal Réalisation de la table de transcodage anciens thésauri – TUV Transcodage en TUV 45

46 Soutenance de thèse 2/12/2008 Évaluation de lindexation de termes TUV pour les RCP Résultats 46 Rubriques concernéesPrécision %Rappel % Indications48,121,7 Contre-indications46,123,5 Effets secondaires77,059,4 Précautions demploi28,449,3 Total des 4 rubriques52,946,2 Total (non prise compte des rubriques) 57,643,4 Terminologie en adéquation avec les documents indexés Insuffisance des variantes répertoriées dans le dictionnaire Conversion des documents pdf en txt (titres, tableaux)

47 Soutenance de thèse 2/12/2008 Applications Indexation automatique de ressources Web Indexation automatique des ressources 2006 : F-MTI mono-terminologique ( ressources) Indexation semi-automatique des ressources Interprétation des requêtes Vers une recherche dinformation multi-terminologique Application concrète dans le PIM de CISMeF (Classification ATC, codes CAS, CIS, CIP en place) 2009 : F-MTI multi-terminologique (Autres terminologies) Indexation automatique de dossiers patients Recherche dinformation Aide au codage médico-économique Structuration des dossiers Production de résumés Aide à la rédaction 47

48 Soutenance de thèse 2/12/2008 Applications Indexation semi-automatique de RCP : BIBLIS (IMAG) 48 RCP Indexation Automatique F-MTI Indexation manuelle Documents proches

49 Soutenance de thèse 2/12/2008 Applications Outil daide à lindexation généraliste 49 Serveur multi-terminologique Indexation multi-terminologique manuelle Indexation multi-terminologique automatique Type de document Document Quelques fonctionnalités supplémentaires

50 Soutenance de thèse 2/12/2008 Discussion 50

51 Soutenance de thèse 2/12/2008 Discussion Résultats dévaluation différents selon : la tâche dindexation la terminologie le corpus le type de document au sein du corpus les rubriques au sein du document Aide au transcodage 51

52 Soutenance de thèse 2/12/2008 Discussion Aide au transcodage 52 Comment tendre vers une indexation de qualité? : Amélioration des terminologies et développement de règles dindexation (terminologues) Formation à lindexation, apprentissage des terminologies utilisées, et développement de règles dindexation pour les tâches visées (indexeurs) Rédaction adaptée (auteurs de documents devant être indexés) Développement doutils daide à lindexation et à la rédaction automatiques plus performants (informaticiens)

53 Soutenance de thèse 2/12/2008 Discussion Publications et valorisation Pereira S., Névéol A., Kerdelhué G., Serrot E., Joubert M., Darmoni S.J. Using multi-terminology indexing for the assignment of MeSH descriptors to health resources in a french online catalogue. AMIA Annu Symp Proc. 2008; Pereira S., Névéol A., Massari P., Joubert M., Darmoni S.J. Construction of a semi-automated ICD-10 coding help system to optimize medical and economic coding, Proceedings of MIE2006. Stud Health Technol Inform, 2006 ;124 : Pereira S., Massari P., Joubert M., Darmoni S. Utilisation de métatermes pour la recherche dinformation dans les dossiers médicaux. In Actes des journées Francophones dInformatique Médicale Pereira S., Massari P., Buemi A., Dahamna B., Serrot E., Darmoni S., Joubert M. F-MTI : un outil dindexation automatique : application à lindexation autmoatique de la SNOMED Internationale. Soumis à JFIM

54 Soutenance de thèse 2/12/2008 Discussion Publications et valorisation Massari P., Pereira S., Thirion B., Derville A., Darmoni S.J. Use of super– concepts to customize electronic medical records data display. Stud Health Technol Inform ; 136 :845–850. Merabti T., Pereira S., Lecroq T., Joubert M., Darmoni S.J. Inheritance of SNOMED CT relations between concepts to two health terminologies (SNOMED International and ICD10). Proceedings of the 3rd international conference on Knowledge Representation in Medicine (KR-MED) ;118. Merabti T., Pereira S., Letord C., Lecroq T., Dahamna B., Joubert M., Darmoni J. Searching Related Resources in a Quality Controlled Health Gateway : a Feasibility Study. Proceedings of MIE2008, Stud Health Technol Inform, Volume 136, Pages 235–240, 2008 Névéol A., Pereira S., Kerdelhué G., Dahamna B., Joubert M., Darmoni S.J. Evaluation of a simple method for the automatic assignment of MeSH descriptors to health resources in a french online catalogue. Proceedings of Medinfo2007, Stud Health Technol Inform ; 129 : Névéol A., Pereira S., Soualmia F.F., Thirion B., Darmoni S.J. A method of cross-lingual consumer health information retrieval. Proceedings of MIE2006, Stud Health Technol Inform ; 124 :601–608. Pereira S., Névéol A., Massari P., Darmoni S., Joubert M. Evaluation de plusieurs terminologies médicales pour optimiser laide au codage médico- économique par analyse automatique de dossiers électroniques de patients. In Acte EMOI Valorisation à luniversité - Infobutton 53

55 Soutenance de thèse 2/12/2008 Conclusion et Perspectives 54

56 Soutenance de thèse 2/12/2008 Conclusion Notre contribution : Base de données multi-terminologique Création de libellés dindexation Trois méthodes dindexation complémentaires Méthode de création automatique de dictionnaires Prise en compte des contextes Outil dindexation automatique multi- terminologique (F-MTI) 55

57 Soutenance de thèse 2/12/2008 Perspectives Amélioration de loutil Coopération des 3 méthodes Amélioration des transcodages Prise en compte dautres contextes Implémentation de règles médicales Implémentation des méthodes de Metamap (MTI) 56

58 Soutenance de thèse 2/12/2008 Perspectives Aide au transcodage 57 CISMeF Passage dune stratégie mono-terminologique à une stratégie multi-terminologique Nouvelles voies de recherche : Interopérabilité sémantique inter et intra-terminologies (T. Merabti 2A) Recherche dinformation multi-terminologique dans un portail de santé (S. Sakji 2A) Recherche dinformation multi-terminologique dans un dossier patient électronique (A.D. Diriehdibad 1A) Vidal Aide à lindexation TUV avec BIBLIS Exploitation dautres terminologies pour des alertes toujours plus performantes LERTIM Nouveau pas vers lélaboration dun SIH performant Poursuite des travaux avec T. Merabti, S. Sakji, A.D. Diriehdibad

59 Soutenance de thèse 2/12/2008 Perspectives Aide au transcodage 58 Vers dautres projets communs InterSTIS : Interopérabilité sémantique des terminologies dans les systèmes dinformation de santé français (ANR TecSan 2007) SMTS : Serveur Multi-Terminologique en Santé PSIP : optimisation de la prescription informatisée (7ème PCRD) ALADIN-DTH : Assistant de Lutte Automatisé et de Détection des Infections Nosocomiales à partir de Documents Textuels Hospitaliers (ANR TecSan 2008)

60 Soutenance de thèse 2/12/2008 Remerciements Léquipe scientifique Vidal : Elisabeth, Mathilde, Josiane, Sophie, Francine, Olivier, Michelle, Blandine, Nicolas, Ghislaine, Gismonde, Jean-François Léquipe CISMeF & TIBS : Josette, Gaëtan, Catherine, Benoît, Saoussen, Tayeb, Yvan, Badisse, Philippe, É lise, Thierry, Aurélie et Stefan Léquipe du LERTIM : Michel Joubert, Mario Fieschi, Paul Avillach Les intervenants extérieurs : Antoine Buemi, Max Silberztein, Gaëlle Lortal et Lina Soualmia 59

61 Soutenance de thèse 2/12/2008 Remerciements ET VOUS ! 60 THE END To be continued …


Télécharger ppt "Soutenance de thèse 2/12/2008 Indexation multi-terminologique de concepts en santé Suzanne Pereira Encadrée par : É lisabeth Serrot, Michel Joubert et."

Présentations similaires


Annonces Google