Journée RIMO du WEB Intelligence

Slides:



Advertisements
Présentations similaires
L'interopérabilité dans l'innovation 2
Advertisements

IREMIA : Institut de REcherche en Mathématiques et Informatique Appliquées Université de la Réunion Uniformisation des mécanismes de conception de SMA.
Corese Moteur de recherche sémantique pour RDF
1 Semantic Web Olivier Corby. 2 Semantic Web Évolution du Web pour permettre le traitement automatique des informations (par programme) Documents structur.
Les supports de vocabulaires pour les systèmes de recherche d’information orientés précision : application aux graphes pour la recherche d’information.
Thésaurus juridique, catégorisation de textes
Diagram-Based Techniques
Indexation vidéo Indexation multimédia
Bernard Blandin1 Dispositifs techniques: les évolutions perceptibles.
Nicolas Zlatoff - Stage de DEA Sous la direction de Bruno Tellez
Par Aline Mahot et Charlyne Routier
Indexation textuelle : Systèmes de recherche d’informations
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Traces d'Interaction au sein d'un Environnement de Collaboration
ARC RAPSODIS Reconnaissance Automatique de la Parole Suivie et Orientée par Des Informations Syntaxico-Sémantiques PAROLE – METISS – TALARIS – TEXMEX –
Exploitation du modèle holonique dans un cadre combinant IAD et IHM
Web Sémantique: Le Relief Actuel
Représentation du Thésaurus MeSH et de la Terminologie CISMeF en OWL
Annotations sémantiques pour le domaine des biopuces
Olivier CANTIN, Tassadit AMGHAR, Bernard LEVRAT
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
Reconnaissance Vocale
Web sémantique : Web de demain
IFT6255 – Recherche d’information Jian-Yun Nie
Les techniques des moteurs de recherche
1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
Bases conceptuelles de l’enseignement par simulation
Université M’Hamed Bougara de Boumerdes
Similarité Belkhir Abdelkader Laboratoire LSI USTHB
Séminaire 10 Juin 2008 Pervasive Learning Network : P-LearNet Institut TELECOM.
Approche Big Data et Web Sémantique pour la fouille et la classification automatique de données Web Ces travaux sont effectués dans le cadre d’un partenariat.
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
E-Technology lab Plateformes, Technologies et Architectures pour les systèmes eGouvernement Par: Dr Mamadou Koné Université Laval, Québec, Canada et Houda.
Exposé du 26/03/2010 Michaël Le Clerc & Nicolas Le Texier Mires Un intergiciel pour les réseaux de capteurs.
F. Pettigrew Télé-université 1 Comment réussir la médiatisation d'un cours à distance ? Audioconférence de la Table pédago-technologique du REFAD 20 novembre.
1 BDs Orientées Objets Witold LITWIN. 2 Pourquoi ? F Les BDs relationnelles ne sont pas adaptées aux applications CAD/CAM, cartes géo... F le problème.
Web sémantique Par Lydia Carine Mampais KI Bamba SISSOKO
MEMOIRE INDUSTRIEL ESIEA
Martine Toussaint Desir
Algorithmes pour le web “A Unified Approach to Personalization Based on Probabilistic Latent Semantic Models of Web Usage and Content”
Moteurs de recherche ontologiques
Improving large-scale search engines with semantic annotations Damaris Fuentes-Lorenzo, Norberto Fernández, Jesús A. Fisteus, Luis Sánchez.
Dominique LAURENT Patrick SEGUELA
Recherche d’information
10 juin 2008 Journée Technologies et Enjeux de l'Apprentissage Mobile Equipe SIMBAD.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
Reconnaissance de visage par vidéo
David COLL Université de Genève 19 novembre 2008.
Les principales approches d’organisation et D’accès aux ressources électroniques sur le Web Lalthoum Saàdani EBSI - Université de Montréal 32 è congrès.
Journée des doctorants 2005 ENST-Bretagne, Brest juin 2005
SCI6304 – Bibliométrie et communication savante Cours 1 Introduction
Récupération par projection de ressources langagières Par Youssef BOUOULID IDRISSI 10 Avril 2003 Cours IFT6010 Université de Montréal Département d’informatique.
TEXT MINING Fouille de textes
JDD 2005 Utilisation et Constitution de Ressources Sémantiques pour la Recherche d'Informations Précises. Vincent Barbier, groupe LIR Langues, Information.
Le Traitement Automatique des Langues (TAL)
UNDP Regional Bureau for Africa MDG-based national Development Planning Training Workshop HIV/AIDS Assessments 10 March, 2006 Niger.
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Consolidation de grands réseaux lexicaux
IndexationIndexation sémantique de documents XMLsémantiqueXML Haïfa ZARGAYOUNA Laboratoire LIMSI/CNRS Groupe Architectures et Modèles pour l'Interaction.
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
R ETOURS SUR LE PROJET DISTIL ET PERSPECTIVES 2011 Sylvie Ranwez Gérard Dray.
Introduction à la Recherche
Un modèle flexible d'édition intelligente de documents structurés basé sur des techniques de "chart-parsing" Marc Dymetman Exposé LIMSI, 14 déc
Design et fabrication de kit constructif Sciences et Technologies de l’Information et de la Communication Master of Science in Learning and Teaching Technologies.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
Master EISIS – Michel JOUBERT – LERTIM, Faculté de Médecine, Marseille UMLS « Unified Medical Language System » U.S. National Library of Medicine.
Transcription de la présentation:

Journée RIMO du WEB Intelligence Utilisation de l’UMLS dans un modèle de recherche d’information basé sur réseau bayesien de concepts Journée RIMO du WEB Intelligence Thi Hoang Diem LE

Plan Introduction Utilisation de ressources externes dans RI UMLS Un modèle d’indexation conceptuelle basé sur réseau Bayesien Utilisation de connaissance du problème pour améliorer la performance de RI Évaluation Application dans la recherche d’images médicaux Conclusion et perspective

Introduction Indexation Information Model bayesien des concepts Par termes simple Morphologique Grammaticale Syntaxique + précise Par multi-termes Par syntagmes + synonyme Ontology, thésaurus… Par concepts UMLS +multilingual + liens sémantiques Model bayesien des concepts - mismatch

Utilisation de ressources externes dans RI et RI multilingue Les types des resources Vocabulaire contrôlé Taxonomie Thésaurus Ontologie Utilisation de ressources externes dans RI et RIM Conceptuelle indexation (Gonzalo[1],…,Baziz[2], Loïc[3]) Expansion de la requete ou des documents (Voorheer[4], Rila[5],…) Change de la nature des documents et de la requête Risque d’ajouter des termes inutiles Mesures des similarités sémantiques (Leacock[6], Hirst[7], Resnik[8], Jiang[9], Lin[10],…)

UMLS (Unified Medical Language System ) NLM (National Library of Medicine) 1986 Objectives: Combiner différentes ressources dans le domaine biomedical (140). Faciliter les tâche des systèmes d’information (accès, recherche, intégrer, ...) Multilingual(17) Components: Metathesaurus (>1.1 million concepts) Semantic Network SPECIALIST lexicon Natural Language Processing tools

Structure de l’UMLS Réseau sémantique Méta thésaurus Sources ... SUI4 STY1 STY4 Type sémantique Concept Termes Strings Sources AUI5 AUI3 AUI4 AUI6 AUI1 SUI1 SUI2 SUI3 SUI5 LUI3 LUI4 LUI5 LUI2 CUI1 CUI2 CUI3 STY2 CUI4 STY3 CUI5 LUI1 AUI7 SUI6 ICD-9CM SNOMED AUI2 MESH NCI Atoms Méta thésaurus Réseau sémantique ...

Le schéma général du processus de RI Proposition d’un modèle d’indexation conceptuelle basé sur réseau Bayesien Le schéma général du processus de RI Requête (concepts) Requête (texte) Extraction de concepts Documents (concepts) Documents (texte) UMLS d1 d2 dn d1 d2 dn c1 c2 cj q … ck … Extraction de Relations sémantiques c1 c2 cj … cj ck q Documents retrouvés Prosessus d’inférence

Proposition d’un modèle d’indexation conceptuelle basé sur réseau Bayesien (cont.) Reseau bayesien: graphe acyclique oriente Réseau de documents Nœuds : concepts Arcs: index Réseau de la requete Liens entre les concepts: relations sémantiques d2 d1 dn … c1 c2 ci … cj ck q

Proposition d’un modèle d’indexation conceptuelle basé sur réseau Bayesien(cont.) Processus de d’inférence Initiation de la probabilité antérieure: un document dk est observé: P(dk)=1 dk d2 d1 … c1 c2 cn … 2. Inference de la probabilité entre les concepts cj cm 3. La probabilité postérieure ou la croyance de la requête q

Body Location or Region Utilisation de connaissance du problème pour améliorer la performance de RI Les types de connaissances importantes (Lin[11]): Connaissance sur la tâche d'utilisateur Connaissance sur le problème Connaissance du domaine Procedures (Modality) Disorders (Pathology) Groupes Sémantiques Anatomy T029 Body Location or Region T060 Diagnostic Procedure T047 Disease or Syndrome Concepts C0817096 C0040405 C0034067 “Show me Chest CT of emphysema ” PK inclusion PK intersection

Évaluation La collection CLEF images médicales Anglais, Français, Allemand 50.026 documents 30 requêtes Résultats: Comparaison entre modèle vectoriel avec termes(MVT) et avec concepts(MVC) Comparaison entre MVC et MVC utilisant de connaissance du problème Comparaison entre MVC et modèle d’indexation conceptuelle basé sur réseau Bayesien(RB) Application dans la recherche d’images médicaux Exemple: « Show me images of a knee x-ray. Zeige mir Röntgenbilder des Knies. Montre-moi des radiographies du genou. »

Comparaison entre modèle vectoriel avec termes(MVT) et avec concepts(MVC) CLEFMed2006 Avec termes Avec concepts

Comparaison entre MVC et MVC utilisant de connaissance du problème CLEFMed2006

Comparaison entre MVC et modèle d’indexation conceptuelle basé sur réseau Bayesien(RB) CLEFMed2007

Application dans la recherche d’images médicaux Image Retrieval Engine Text Retrieval Image Text Query Retrieved Documents UMLS concepts Mapping Learn & classify from image features Fusion Re-weighting

Conclusion et perspective Modèle de RI qui capable d'améliorer la qualité des index ainsi que la correspondance entre les documents et la requête. Expérimentation a prouvé les avantages de: utiliser des concepts au lieu des termes à l'aide d'une ressource externe. prendre en compte les liens sémantiques entre concepts dans la requête et ceux dans les documents dans un modèle à base de réseau Bayesien. d'exploiter des connaissances dans une ressource externe pour améliorer la performance de la recherche via une fonction sur le RSV Une fusion pour la RI multi-modalité qui permet un meilleur recherche que la RI mono-modalité. Perspective Typage des relations sémantiques et leur poids

Références Julio Gonzalo, Felisa Verdejo, Irina Chugur, and Juan Cigarran. Indexing with wordnet synsets can improve text retrieval. In Proceedings of the COLING/ACL '98 Workshop on Usage of WordNet for NLP, pages 3844, Montreal,Canada, 1998. Mustapha Baziz, Mohand Boughanem, and Nathalie Aussenac-Gilles. Conceptual indexing based on document content representation. In CoLIS, pages 171186, 2005. L. Maisonnasse, Les supports de vocabulaires pour les systèmes de recherche d'information orientés précision : application aux graphes pour la recherche d'information médicale, Ph.D. thesis, Université Joseph Fourier, 2008. Ellen M. Voorhees. Query expansion using lexical-semantic relations. In SIGIR '94 : Proceedings of the 17th annual international ACM SIGIR conference on Research and development in information retrieval, pages 6169, New York, NY, USA, 1994. Springer-Verlag New York, Inc. Rila Mandala, Takenobu Tokunaga, and Hozumi Tanaka. Combining multiple evidence from dierent types of thesaurus for query expansion. In Research and Development in Information Retrieval, pages 191197, 1999. Claudia Leacock and Martin Chodorow. Combining local context and wordnet similarity for word sense identication. An Electronic Lexical Database, pages 265283, 1998. G. Hirst and D. St-Onge. Lexical chains as representation of context for the detection and correction malapropisms, 1997. Philip Resnik. Semantic classes and syntactic ambiguity. In HLT '93 : Proceedings of the workshop on Human Language Technology, pages 278283, Morristown, NJ, USA, 1993. Association for Computational Linguistics. Jay J. Jiang and David W. Conrath. Semantic similarity based on corpus statistics and lexical taxonomy, 1997. Dekang Lin. An information-theoretic denition of similarity. In Proc. 15th International Conf. on Machine Learning, pages 296304. Morgan Kaufmann, Bibliographie 118 San Francisco, CA, 1998. Jimmy Lin and Dina Demner-Fushman. The role of knowledge in conceptual retrieval : a study in the domain of clinical medicine. In SIGIR '06 : Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval, pages 99106, New York, NY, USA, 2006. ACM Press.