Vers une génération automatique du mapping de sources biomédicales

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

Automatisation des processus dans IIJCan par François HARVEY (Programmeur-analyste)
Xavier Blanc Web Services Xavier Blanc
Thème 3 : plate-forme de modélisation et de gestion de référentiels XML étapes modélisation des structures (UML) gestion du référentiel de modélisation.
Le developpement web  Préparé par : ASSAL Lamiae JAMALI Zakarya
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Yann Chevaleyre et Jean-Daniel Zucker
Ontologie, Méta-données, Sémiotiques
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
Présentation Mars 2007 Organet II: service de gestion du déroulement des épreuves dans les établissements centres d’examen Organet II est un produit pour.
TP 3-4 BD21.
METHODES DE SIMULATION DE LA VITESSE DU VENT
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Réalisation d’un site Internet pour la mairie de Pinsaguel
Un système de médiation basé sur les ontologies
Etude des Technologies du Web services
ST40 – Stage Professionnel
Web Sémantique: Le Relief Actuel
DURIBREUX, Michèle & COCQUEBERT & HOURIEZ, Bernard,
Annotations sémantiques pour le domaine des biopuces
Olivier CANTIN, Tassadit AMGHAR, Bernard LEVRAT
Le portail des MSH
ASP.NET Par: Hugo St-Louis. C ARACTÉRISTIQUES A SP. NET Évolution, successeur plus flexible quASP (Active Server Pages). Pages web dynamiques permettant.
Séminaire Normes et Standards 10 octobre 2003 L'école du futur dès aujourd'hui.
XML: Syntaxe XML, DTD et Schémas
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
La problématique de la recherche de document Journée de formation 29 février 2008.
Thème 8 : l'observation et l'expérimentation
An Introduction to distributed applications and ecommerce 1 1 Les services Web, XML et les places de marchés.
OPTIMA, 6 novembre 2008, BnF 1 un outil daide à la transcription Thomas PALFRAY Stéphane NICOLAS Thierry PAQUET L aboratoire d I nformatique, T raitement.
Réalité virtuelle et Représentation de Données Complexes
1. Représentation des informations
L’évaluation des compétences Exemple Gestion & Finance
Bases de données phénotypique et ontologie
Isabelle Kervella - Mastère ISIC1 Méta-calendrier automatique pour portail www Projet d’ingénierie Mars 2002.
Les logiciels de gestion bibliographique
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels
Présentation du projet edot Revue intermédiaire - 29 Juin 2004.
METISSE Méthodes Et Théories pour une Ingénierie des Systèmes Socio- Environnementaux.
L’activité de référencement dans une Web agency – Stage de 4 mois –
UML.
Centre d’échange d’informations sur la Convention sur la Diversité Biologique Bienvenue dans le cours sur l’ajout d’une page web sur un site web développé.
Implantation de Metalib : par où commencer? Les principales étapes de l’implantation à l’université de Montréal Marie-Josée Leboeuf 8 septembre 2006.
Elabore par BELKADHI ABIR BEN HASSEN SALMA CHEBBI MARWA
Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement.
28/05/20021 DOE : une mise en œuvre d’une méthode de structuration différentielle pour les ontologies Raphaël TroncyAntoine Isaac
Management des Systèmes d’Information (MSI)
Les réseaux - Internet Historique Réseau local Internet Les protocoles
Approches Formelles en Systèmes d'information
Centre d’archivage des documents traduits
ETAPE04 « Des besoins d’information… » « Des besoins d’information » En définissant son schéma relationnel, le Moulin des Costières définit une organisation.
Bureau d’études Présentation du sujet Organisation des projets Version 1 8 octobre 2004.
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Martine Toussaint Desir
Dr Ph CARDI - Interfaces 27/09/2001 Configuration des logiciels par les Praticiens de Santé mythe ou réalité Copyright 2001 © Intensive Care View.
C++ L’HERITAGE Fayçal BRAÏKI DUT INFORMATIQUE.
Intégration de schémas
1 e.dot – septembre e.dot Entrepôts de Données Ouverts sur la Toile RNTL.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Soutenance du mémoire de synthèse
Modélisation des documents: DTD et Schéma
GPA-779 Application des systèmes experts et des réseaux de neurones.
Ketuk Un système de mapping entre XML et Java Beans.
Séance /10/ Projet de site dynamique avec Dreamweaver : MyCMS
SOAP et les RPC XML SOAP WSDL RPC. Rappels sur le XML Langage avec des balises Très lisible Pour stocker des données Séparation entre contenu et présentation.
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Responsable : Serge Hamon
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
module SIE depuis 2011 et IAMD depuis l’an dernier ! Gestion de Masse de Données (GMD) Introduction Adrien Coulet
Transcription de la présentation:

Vers une génération automatique du mapping de sources biomédicales Fleur Mougin, Christine Golbreich, Anita Burgun & Pierre Le Beux Laboratoire d'Informatique Médicale, Rennes 09/03/2004 WSM 2004 - Rouen

Introduction Besoin des biologistes et médecins de disposer de l’information accessible sur Internet Sources biomédicales Multiple hétérogénéité Évolution très rapide Ajout fréquent  nécessité de créer un système homogène manipulant de l’information à jour 09/03/2004 WSM 2004 - Rouen

Objectifs Système d’intégration virtuelle Faciliter la collecte d’information Offrir un accès global Description explicite des sources : mapping Le plus automatiquement possible Pour faire face aux mises à jour et ajouts éventuels Définir un schéma par source 09/03/2004 WSM 2004 - Rouen

Système de médiation Médiateur (SIMS, IM, Picsel, DWQ, TSIMMIS) Composants Les sources Des adaptateurs associés Un (ou plusieurs) médiateur(s) Différents types de mapping (GAV, LAV, GLAV) Peer-to-peer Composants : les sources Principe Pas de schéma global Définition du mapping en fonction des schémas des sources 09/03/2004 WSM 2004 - Rouen

Schéma des sources Rarement disponible ou sous une forme difficilement exploitable Aucun standard existant Identifier le schéma de la source en utilisant la structure sous-jacente des banques de données biomédicales Extraction à partir des pages Web du site de chaque source 2 méthodes différentes en fonction du format de sortie de l’outil d’interrogation des sources HTML XML 09/03/2004 WSM 2004 - Rouen

Schéma de Swiss-Prot 09/03/2004 WSM 2004 - Rouen

Format HTML : méthode (1/2) Basée sur la similarité intra-pages Programmes CGI Même structure HTML Corpus 100 termes biomédicaux Genetics Home Reference ex : breast cancer 1, early onset + BRCA1 (HGNC) Interrogation de la source Dynamiquement Pour chaque terme du corpus  Constitution d’un échantillon de 100 pages Web 09/03/2004 WSM 2004 - Rouen

Format HTML : méthode (2/2) Traitement par page Nettoyage des en-tête et pied de page Nettoyage des balises HTML non informatives Extraction de couples (balise,termes) Traitement de l’échantillon Regroupement des couples (balise,termes) similaires Ceux présents dans + de 75% des pages sont gardés 09/03/2004 WSM 2004 - Rouen

Principe 09/03/2004 WSM 2004 - Rouen

Format XML : méthode Exploitation de la DTD Associée aux fichiers XML Ontologie correspondant à une vue abstraite du domaine [1] Pour obtenir les métadonnées [1] Giraldo G., Reynaud C., Construction semi-automatique d'ontologies à partir de DTDs relatives à un même domaine, 13èmes journées francophones d'Ingénierie des Connaissances, Rouen, 28-30 Mai 2002 09/03/2004 WSM 2004 - Rouen

Premiers résultats Banques de données Termes obtenus OMIM (gène ou pathologie) Swiss-Prot (protéine) Genecards (symbole du gène) Termes obtenus Attributs (schéma de BD) ou relations (RDF) Indiquent le type d’informations contenues dans la source 09/03/2004 WSM 2004 - Rouen

Exemple OMIM 09/03/2004 WSM 2004 - Rouen

Exemple Swiss-Prot 09/03/2004 WSM 2004 - Rouen

Perspectives Étape suivante : définir le schéma de chaque source Sous forme d’une ontologie locale Exploitation des termes extraits Les organiser Les trier Choix d’un vocabulaire commun Mapper les ontologies locales Systèmes existant (Prompt, Chimaera, …) ? 09/03/2004 WSM 2004 - Rouen

Conclusion BioMeKE (GO et UMLS) Méthode simple Extraire des métadonnées d’une source Pour réaliser un système d’intégration Gérer l’évolution du système 09/03/2004 WSM 2004 - Rouen

Michel Dojat & Christine Golbreich GDR STIC-SANTE : Journée Thématique Informatique Médicale dans le cadre du thème C : Systèmes d’information médicaux et bases de données Ontologies biomédicales partagées pour l’intégration de données et d’outils distribués Michel Dojat & Christine Golbreich 09/03/2004 WSM 2004 - Rouen