Annotations sémantiques pour le domaine des biopuces Khaled Khelif – Rose Dieng ACACIA
Contexte Objectif : Problématique Solution Assister les biologistes Faciliter la validation et l’interprétation des résultats des expériences biopuces Sources de données hétérogènes Pertinence des résultats de la RI !! Difficulté d'accès aux anciens résultats Cahiers d'expériences Faciliter la recherche dans une telle mémoire Ontologies du domaine Base des expériences Bases documentaires Proposer des aides méthodologiques et logicielles pour la capitalisation et la valorisation des connaissances Solution Proposer une architecture d’une mémoire d’expériences Faciliter la recherche dans une telle mémoire
Problématique Prolifération incessante des documents sur le web Pauvreté sémantique des moteurs de RI (basés sur les mots clés) Ce qui entraîne : Un bruit/silence dans les résultats fournis Une tâche supplémentaire pour le biologiste : le tri et la vérification de ces résultats Utilisation des techniques du web sémantique
Solution proposée Utilisation des annotations sémantiques pour faciliter la tâche de RI. Utilisation des ontologies pour diriger la création de ces annotations. Exploitation des connaissances contenues dans le texte pour la génération de ces annotations. Système de génération semi-automatique d’annotations sémantiques basées sur UMLS
Système de génération d’annotations sémantiques But faciliter la recherche d’informations dans les bases documentaires et la rendre plus pertinente ({Token.string == "play"} | {Token.string == "plays"}) {SpaceToken} ({Token.string == "a"}| {Token.string == "an"})? ({SpaceToken})? ({Token.string == "vital"}| {Token.string == "important"}| {Token.string == "critical"}| {Token.string == "some"} | {Token.string == "unexpected"}| {Token.string == "multifaceted"} | {Token.string == "major"})? ({Token.string == "role"} | {Token.string == "roles"}) Basé sur L’extraction d’informations à partir des textes Les concepts et les relations de l’ontologie bio-médical UMLS GATE Article scientifique Annotation sémantique MEAT Annot UMLS Knowledge server (web) Filtrage des mots vides Instanciation des concepts Détection des relations Validation Traitement linguistique Doc.xml
Transmettent requêtes Bilan Base d’annotations UMLS Interface Biologistes Corese Transmettent requêtes interroge Renvoie les résultats utilise
Conclusion & persepectives Méthode de génération semi-automatique des annotations sémantiques Extraction d’instances de relations entre concepts Méthode générique, indépendante du domaine Affiner la méthode d’extraction des termes Améliorer l’interaction avec l’utilisateur