Ontologies pour l’astronomie Nathalie Hernandez Josiane Mothe Laurent Cardonner
Objectifs Représentation des informations via des ontologies (indexation) Etude des thesaurus existants Adéquation aux collections Mise à jour de la connaissance du domaine Découverte de connaissances Ontologie du domaine de la tâche / du contenu
Ontologies spécifiques à une tache Techniques de mise à jour Exemple Ontologies spécifiques à une tache Mesures d’adéquation Analyses Plan Résultats des analyses via Syntex Définition de mesures d’adéquation d’une ontologie par rapport à un corpus Techniques de mise à jour Définition de différents types d’ontologies adaptés à l’usage des données Exemple de l’exploration des publications
Ontologies spécifiques à une tache Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple A notre disposition : thesaurus de l’astronomie IAU résumés d’articles publiés dans les revues A&A et APJ sur plusieurs années.
Syntex : analyseur syntaxique de corpus Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Syntex : analyseur syntaxique de corpus Intérêt : extraire syntaxiquement les expressions d’une collection documentaire [Bourigault & Fabre, 2000] Deux phases Pré-traitement par un étiqueteur Analyse syntaxique Originalité : apprentissage endogène [Bourigault & Lame, 2002]
Ontologies spécifiques à une tache Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Résultats APJ A&A
Ontologies spécifiques à une tache Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple IAU Thesaurus (représentation terminologique du domaine de l’astronomie) crée en 1995 2863 termes dont 2222 expressions (magnetic field, X ray,…) 5000 relations entre termes de plusieurs natures : t1 BT t2 : terme t2 plus spécifique t1 t1 NT t2 : terme t2 plus générique t1 t1 U t2 : utiliser le terme t1 plutôt le terme t2 t1 UF t2 : utiliser le terme t2 à la place de t1 t1 RT t2 : t1 et t2 sont liés
Recherche termes IAU / CORPUS Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Recherche termes IAU / CORPUS APJ 1999 : 865 termes retrouvés 2002 : 877 termes retrouvés A&A 1995 : 832 termes retrouvés 2002 : 884 termes retrouvés 588 termes communs aux 4 corpus IAU adapté à l’indexation de nos corpus? Mesures génériques (ontologie/thesaurus)
Ontologies spécifiques à une tache Mesures d’adéquation Analyses Techniques de mise à jour Ontologies spécifiques à une tache Exemple IAU en OWL Ontology Web Language [http://www.w3.org/TR/owl-features/] recommandation du W3C Transformation Définition de concepts (différents labels) X Ray UF X-Ray X Ray UF X-Ray radiation X Ray ; X-Ray, X-Ray radiation Définition de relations (généricité/specificité, est lié à)
Ontologies spécifiques à une tache Techniques de mise à jour Exemple Ontologies spécifiques à une tache Analyses Mesures d’adéquation Analyse lexicale Couverture ontologie / corpus Pourcentage de termes de l’ontologie présents dans le corpus Choix ou non de l’ontologie comme point de départ Couverture corpus / ontologie Détection des concepts représentatifs des documents (tf.idf [Salton 71]) Proposition de nouveaux termes à ajouter
Ontologies spécifiques à une tache Techniques de mise à jour Exemple Ontologies spécifiques à une tache Analyses Mesures d’adéquation Analyse conceptuelle Principe : « un concept est représentatif d’un domaine si il est en relation avec d’autres concepts du domaine » Définition d’une mesure du pouvoir représentatif d’un concept Définition d’une mesure du pouvoir représentatif d’une ontologie à partir de la mesure des concepts retrouvés dans les documents Validation du choix de l’organisation des concepts dans l’ontologie
Mise à jour des concepts Techniques de mise à jour Analyses Mesures d’adéquation Ontologies spécifiques à une tache Exemple Mise à jour des concepts Ajout des termes représentatifs des documents dans l’ontologie Nouveau label pour un concept Nouveau concept utilisation des mesures de proximité sémantique de Syntex
Mise à jour des relations Techniques de mise à jour Analyses Mesures d’adéquation Ontologies spécifiques à une tache Exemple Mise à jour des relations Spécification sémantique de la relation « est lié a » : (« événement lié à », « objet lié a ») Détection de nouvelles relations entre concepts utilisation des mesures de proximité sémantique de Syntex
Ontologies spécifiques Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Nécessité de deux types ontologies : Ontologie du domaine de la tâche : organisation des méta-données ou rôles des connaissances dans la réalisation d’une tâche Ontologie du domaine abordé dans le corpus: représentation de la connaissance liée au domaine traité dans le contenu des documents optimiser les tâches
Ontologies spécifiques Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Architecture
Ontologies spécifiques Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Cadre applicatif Tâche: Exploration des publications dans les revues A&A et APJ Collection à notre disposition Expérience à partir de Tétralogie
Ontologie du domaine de la tache d’exploration Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Ontologie du domaine de la tache d’exploration Construction semi-automatique REVUE OUVRAGE ACTES DE CONFERENCE LITTERATURE DU DOMAINE Est un CHERCHEUR nom prénom LABORATOIRE adresse Travaille pour Travaille avec PAYS Est situé en ARTICLE ref Publié dans Rédige DATE Ecrit en Travaille pour depuis OBJET DE RECHERCHE A pour domaine d’intérêt Traite de
Ontologie du domaine abordé dans le corpus Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Ontologie du domaine abordé dans le corpus Échantillon construit à partir de IAU et Factguru ETOILE SOLEIL Est un ECLIPSE SOLAIRE COURONNE SOLAIRE événement lié Partie de SYSTEME SOLAIRE CORPS CELESTE a un spectre ASTEROIDE COMET PLANETOIDE Synonyme
Liens entre les deux ontologies Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Liens entre les deux ontologies Est un Evénement lié à CHERCHEUR nom Dupont prénom Jean Travaille avec ETOILE SOLEIL ECLIPSE SOLAIRE COURONNE SOLAIRE Partie de A pour domaine d’intérêt Echantillon de l’ontologie de domaine Echantillon de l’ontologie de tâche au niveau instance ARTICLE Ref : 1 Traite de Rédige objet de recherche
Prototype – interface de visualisation Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Prototype – interface de visualisation Plusieurs niveaux de navigation Niveau conceptuel : vue générale sur le corpus Niveau instance : détails sur le corpus Deux accès à la collection À travers l’ontologie du domaine de la tâche A travers l’ontologie du domaine abordé dans la collection
Ontologies spécifiques à une tache Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Aperçu de l’interface
Exploration via ontologie domaine tache Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exploration via ontologie domaine tache
Connaissance établie pour instance Chercheur Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Connaissance établie pour instance Chercheur
Connaissance établie pour instance Article Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Connaissance établie pour instance Article
Exploration via ontologie domaine abordé dans corpus Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exploration via ontologie domaine abordé dans corpus
Ontologies spécifiques à une tache Techniques de mise à jour Exemple Ontologies spécifiques à une tache Mesures d’adéquation Analyses Conclusion IAU Intégration d ’autres éléments : instances des concepts ? Instruments, objets - Exemple objets Lien avec Simbad FACTGURU ?? [http://www.site.uottawa.ca:4321/astronomy/index.html]
Ontologies spécifiques à une tache Techniques de mise à jour Exemple Ontologies spécifiques à une tache Mesures d’adéquation Analyses Travaux à faire Évaluation Cadre Réalisable Définition de tâches Mise à jour - Mots clés (oui avec niveau souhaité - Ontologie - Web sémantique) Lien avec UCD
Evaluation Comparer l’adéquation d’échantillons de deux ontologies sur un même corpus, puis sur des différents (évolution du domaine) Proposer les corpus et les deux ontologies
Evaluation Ontology A Ontology B particle photon radiation high energy radiation X ray X ray radiation X-ray electromagnetic wave X ray spectra X ray source X ray binaries star X ray pulsar pulsar scattering X ray background wave Background radiation Photon Electromagnetic radiation X-Ray hard X ray soft X ray celestial sphere psr neutral particle celestial body X ray astronomy Is a Part of Is related to
Ontologie Ontologie : « spécification explicite et formelle d’une conceptualisation partagée» [Studer 1998] Deux niveaux sémiotiques : Lexical (termes) Conceptuel (concepts et relations entre concepts) base pour la communication entre les machines, entre humains et machines
Recherche d’information et ontologie Intégration des ontologies dans un processus de recherche : Réduction du silence : extension des requêtes à partir des termes et concepts de l’ontologie Réduction du bruit : désambiguïsation des termes contenus dans la requête
Recherche d ’information et Ontologie Indexation des documents à partir des concepts de l’ontologie Descripteurs choisis dans l’ontologie Indexation à partir de concepts et non plus à partir de mots souvent ambigus Choix d’une ontologie reflétant le ou les domaines de connaissance relatifs aux corpus
Exploration de collections documentaires à partir d’ontologies Objectifs : Aide à l’indexation des documents par un procédé de catégorisation automatique des documents au niveau des concepts d’ontologies Météorite Achondrite Chondrite Chondrule Chondrite carbonnée Météorite……………….chondrule Chondrule…….. Extraits des documents Extrait d’une hiérarchie de concepts