Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Ontologies pour l’astronomie
Nathalie Hernandez Josiane Mothe Laurent Cardonner
2
Objectifs Représentation des informations via des ontologies (indexation) Etude des thesaurus existants Adéquation aux collections Mise à jour de la connaissance du domaine Découverte de connaissances Ontologie du domaine de la tâche / du contenu
3
Ontologies spécifiques à une tache
Techniques de mise à jour Exemple Ontologies spécifiques à une tache Mesures d’adéquation Analyses Plan Résultats des analyses via Syntex Définition de mesures d’adéquation d’une ontologie par rapport à un corpus Techniques de mise à jour Définition de différents types d’ontologies adaptés à l’usage des données Exemple de l’exploration des publications
4
Ontologies spécifiques à une tache
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple A notre disposition : thesaurus de l’astronomie IAU résumés d’articles publiés dans les revues A&A et APJ sur plusieurs années.
5
Syntex : analyseur syntaxique de corpus
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Syntex : analyseur syntaxique de corpus Intérêt : extraire syntaxiquement les expressions d’une collection documentaire [Bourigault & Fabre, 2000] Deux phases Pré-traitement par un étiqueteur Analyse syntaxique Originalité : apprentissage endogène [Bourigault & Lame, 2002]
6
Ontologies spécifiques à une tache
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Résultats APJ A&A
7
Ontologies spécifiques à une tache
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple IAU Thesaurus (représentation terminologique du domaine de l’astronomie) crée en 1995 2863 termes dont 2222 expressions (magnetic field, X ray,…) 5000 relations entre termes de plusieurs natures : t1 BT t2 : terme t2 plus spécifique t1 t1 NT t2 : terme t2 plus générique t1 t1 U t2 : utiliser le terme t1 plutôt le terme t2 t1 UF t2 : utiliser le terme t2 à la place de t1 t1 RT t2 : t1 et t2 sont liés
8
Recherche termes IAU / CORPUS
Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exemple Recherche termes IAU / CORPUS APJ 1999 : 865 termes retrouvés 2002 : 877 termes retrouvés A&A 1995 : 832 termes retrouvés 2002 : 884 termes retrouvés 588 termes communs aux 4 corpus IAU adapté à l’indexation de nos corpus? Mesures génériques (ontologie/thesaurus)
9
Ontologies spécifiques à une tache
Mesures d’adéquation Analyses Techniques de mise à jour Ontologies spécifiques à une tache Exemple IAU en OWL Ontology Web Language [ recommandation du W3C Transformation Définition de concepts (différents labels) X Ray UF X-Ray X Ray UF X-Ray radiation X Ray ; X-Ray, X-Ray radiation Définition de relations (généricité/specificité, est lié à)
10
Ontologies spécifiques à une tache
Techniques de mise à jour Exemple Ontologies spécifiques à une tache Analyses Mesures d’adéquation Analyse lexicale Couverture ontologie / corpus Pourcentage de termes de l’ontologie présents dans le corpus Choix ou non de l’ontologie comme point de départ Couverture corpus / ontologie Détection des concepts représentatifs des documents (tf.idf [Salton 71]) Proposition de nouveaux termes à ajouter
11
Ontologies spécifiques à une tache
Techniques de mise à jour Exemple Ontologies spécifiques à une tache Analyses Mesures d’adéquation Analyse conceptuelle Principe : « un concept est représentatif d’un domaine si il est en relation avec d’autres concepts du domaine » Définition d’une mesure du pouvoir représentatif d’un concept Définition d’une mesure du pouvoir représentatif d’une ontologie à partir de la mesure des concepts retrouvés dans les documents Validation du choix de l’organisation des concepts dans l’ontologie
12
Mise à jour des concepts
Techniques de mise à jour Analyses Mesures d’adéquation Ontologies spécifiques à une tache Exemple Mise à jour des concepts Ajout des termes représentatifs des documents dans l’ontologie Nouveau label pour un concept Nouveau concept utilisation des mesures de proximité sémantique de Syntex
13
Mise à jour des relations
Techniques de mise à jour Analyses Mesures d’adéquation Ontologies spécifiques à une tache Exemple Mise à jour des relations Spécification sémantique de la relation « est lié a » : (« événement lié à », « objet lié a ») Détection de nouvelles relations entre concepts utilisation des mesures de proximité sémantique de Syntex
14
Ontologies spécifiques
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Nécessité de deux types ontologies : Ontologie du domaine de la tâche : organisation des méta-données ou rôles des connaissances dans la réalisation d’une tâche Ontologie du domaine abordé dans le corpus: représentation de la connaissance liée au domaine traité dans le contenu des documents optimiser les tâches
15
Ontologies spécifiques
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Architecture
16
Ontologies spécifiques
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Cadre applicatif Tâche: Exploration des publications dans les revues A&A et APJ Collection à notre disposition Expérience à partir de Tétralogie
17
Ontologie du domaine de la tache d’exploration
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Ontologie du domaine de la tache d’exploration Construction semi-automatique REVUE OUVRAGE ACTES DE CONFERENCE LITTERATURE DU DOMAINE Est un CHERCHEUR nom prénom LABORATOIRE adresse Travaille pour Travaille avec PAYS Est situé en ARTICLE ref Publié dans Rédige DATE Ecrit en Travaille pour depuis OBJET DE RECHERCHE A pour domaine d’intérêt Traite de
18
Ontologie du domaine abordé dans le corpus
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Ontologie du domaine abordé dans le corpus Échantillon construit à partir de IAU et Factguru ETOILE SOLEIL Est un ECLIPSE SOLAIRE COURONNE SOLAIRE événement lié Partie de SYSTEME SOLAIRE CORPS CELESTE a un spectre ASTEROIDE COMET PLANETOIDE Synonyme
19
Liens entre les deux ontologies
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Liens entre les deux ontologies Est un Evénement lié à CHERCHEUR nom Dupont prénom Jean Travaille avec ETOILE SOLEIL ECLIPSE SOLAIRE COURONNE SOLAIRE Partie de A pour domaine d’intérêt Echantillon de l’ontologie de domaine Echantillon de l’ontologie de tâche au niveau instance ARTICLE Ref : 1 Traite de Rédige objet de recherche
20
Prototype – interface de visualisation
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Prototype – interface de visualisation Plusieurs niveaux de navigation Niveau conceptuel : vue générale sur le corpus Niveau instance : détails sur le corpus Deux accès à la collection À travers l’ontologie du domaine de la tâche A travers l’ontologie du domaine abordé dans la collection
21
Ontologies spécifiques à une tache
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Aperçu de l’interface
22
Exploration via ontologie domaine tache
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exploration via ontologie domaine tache
23
Connaissance établie pour instance Chercheur
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Connaissance établie pour instance Chercheur
24
Connaissance établie pour instance Article
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Connaissance établie pour instance Article
25
Exploration via ontologie domaine abordé dans corpus
Exemple Analyses Mesures d’adéquation Techniques de mise à jour Ontologies spécifiques à une tache Exploration via ontologie domaine abordé dans corpus
26
Ontologies spécifiques à une tache
Techniques de mise à jour Exemple Ontologies spécifiques à une tache Mesures d’adéquation Analyses Conclusion IAU Intégration d ’autres éléments : instances des concepts ? Instruments, objets - Exemple objets Lien avec Simbad FACTGURU ?? [
27
Ontologies spécifiques à une tache
Techniques de mise à jour Exemple Ontologies spécifiques à une tache Mesures d’adéquation Analyses Travaux à faire Évaluation Cadre Réalisable Définition de tâches Mise à jour - Mots clés (oui avec niveau souhaité - Ontologie - Web sémantique) Lien avec UCD
29
Evaluation Comparer l’adéquation d’échantillons de deux ontologies sur un même corpus, puis sur des différents (évolution du domaine) Proposer les corpus et les deux ontologies
30
Evaluation Ontology A Ontology B particle photon radiation
high energy radiation X ray X ray radiation X-ray electromagnetic wave X ray spectra X ray source X ray binaries star X ray pulsar pulsar scattering X ray background wave Background radiation Photon Electromagnetic radiation X-Ray hard X ray soft X ray celestial sphere psr neutral particle celestial body X ray astronomy Is a Part of Is related to
31
Ontologie Ontologie : « spécification explicite et formelle d’une conceptualisation partagée» [Studer 1998] Deux niveaux sémiotiques : Lexical (termes) Conceptuel (concepts et relations entre concepts) base pour la communication entre les machines, entre humains et machines
32
Recherche d’information et ontologie
Intégration des ontologies dans un processus de recherche : Réduction du silence : extension des requêtes à partir des termes et concepts de l’ontologie Réduction du bruit : désambiguïsation des termes contenus dans la requête
33
Recherche d ’information et Ontologie
Indexation des documents à partir des concepts de l’ontologie Descripteurs choisis dans l’ontologie Indexation à partir de concepts et non plus à partir de mots souvent ambigus Choix d’une ontologie reflétant le ou les domaines de connaissance relatifs aux corpus
34
Exploration de collections documentaires à partir d’ontologies
Objectifs : Aide à l’indexation des documents par un procédé de catégorisation automatique des documents au niveau des concepts d’ontologies Météorite Achondrite Chondrite Chondrule Chondrite carbonnée Météorite……………….chondrule Chondrule…….. Extraits des documents Extrait d’une hiérarchie de concepts
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.