Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parGuarin Magnier Modifié depuis plus de 10 années
1
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et de connaissances distribuées sur le Web » Intégration sémantique (Alignement d’ontologies, Réconciliation d’instances, Annotation, Evolution) Pair-à-pair Web services
2
2 Alignement : TaxoMap Objectif : Aligner la taxonomie d’un portail avec celles de sources externes pour permettre une interrogation unifiée. z Spécificités : dissymétrie dans la structure et la taille des taxonomies comparées ( taxonomie du portail a priori plus riche que celles de sources externes isolées ) z Approche : générique, semi-automatique, composite (techniques terminologiques et structurelles) Processus orienté : alignement des termes d’une taxonomie source (T S ) vers ceux de la taxonomie cible (T C ) : z Contexte : Small is beautiful (ontologies simples : taxonomies où les concepts sont reliés par des liens de subsomption isA )
3
Alignement d’ontologies O Source O Cible X S O S, Y C O C Recherche de mappings (X S relation Y C )
4
4 Trois catégories de mappings Relations de spécialisation ( isA ) : lien entre un élément de T S et un élément plus général de T C. e S : Precooked chicken isA e c : chicken e S : Asparagus isA e c : Vegetable Relations d’équivalence ( isEq ) : lien entre un élément de T S et un élément similaire de T C. Des noms de termes rigoureusement identiques e S : beef fat isEq e c : beef fat Des expressions composées de mots, pas toujours ordonnés à l’identique, ayant la même signification e S : Pork sausage (liver) isEq e c : Pork liver sausage Relations de proximité ( isClose ) : lien quand on ne sait pas expliciter la nature du lien entre un élément de T S et un élément de T C. e S : Cantaloupe isClose e c : Water melon
5
Approche séquentielle, en 3 phases 1.Génération automatique de mappings « probables » 2.Suggestion de mappings « potentiels » exploitant TaxoMap Expert du domaine 3. Validation des mappings générés : mappings confirmés ou rejetés, suggestion de nouveaux mappings. Techniques terminologiques Techniques structurelles basée sur l’étude des labels des éléments (n-gram, inclusion de chaînes) Éléments équivalents Inclusion de labels Similarité relative la position des candidats au mapping dans T Cible la structure d’une ressource externe (WordNet) la structure de T Source
6
Evaluation Techniques appliquées séquentiellement Pertinentes quand Les relations dans les taxonomies sont vraiment des liens de subsomption (isA et non partOf) Les labels sont composées de nombreux mots Un même mot appartient à plusieurs labels Existence d’une ressource externe (WN en anglais) Testées sur ≠ benchmarks
7
Objectifs dans le projet Tester et étendre l’outil existant Expliciter des critères sur des ensembles d’appariements trouvés (ou pas) entre des parties d’ontologies, utiles pour la fusion ou la réorganisation Expliciter d’autres chaînes de traitement à partir des techniques d’alignement, utiles pour les autres tâches. X X’ Y’ Y Z Z’ O1O1 O2O2
8
Planning sous lot 2.1. Premières tâches Juin 08 : Tests de TaxoMap sur les taxonomies existantes fournies par le COGIT (2.1), 3 taxonomies ? OntoGeo, Topo, Carto Evaluation sur les mappings de référence ? Dec 08 : identification des limites, spécification des amélioration à apporter (2.2) ….
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.