Réunion de lancement du 18 janvier constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes Réunion de lancement
Réunion de lancement du 18 janvier Ordre du jour 10h-15 – 10h30 : Introduction à la journée 10h30 – 11h15 : Présentation de l’IGN 11h15 – 12h : Présentation de l’IRIT 12h – 12h45 : Présentation du LIUPPA 12h45 – 14h15 : Repas 14h15 – 15h : Présentation du LRI 15h – 16h : Point organisation 16h – 16h30 : Cloture et bilan
Réunion de lancement du 18 janvier Objectifs Interopérabilité de données géographiques hétérogènes Intégration de bases de données géographiques Interrogation de nombreux documents textuels (plus variés - destinés à un plus large public) Approche privilégiée : exploitation d’ontologies Comment les construire ? Comment les aligner, les fusionner, comprendre leurs différences ? Comment apparier des schémas de bases de données et développer un moteur de recherche d’information via des ontologies ? Déploiement à grande échelle – Automatisation
Réunion de lancement du 18 janvier Contexte Des données géographiques de plus en plus nombreuses et diverses (but et niveau de détail différents) Essor des techniques de l’information et de localisation spatiale, projet de portail de l’info géographique publique de la DGME, directive INSPIRE au niveau européen Nouvel essor de l’acquisition des connaissances et de l’analyse de contenus à partir de textes TIA, AS Corpus et terminologies, nombreux workshops, ontology learning/ontology population, ouvrages de synthèse Des travaux en alignement d’ontologies très nombreux Nombreuses techniques mais non prise en compte de l’hétérogénéité du degré de détail et de structuration des ontologies. Peu d’ontologies dans le domaine géographique Des techniques d’indexation des moteurs de recherche non suffisamment basées sur le contenu des documents
Réunion de lancement du 18 janvier Lots Lot 1 : Construction et enrichissement d’ontologies 1.1 : Mise au point d’outils d’extraction de concepts et de relations 1.2 : Enrichissement d’une ontologie existante à partir de textes à l’aide des outils d’extraction et à partir de ressources lexicales 1.3 : Restructuration d’ontologies Lot 2 : Appariement d’ontologies hétérogènes 2.1: Alignement et fusion d’ontologies à divers niveaux de richesse 2.2 : Réconciliation d’instances pour l’alignement d’ontologies 2.3 : Analyse des différences entre ontologies pour faire ressortir des différences de point de vue Lot 3 : Exploitation des ontologies créées 3.1: Indexation automatique du contenu de documents 3.2 : Intégration et accès aux schémas de bases de données et évaluation 3.3 : Mise en ligne des ontologies réalisées
Réunion de lancement du 18 janvier Domaine d’application retenu Topographie - Description du paysage Nombreuses et volumineuses bases de données Des documents textuels (spécifications) associés aux bases (IGN) Des documents texte grand public : carnets de voyage, description de panorama ou de paysages (Médiathèque de Pau)
Réunion de lancement du 18 janvier Construction et enrichissement d’ontologies (IRIT) Construction d’un premier noyau -Outils d’extraction de concepts automatiques et de repérage supervisé de relations -Combinaison de l’utilisation de patrons et de l’utilisation de techniques d’alignement à partir de ressources lexicales pour mieux typer les relations. -Tests sur les ontologies du COGIT et sur les ontologies obtenues en résultat d’application des techniques d’extraction et de repérage dans des textes. Résultat obtenu réorganisé par confrontation à une ontologie de référence de bonne qualité -Réorganisation = relier des sous-arbres indépendants, définir le bon niveau d’abstraction pour définir un concept, éliminer les redondances, … -Exploitation d’une ontologie de référence (ontologie du COGIT enrichie) -Combinaison d’une approche de construction d’ontologies à partir de textes avec des techniques automatiques de comparaison d’ontologies -Processus qui doit être le plus automatique possible
Réunion de lancement du 18 janvier Appariement d’ontologies hétérogènes (LRI) Ontologies appariées : -Ontologies du COGIT, ontologies fournies par le lot 1, ontologies externes (Feature Data Dictionary Register, ontologie de l’Ordonnance Survey). -Objectif : Obtenir une ontologie géographique riche. Mise en correspondance de taxonomies et gestion de l’hétérogénéité à différents niveaux -Gestion de l’hétérogénéité structurelle, du point de vue de la précision, de la qualité et de la fiabilité de la représentation -Adaptation de Taxomap aux spécificités des ontologies du domaine d’étude -Fusion d’ontologies si nécessaire Réconciliation d’instances pour l’alignement d’ontologies -Combinaison des techniques de recherche de mises en correspondances entre concepts et entre instances. Analyse des différences entre ontologies -Objectif : aider le concepteur à décider de fusionner ou de mettre en correspondance les ontologies.
Réunion de lancement du 18 janvier Exploitation des ontologies créées (COGIT) Deux cas d’utilisation Indexation automatique de contenus de documents -Utilisation d’index géographiques complexes -Réponse à des requêtes en texte libre ou en multi-modalité Intégration de bases de données géographiques -Formalisation fine des spécifications à partir d’ontologies -Réelle intégration des bases -Portail d’accès aux schémas des bases Mise à disposition des ontologies réalisées -Des ontologies riches, bilingues, exprimées en OWL -Vers une mise en commun de ces ontologies ? Soumission à l’OGC ?