1 IGN / COGIT IGN Laboratoire COGIT Réunion de lancement GeOnto 18 janvier
2 IGN / COGIT EPCA, 1700 personnes, budget 100M€ IGN
3 IGN / COGIT Recherche à l’IGN Une des missions de l’IGN Pour la production ET l’intérêt général ~ 60 personnes ~ 7 thèses soutenues par an 4 laboratoires Géodésie (LAREG) Instrumentation (LOEMI) Traitement d’image (MATIS) Gestion et exploitation données géo (COGIT)
4 IGN / COGIT COGIT - Thèmes de recherche Accès aux données et aux services Aide à la conception de légendes Aide à l’extraction de données Description et spécification de traitements Cartographie Automatisation de la généralisation Automatisation de l’amélioration des légendes Risques et territoires Modélisation 3D pour l’analyse des risques Analyse des graphes et des zones urbains Intégration de données Description formelle des spécifications Appariement de données Modélisation de BD / représentation multiple
5 IGN / COGIT Intégration de bases de données
6 IGN / COGIT Objectif Intégrer BD géographiques Appariement de schémas Appariement de données BD TOPO BD CARTO
7 IGN / COGIT Difficultés de l’appariement de schémas Des schémas à la sémantique insuffisante Canalisation Tronçon de cours d’eau Tronçon hydrographique Aqueduc
8 IGN / COGIT Cap, pointe Cirque Col, passage Volcan, cratère Sommet, crête, colline Coteau, Falaise Cuvette, dépression Vallée Ile Dune, plage Pic Plaine, plateau Récifs Rocher Espace marin Banc, haut fond Difficultés de l’appariement de schémas Des schémas à la sémantique insuffisante BDCARTO BDTOPO Cap Carrière Cirque Col Crête Dépression Dune Escarpement Gorges Grotte Ile Isthme Montagne Pic Plage Plaine ou plateau Récifs Rochers Sommet Vallée Versant Volcan
9 IGN / COGIT Difficultés de l’appariement de schémas Des schémas à la sémantique insuffisante Regroupements opérés dans les classes Critères de sélection Critères de découpage … Approche générale : S’appuyer sur les spécifications des BDs, riches en information
10 IGN / COGIT Approche Schéma1Schéma2 Specifications1Specifications2 Ontologie 1Ontologie 2
11 IGN / COGIT Approche [Gesbert 2005] «Ent. géog.» Cours d'eau «Ent. géog.» Él t du réseau hydro «Ent. géog.» Canal «Ent. géog.» Fossé «Ent. géog.» Aqueduc «Ent. géog.» Rivière «Ent. géog.» Nœud réseau «Ent. géog.» Confluent «Ent. géog.» Diffluent «Ent. géog.» Source «Ent. géog.» Perte «Ent. géog.» Embouchure «Ent. géog.» Acc. parcours «Ent. géog.» Barrage «Ent. géog.» Écluse «Ent. géog.» Cascade «Objet de la base» Tronçon hydro «Objet de la base» Nœud hydro «Objet de la base» Cours d'eau «Objet de la base» Z.O.S. affluent de * 0..1 BD Carto Ontologie
12 IGN / COGIT Formalisation des spécifications
13 IGN / COGIT Spécifications
14 IGN / COGIT Spécifications Extrait des spécifications BDCarto
15 IGN / COGIT Spécifications Extrait des spécifications BDCarto
16 IGN / COGIT Spécifications Extrait des spécifications BDTopo
17 IGN / COGIT Spécifications Extrait des spécifications BDTopo
18 IGN / COGIT Spécifications Extrait des spécifications BDTopo
19 IGN / COGIT Spécifications Extrait des spécifications BDTopo
20 IGN / COGIT Bilan sur les documents Spécifications Externes De nombreuses BD différentes Mais toutes issues de l’IGN ‒Besoin de spécifications étrangères? Des documents: Très riches en information Très organisés / texte libre Volumineux Avec du langage naturel Avec des organisations sensiblement différentes
21 IGN / COGIT « Ontologies »
22 IGN / COGIT Création des ontologies Schéma1Schéma2 Specifications1Specifications2 Ontologie 1Ontologie 2 TALN
23 IGN / COGIT Création des ontologies 1ers essais [Laurens 2006] Analyse de la structure du document Analyse de texte Tokénisation / lemmatisation Filtrage des expressions Réorganisation Description de la structure (interactive) Dictionnaire (Morphalou) Dictionnaire Corpus non géographique Sélection interactive Hiérarchisation interactive
24 IGN / COGIT Création des ontologies 1ers essais [Laurens 2006] ~500 concepts / taxonomie créée Hiérarchisation insuffisante Ex: pic, sommet, gorges, plage… Trop proche de la BD Ex: Bâtiment ponctuel, surfacique, linéaire Un travail interactif est nécessaire Pour filtrer (rapide) Pour réorganiser (plus long)
25 IGN / COGIT Création des ontologies 1ers essais [Laurens 2006]
26 IGN / COGIT Alignement d’ontologies Schéma1Schéma2 Specifications1Specifications2 Ontologie 1Ontologie 2 Alignement Automatique
27 IGN / COGIT Alignement d’ontologies 1ers essais [Abadie 2007] Utilisation de Prompt (plug-in Protégé) Prometteur ‒Alignement automatique possible ‒Inférences intéressantes A affiner ‒Erreurs: termes proches ‒Modification de la hiérarchisation pas toujours pertinente ‒Fort travail interactif nécessaire
28 IGN / COGIT Alignement d’ontologies 1ers essais [Abadie 2007]
29 IGN / COGIT Bilan sur nos ressources ontologiques On dispose de 2 taxonomies correspondant à deux BDGéo ‒Avec des formes assez différentes (+/- hiérarchiques) 1 taxonomie issue de leur fusion ‒~700 termes ‒Importante réorganisation interactive ‒Bilingue Simples hiérarchies de termes Pas de définitions, propriétés… Sémantique des relations insuffisante, voire fausse
30 IGN / COGIT Données
31 IGN / COGIT Appariement de schémas à partir de l’appariement des données BDCARTO BDTOPO
32 IGN / COGIT Appariement schémas / données Pas d’identifiants universels Appariement géométrique Difficultés : gestion des imprécisions, incomplétudes, incohérences… Un processus imparfait L’appariement de schémas guide celui des données… …et inversement
33 IGN / COGIT Appariement de schémas / données 1ers essais [Abadie, Olteanu, Mustiere 2007]
34 IGN / COGIT Attentes / GeOnto
35 IGN / COGIT Attentes Ontologie(s) géographique(s) plus riche(s) plus juste(s) Méthodologies constitution d’ontologies alignement comparaison Analyses des façons de décrire le monde ‒Différents points de vues, différentes échelles des potentialités des ontologies ‒Pour l’intégration de bases de données ‒Pour l’accès aux bases de données