Utilisation de techniques de fouille de données pour enrichir une ontologie d’objets géographiques Fadi BADRA Juillet 2005 Encadrants : Omar BOUSSAID (ERIC Lyon) Anne PUISSANT (LIV, Strasbourg) Quartier Lecourbe, Strasbourg image source Quickbird © DigitalGlobe 2002
Plan Contexte Problématique Travaux réalisés Conclusion et Perspectives
Contexte L’ACI Masse de Données FoDoMuST « Utiliser conjointement plusieurs sources de connaissances et d’images lors de l’identification, la localisation et la formalisation des éléments du tissu urbain1. » 1source http://lsiit.u-strasbg.fr/afd/fodomust/
But : reproduire l’acte de photo-interprétation réalisé par l’expert à partir : d’images satellites variant par leur résolution spectrale, spatiale et temporelle. de sa connaissance du domaine.
Problématique Une ontologie… …d’objets urbains : Motivations pour formaliser des connaissances de l’expert. pour effectuer une tâche précise : elle est destinée à être parcourue pour qualifier les régions identifiées sur les images. …d’objets urbains : concepts de la géographie urbaine (parc, jardin, route, hôpital…). vus du point de vue de leur perception par le satellite (réponse spectrale, localisation, etc.). Motivations Évaluer le rôle que peut jouer une ontologie dans l’automatisation – au moins partielle – du processus de reconnaissance d’objets urbains. Que doit contenir l’ontologie de FoDoMuST ? Comment s’articule-t-elle au sein du projet ?
Travaux réalisés Un état de l’art en matière d’ontologies géographiques. La conception et l’implémentation d’une ontologie d’objets urbains. Une étude de son opérationnalisation au sein du projet FoDoMuST. Ont été mis en évidence : Les raisonnements qui peuvent être mis en œuvre sur l’ontologie. Les limites du langage utilisé, et plus largement des outils informatiques existants, pour opérationnaliser l’ontologie. Une étude des perspectives d’enrichissement par des processus d’extraction de connaissances à partir de données.
État de l’art Beaucoup de travaux théoriques d’informaticiens sur les ontologies et le Web sémantique. de spécialistes en géomatique sur l’intégration des ontologies dans les SIG. de philosophes sur la nature des concepts géographiques. de logiciens sur le raisonnement spatial. Peu d’ontologies géographiques opérationnelles La plupart des ontologies sont purement descriptives : terminologiques ou implémentant des normes géographiques. Celles qui sont opérationnelles restent des adaptations de schémas de bases de données.
Conception d’une ontologie Une ontologie c’est : Une représentation de connaissances : concepts, relations, axiomes. Un outil informatique pour effectuer des raisonnements. Une ontologie forme avec les instances des concepts une base de connaissances. Concevoir une ontologie c’est : Élaborer un modèle conceptuel (conceptualisation). Choisir un langage pour le formaliser (ontologisation) : Traduit un parti pris de conceptualisation (à travers ses constructeurs, sa sémantique). Conditionne les inférences qu’on pourra réaliser sur l’ontologie. La conception d’une ontologie est très dépendante de l’usage que l’on veut en faire !
Opérationnalisation Un raisonneur comme Racer exploite les mécanismes d’inférence autorisés par OWL : Classification (concepts) : parcourir l’ontologie pour positionner un concept dans la hiérarchie. On introduit le concept correspondant à chaque description de zone, puis on le classifie dans la hiérarchie et on renvoie ses plus petits subsumants. Vérification de cohérence (instances) : vérifier que les objets détectés à diverses résolutions soient bien cohérents entre eux. exemple : un parc n’est pas composé de tronçons. Si on détecte un parc à 30m, on ne devra pas trouver de tronçons à 1m dans la même zone.
Conclusion et Perspectives Utiliser une ontologie dans FoDoMuST est possible et même souhaitable ! Son opérationnalisation reste délicate… Un modèle conceptuel a été proposé. Il est nécessaire de l’affiner. On est confronté à une grande complexité des concepts à représenter. En effet la définition des concepts varie : en fonction de la résolution (et de manière non linéaire). dans le temps (saison pour les cultures, humidité). dans l’espace (pas de vergers d’oliviers à Nancy, pas de toits en tuile en Normandie). Une Interface Homme Machine est indispensable. L’enrichissement est un thème de recherche à lui tout seul.
Des questions ?
Limitations En OWL DL, on ne peut pas définir un concept par un intervalle de valeurs : C = « contient au moins 2 objets d’indice de Morton > 0,4 et densitéDeVégétation < 0,2 » Par contre, un raisonneur comme Racer peut raisonner sur de tels intervalles. Plusieurs solutions envisageables : A court terme : contourner les limitations par un « post-traitement » (bidouille) A moyen terme : utiliser l’extension OWL-E proposée par Jeff Z. Pan (2004). en OWL-E