Un système de médiation basé sur les ontologies FDC 2006 Troisième atelier sur la "Fouille de données complexes dans un processus d'extraction des connaissances" 17 Janvier 2006 Lille, France Nora Maiz, Omar Boussaid et Fadila Bentayeb Laboratoire ERIC Université Lumière Lyon 2 Bt L, 5av Pierre Mendès-France 69 676 BRON
? xquery Comment faire pour aller à Lille (FDC)? OQL SQL XML HTML n-uplets M. de recherche objets API Instances SGBD relationnel Agence de voyage SGBD objet Chaîne hôtelière SGBD Semi- structuré Site horaire vols Fichiers texte Information ville application Météo
Médiateur Ontologie Adaptateur SQL n-uplets OQL objets xquery XML M. Rech HTML API instances SGBD relationnel Agence de voyage SGBD objet Chaîne hôtelière SGBD Semi- structuré Site horaire vols Fichiers texte Information pays application Météo
Contexte Notre travail s’inscrit dans le cadre d’une collaboration avec Le Crédit Lyonnais (LCL). LCL dispose de plusieurs sources hétérogènes qui évoluent rapidement. Objectif : développer un médiateur à base d’ontologies pour résoudre les problèmes d’hétérogénéités structurelle et sémantique des données.
Etat de l’art Ontologies pour l’intégration : Architecture des ontologies Approche avec une seule ontologie (SIMS) Approche avec plusieurs ontologies (OBSERVER) Approche hybride (KRAFT) Modèles d’intégration : GAV(Global as view) LAV(local as view) GLAV (Generalized Local As View)
Notre système de médiation Approche ascendante de développement des ontologies Langage de requêtes Algorithme de réécriture de requêtes Application sur les sources de LCL
Approche de développement des ontologies Étape 1 : Construction des ontologies locales Étape 2 : Construction de l’ontologie globale Étape 3 : Définition des correspondances Choix de l’architecture et du modèle : - Architecture hybride modélisée selon GLAV.
Utilisation du OWL Avantages : Puissance d’expression des concepts et de leurs relations Capacité de faire du raisonnement Les classes OWL représentent les concepts élémentaires des sources de données Les propriétés OWL représentent les liens entre les différents concepts
Exemple de LCL S1 S2 - Collaborateur - D. Marketing - Personne Collaborateur (IdCollaborateur) DemandeMarketing (IdDemande, IdCollaborateur) Personne (IdPersonne, NomPersonne) Profil (IdProfil, LibProfil, TypeProfil, IdPersonne) S1 - Collaborateur - D. Marketing - Personne - Collaborateur - Collaborateur E - Collaborateur D - Profil S2 Personne - Collaborateur - Profil
Réécriture de requêtes Notre approche est modélisée selon le modèle GLAV un dépliement et une réécriture de requêtes Langage de requêtes Algorithme de réécriture de requêtes
Langage de requêtes Requête utilisateur Q : conjonction de sous requêtes Qi => Q = i=1…n Qi Une sous requête Qi = ( QLAV) v (QGAV) QLAV = Concept(x) QGAV = Concept(x) Propriété(x,y) Concept(y)
Réécriture de requêtes But : - Réécrire toutes les QLAV en QGAV - Définir une table de correspondances - Eliminer les QLAV qui ne correspondent pas aux autres sous requêtes Algorithme : - Entrée : une requête utilisateur est une conjonction de QLAV et/ou QGAV. - Sortie : ensemble de requêtes sémantiquement équivalentes
Exemple Q : (Adresse (z) aPourVille (z, «Lyon »)) ………………... 2 (collaborateur (x) aUneAdresse (x,y) Adresse(y)) … 1 (Adresse (z) aPourVille (z, «Lyon »)) ………………... 2 (Profil (p))………………………………………………... ...3 1,2 GAV : sous requêtes envoyées aux adaptateurs correspondants pour être exécutées ; puis jointure des résultats. 3 LAV : sous requête doit être réécrite en : (Personne(r) aUnProfil(r,p) Profil(p) exécutée ; puis jointure avec les résultats précédents.
Implémentation de INMEA Ontologie locale Système de médiation par agents et ontologies OWL Source de données Agent wrapper Module de raisonnement Ontologie locale Ontologie globale requête Source de données Agent wrapper Module de requêtage et de réécriture Ontologie locale Agent médiateur Source de données Agent wrapper
Conclusion Nous avons proposé un système de médiation basé sur les ontologies : Une méthode ascendante de conception des ontologies Un langage de requêtes Un algorithme de réécriture L’approche est validée sur les sources de LCL Implémentation du médiateur INMEA
Perspectives Valider notre approche sur un nombre plus important de sources Prendre en considération la diversité des types de sources Considérer des requêtes plus complexes Introduire notre approche dans le cadre de l’entreposage de données
Merci pour votre attention