e.Dot – juillet 2005 Page 1 Projet R.N.T.L. e.Dot – Entrepôts de Données Ouverts sur la Toile – Organisation et Structuration de lEntrepôt LOT 3 4 juillet 2005
e.Dot – juillet 2005 Page 2 Introduction Implication de tous les partenaires –Définition des modules –Mise en place des modules / fonctionnalités de manière indépendante –Définition dinterfaces WSDL Pilotage par lINRIA –Mise en œuvre dune plateforme de développement (AXML / ACWAre) –Architecture –3 thésards, ~10 stagiaires maîtrise (AXML / ACWAre)
e.Dot – juillet 2005 Page 3 Plan 1.Principes 2.Architecture Globale 3.Un exemple de service 4.Dissémination 5.Démonstration
e.Dot – juillet 2005 Page 4 1. Principes
e.Dot – juillet 2005 Page 5 Des standards très répandus XML –Format déchange standard de données –Mariage entre documents et bases de données –Gestion de données semi-structurées –Bien adapté à lutilisation du Web et de données évolutives Services Web –Standard pour le développement modulaire dapplications distribuées (SOAP) –Description standardisée des entrées/sorties (WSDL) –Dialecte XML
e.Dot – juillet 2005 Page 6 Des technologies nouvelles Active XML –Plateforme de développement intégrant données XML et Services Web –Mariage entre documents et fonctions –Basé sur les standards XML, XSL… –Évolutif et en évolution ! Active Content Warehousing –Simplifie la gestion de larchitecture dun entrepôt semi-structuré –Application AXML –Utilisable de manière modulaire
e.Dot – juillet 2005 Page 7 Un entrepôt « actif » Données évolutives –Utilisation dun mécanisme denrichissement –Résultats utilisables par dautres services (ex. Ontologie) Services flexibles –Choix de services parmi les fonctionnalités (ex. crawler) –Intégration à divers niveaux –Possibilité de connecter des sources de données, si celles-ci sont des services web (ex. Aqweb)
e.Dot – juillet 2005 Page 8 Génération de lentrepôt Designer Builder Manager Viewer Spec. Formelle Entrepôt XML Service 1 Service 2 Crée Génère lentrepôt et les connexions Services Exportés Interroge
e.Dot – juillet 2005 Page 9 Appel de Services
e.Dot – juillet 2005 Page Architecture Globale
e.Dot – juillet 2005 Page 11 Principe Entrepôt de travail –Espace de travail persistant et partagé par tous les services dacquisition et denrichissement de données –Stockage des données en XML –Géré par Acware –Plusieurs espaces de travail possibles (EdotFilter, Aqweb,…) Entrepôt final –Données de lentrepôt de travail validées et enrichies sémantiquement –Interrogeables via MIEL++ –Stocké dans Xylème
e.Dot – juillet 2005 Page 12 Architecture Globale
e.Dot – juillet 2005 Page 13 Architecture Modulaire Acquisition –Traitement de divers types de données Html : EDotFilter Pdf : PDFCrawler –Informations sémantiques centralisées OntoMap Enrichissement –Intégré à certaines parties (crawlers) –Utilisation possible de services externes (thesus) Stockage et interrogation –Lentrepôt de travail nest pas lentrepôt interrogé, il permet seulement le transit de certaines informations –Utilisation de Xylème comme entrepôt final –Interrogation unifiée via Miel++
e.Dot – juillet 2005 Page 14 Illustration : la conversion vers SML HTML2XTab PDF2XTab EXCEL2XTab Any2XTab ontologie documents (html,pdf,…) XTAB2SML document SML (XML sémantique) document XML (intermédiaire) ontologie
e.Dot – juillet 2005 Page Un exemple de service
e.Dot – juillet 2005 Page 16 Disponible sur le site Les Spécifications WSDL Exemples : –EDotFilter –Any2XTab
e.Dot – juillet 2005 Page Dissémination
e.Dot – juillet 2005 Page 18 Publications S. Abiteboul, V. Bensal, G. Cobena, B. Nguyen and A. Poggi, Model, Design and Construction of a Service- oriented Web Warehouse Demonstration at the European Conference on Digital Libraries, Trondheim (Norway), 2003 S. Abiteboul, B. Nguyen, G. Ruberg, Building an Active Content Warehouse, in Processing and Managing Complex Data for Decision Support, IDEA Goup, J Darmont & O. Bensaid ed., à paraître (2005) T. Milo, S. Abiteboul, B. Amann, O. Benjelloun, F. Dang Ngoc, Exchanging Intensional XML Data, SIGMOD 2003
e.Dot – juillet 2005 Page Démonstration