La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

B. Nguyen BDA 20021 Construction and Maintenance of a SPIN (Set of Pages of Interest) using Active XML Serge Abiteboul, Grégory Cobena, Benjamin Nguyen,

Présentations similaires


Présentation au sujet: "B. Nguyen BDA 20021 Construction and Maintenance of a SPIN (Set of Pages of Interest) using Active XML Serge Abiteboul, Grégory Cobena, Benjamin Nguyen,"— Transcription de la présentation:

1 B. Nguyen BDA 20021 Construction and Maintenance of a SPIN (Set of Pages of Interest) using Active XML Serge Abiteboul, Grégory Cobena, Benjamin Nguyen, Antonella Poggi INRIA-FUTURS, Projet Gemo Email: Firstname.Lastname@inria.fr

2 B. Nguyen BDA 20022 Qui? Travaux au sein de lex-projet Verso (Gemo) Serge Abiteboul Grégory Cobena Antonella Poggi Benjamin Nguyen Collaboration au projet RNTL e.dot avec le labo BIA de lINRA sur le risque alimentaire

3 B. Nguyen BDA 20023 Quoi? Développer une approche: Flexible, générique, déclarative de spécification dun entrep ô t de données du Web Simplifier lacquisition de ces données du Web + Utilisation de services Proposer une plate-forme de développement dentrep ô ts de données.

4 B. Nguyen BDA 20024 Comment?

5 B. Nguyen BDA 20025 Plan de la Présentation 1- Une nouvelle problématique… 2- SPIN Idées de base Architecture Exemple 3- Objectifs futurs

6 B. Nguyen BDA 20026 1- Une nouvelle problématique…

7 B. Nguyen BDA 20027 Problématique générale des entrepôts de données 1/ The topic of data warehousing encompasses architectures, algorithms and tools for bringing together selected data from multiple databases or other information sources into a single repository, called a Data Warehouse. J.Widom, Research Problems in Data Warehousing, CIKM 1995

8 B. Nguyen BDA 20028 Problématique générale des entrepôts de données 2/ Info source Data Warehouse Wrapper INTEGRATOR

9 B. Nguyen BDA 20029 Sujets de Recherche Wrappers/Monitors Integrator Warehouse specification (WHIPS- SIGMOD 1997) Diverses optimisations

10 B. Nguyen BDA 200210 SPIN: Les différences Un travail autour du document plutôt que dans le document Intégration Plus grand nombre de sources (chaque document web/Service) Moins de structure dans chacune des pages Des thèmes très variés Ergonomie et simplicité Une architecture simple et modulaire Une approche pour utilisateur novice

11 B. Nguyen BDA 200211 Brefs rappels XML (W3C) WSDL (W3C) Format XML pour décrire des services Orienté document ou procédural Utilisé avec dautres protocoles (SOAP) ActiveXML

12 B. Nguyen BDA 200212 ActiveXML Travaux en cours: S.Abiteboul, T.Milo, O.Benjelloun, I.Manolescu, A.Bonifati, L.Segoufin…+ équipe SPIN! AXML = XML + Appels de services Langage déclaratif Peer-to-peer Mise en oeuvre très simple de services web

13 B. Nguyen BDA 200213 2- SPIN

14 B. Nguyen BDA 200214 Le projet Une volonté de généricite et de simplicité dans la construction dun entrepôt Un langage déclaratif permettant de spécifier un SPIN Implémentation des services (modules) constituant la base du système Approche modulaire Implémentation en Java, XML, XSLT (B. Zhu) Spécification haut niveau en Active XML (langage data- centric, calcul distribue)

15 B. Nguyen BDA 200215 Entrep ô t=Intention+Extension Intention Définition déclarative a base de services existants (SOAP, WSDL, UDDI… AXML) Écriture de services propres Extension Pages webs stockées dans un répositoire XML Enrichissement continu de lextension Interrogation via requêtes XOQL (V. Aguillera)

16 B. Nguyen BDA 200216 Architecture AXML processor XOQL Engine XOQL Service XyDiff Xyleme Services SPIN Services Web Service Application Internet Web Services Crawler Google AXML Client Xml repository

17 B. Nguyen BDA 200217 Exemple : Sèvres Un utilisateur veut créer un entrepôt de données sur la ville de Sèvres… Comment faire cela en quelques lignes?

18 B. Nguyen BDA 200218 Fil conducteur Description de lentête de lentrepôt Description de lintention Manière très générale Réutilise comme paramètre Description des services Services génériques Services particuliers a lentrepôt

19 B. Nguyen BDA 200219 Modèle de données: Entête Sèvres Warehouse......

20 B. Nguyen BDA 200220 Modele de données: Intention (pur XML) 3000 Sèvres 92310 http://www.ville-sevres.fr/ http://www.vertsdesevres.com/...

21 B. Nguyen BDA 200221 …les services utilisent les données de lintention % Keyword Query let askGoogle($name) be { for each $X in do insert (//spin:spin[name=$name]/spin:extension/ ) }

22 B. Nguyen BDA 200222 Services (suite) % Interesting sites let crawlInterestingSites($name) be{ for each $X in 5 do insert (//spin[name=$name]/spin:extension/ ) }

23 B. Nguyen BDA 200223 Services supplémentaires Classification Annotations de lutilisateur Évolution temporelle Requêtes (préecrites) sur le document résultat avec XOQL

24 B. Nguyen BDA 200224 Un service avancé: La gestion des M- A-J de manière transparente let aggregate($name, $D1, $D2) be { insert //spin:spin[name=$name]/spin:extension[date=$D1]/... %the delta //spin:spin[name=$name]/spin:extension[date=$D2]/ CLONE VALUE ON DEMAND delete //spin:spin[name=$name]/spin:extension[date=$D2]/spin:url}

25 B. Nguyen BDA 200225 Extension (résultat) % En utilisant dautres services... http://www.yahoo.com/ http://www-rocq.inria.fr/ HTML 28 jul 2001 Resume http://www.inria.fr/...

26 B. Nguyen BDA 200226 Implémentation Bibliothèque de services web génériques pour laide a la création dentrepôts Crawler Classification (THESUS) Diff (evolution temporelle de lentrepôt) Moteur de requêtes Présentation (XSLT) AXML (O. Benjelloun)

27 B. Nguyen BDA 200227 3- Objectifs futurs

28 B. Nguyen BDA 200228 Quelques pistes… Méthodologique: Approche a la UML Définition de concepts simples Présentation graphique compréhensible/ ergonomique Solution dimplémentation directe Quel modèle/langage conceptuel? Amélioration des services Plus évolues Plus interdépendants Gestion du travail coopératif Gestion des utilisateurs Problèmes de sécurité

29 B. Nguyen BDA 200229 Questions?


Télécharger ppt "B. Nguyen BDA 20021 Construction and Maintenance of a SPIN (Set of Pages of Interest) using Active XML Serge Abiteboul, Grégory Cobena, Benjamin Nguyen,"

Présentations similaires


Annonces Google