1 Le Store WebContent Benjamin NGUYEN UVSQ & INRIA-SMIS Spyros ZOUPANOS U.Paris Dauphine & INRIA-LEO Workshop Sources Ouvertes et Service – Caen 2010.

Slides:



Advertisements
Présentations similaires
droit + pub = ? vincent gautrais professeur agrégé – avocat
Advertisements

RAPPORT et TAUX Objectif.
Table des matières En famille Part 1 Ma famille Subject pronouns
Département fédéral de lintérieur DFI Office fédéral de la statistique OFS Implementing the economic classification revision (NACE / ISIC) in the Business.
(Nom du fichier) - D1 - 01/03/2000 FTR&D/VERIMAG TAXYS : a tool for the Development and Verification of RT Systems a joint project between France Telecom.
Échanger connaissances et techniques sur les routes et le transport routier 1 The PIARC Website.
Formalisme noyau : Graphes Conceptuels de Base. Ball:* Cube:* Ball:* Color:* Cube:A between carac onTop Labels are taken in the vocabulary (or support)
The Partitive French 1 Ch 8. What is the partitive? When discussing food, you need to be able to indicate whether you are talking about a whole item or.
How to say 'the' Definite article:. In English, you only have one definite article, and it is THE Le Musée de la Musique La Place de la Bastille.
All. There are several forms of the word all. It will agree with the noun it describes and precedes. It will have an article after it. It can also be.
Inforoute Santé du Canada Les défis de linteropérabilité en e-santé Mike Sheridan, Chef de lexploitation 19 mai 2006.
Talking about yourself
OTB Analog module: Input configuration with TSX PREMIUM (TSXCPP110)
Les verbes en -er. chanter – to singtelephoner – to call danser – to dancetravailler – to work diner – to have dinnervoyager –to travel ecouter – to listen.
interaction in the .LRN platform
Cliquez et modifiez le titre Cliquez pour modifier les styles du texte du masque Deuxième niveau Troisième niveau Quatrième niveau Cinquième niveau 23/01/2014©
Cliquez et modifiez le titre Cliquez pour modifier les styles du texte du masque Deuxième niveau Troisième niveau Quatrième niveau Cinquième niveau 23/01/2014©
H. Stanistreet Exercice #22 Translate: Are there books in the classroom? Yes, there are books in the classroom. Are there markers in the classroom? No,
Status report SOLEIL April 2008
Réseau des Tribunaux référents Network of Pilot Courts 5. Quels indicateurs pour mesurer la qualité de la justice? Which indicators for measuring the quality.
Xpath XPath is a language for finding information in an XML document.
Georges Gardarin 1 LE LANGAGE DE REQUETES SQL l Origines et Evolutions l SQL1 86: la base l SQL1 89: l'intégrité l SQL2 92: la nouvelle norme l SQL3 98:
Reading an analog clock
Université Des Sciences Et De La Technologie DOran Mohamed Boudiaf USTO République Algérienne Démocratique et Populaire Département de linformatique Projet.
Second part Album Keet.
I want to achieve … Level 5 Writing. Level 5 is considered the gold standard at the end of Key Stage 3 … if you can get a Level 5 you are in a strong.
Defence R&D Canada R et D pour la défense Canada Novel Concepts for the COP of the Future Denis Gouin Alexandre Bergeron-Guyard DRDC Valcartier.
XQuery 1. Introduction 2. Modèle de données 3. XQuery par l'exemple
Y and en Two little words with a lot of meaning. y.
Les pluriels Sometimes you cant just take one!. Les articles… There are « DEUX » articles that can show that something is plural. Les = the Les ciseaux,
Electronic Portfolio/ Portfolio électronique QPAT
Les matières WALT: Talk about school subjects in French Give our opinion about subjects and say why.
Quelle heure est-il? What time is it?.
Mise en œuvre du langage MDX - 1 ère partie- Présentation de lexemple et des outils utilisés -1-
How to solve biological problems with math Mars 2012.
Proposition for a new policy for MAPMT Gain Control Sylvie Dagoret-Campagne LAL EUSO-BALLOON 8th Progress meeting1.
1 Les pointeurs et quelques rappels sur certains éléments du langage C.
TortoiseSVN N°. Subversion : pour quoi faire ? Avoir un espace de stockage commun – Tous les étudiants du SIGLIS ont un espace svn commun Partager vos.
Historique de SystemC Regroupe 4 courants didées: SCENIC Project : Synopsys+UC Irvine Philips System-Level Data Types, VSIA SLD DWG IMEC, Hardware-Software.
GRAMMAIRE Révision des verbes réflexives Les verbes et grammaire Fill in the phrases with the missing words: 1.Bonjour, comment vous sentez-_______?
Laboratoire de Bioinformatique des Génomes et des Réseaux Université Libre de Bruxelles, Belgique Introduction Statistics.
1 CSI 2532 Lab5 Installation de JDBC Février 13, 2012.
Match-up the numbers to the letters
Cest mercredi le neuf octobre Le plan! 1.Révisions 2.Vocabulaire 3.Jouer 4.Ecouter 5.Parler Il fait beau! Le but! Les couleurs!
Jeudi le 7 novembre. F 3 DUE: Virtual tour in LMS by 7:30 for the 70! DUE: Flashcards also for the 70 today (50 Friday) 1. Poem practice Le dormeur du.
Finger Rhyme 6 Summer Term Module 6 Culturethèque-ifru2013 May not be copied for commercial purposes.
CLS algorithm Step 1: If all instances in C are positive, then create YES node and halt. If all instances in C are negative, create a NO node and halt.
Donnez l’heure “Time”… it’s a ticking!.
Les nombres.
How many of these flags do you recognise? Work with your partner to see if you know many – write them down - some will crop up shortly!
How many of these flags do you recognise? Work with your partner to see if you know many – write them down - some will crop up shortly!
BIOS – – SADI Semantic Automated Discovery and Integration Sébastien Carrere.
Français I. Une fille française Gabrielle est française. Elle est blonde. Elle est belle. Elle est de Paris.
Chapitre 3 Les bibliothèques de balises JSP et la JSTL
Réseaux de nouvelle génération et Internet : propositions pour le futur Alistair URIE Membre du Board d’ETSI Président du groupe de réflexion d’ETSI sur.
Différencier: NOMBRE PREMIER vs. NOMBRE COMPOSÉ
Branche Développement Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire.
Leçon 4: L’heure Mlle Muhr French 1. The Hour There are 60 minutes in every hour. Each hour can be divided into 4 parts: 15/60 or 1/
Study & revise the numbers carefully.
Quelle heure est-il? What time is it ?.
Formatting of Game © Candace R. Black, Al rights reserved. Révisions!
Unité 4 La grammaire d’Unité 4. Avoir - to have j‘ai nous avons tu as vous avez il a elles ont o Quel âge as-tu? – How old are you? o avoir… ans – to.
Ministère de l’Éducation, du Loisir et du Sport Responsables des programmes FLS et ELA: Diane Alain et Michele Luchs Animateurs: Diane Alain et Michael.
Slide 1 of 39 Waterside Village Fête ses 20 ans.
Mise en œuvre du langage MDX
IP Multicast Text available on
© by Vista Higher Learning, Inc. All rights reserved.4A.1-1 Point de départ In Leçon 1A, you saw a form of the verb aller (to go) in the expression ça.
Transcription de la présentation:

1 Le Store WebContent Benjamin NGUYEN UVSQ & INRIA-SMIS Spyros ZOUPANOS U.Paris Dauphine & INRIA-LEO Workshop Sources Ouvertes et Service – Caen 2010

2 Plan 1.Enjeux de lutilisation dun SGBD XML 2.Exemple du store centralisé 3.Store P2P

3 Enjeux de lutilisation dun SGBD XML

4 Architecture de WebContent XML !!

5 Le format pivot (UML)

6 Le format pivot (exemple XML) Les schémas XML Un exemple de document

7 Paradigme des Services Web Un modèle pivot de documents basé sur UML et implémenté par un XML Schema Des données échangées via des services web en XML Un traitement en interne des informations par des programmes en C, Java, etc…

8 Quelle utilisation des documents ? Stockage Définition dune URI Sert de référence future Récupération Intégralité du document indexation des documents Sous partie du document indexation structurelle Requêtes utilisation dun langage de requête (XQuery) Modification de la structure du document Jointure entre documents Modification (possiblement concurrente) des documents lors dune chaîne de traitement problème dincohérences / redondance Il faut utiliser un véritable SGBD et pas simplement des fichiers !

9 Store centralisé

10 Construction du StoreService Problème : Construire un wrapper de Web Service sur une base de données XML déjà existante (eXist, MonetDB, SQL Server, Quizx, … Sedna ?) Choix dun SGBD existant performant & fonctionnel (et des interfaces existant par rapport au langage dinterrogation) Caractéristiques Passage à léchelle –Nombre de documents (ok?) –Nombre de requêtes (pb?) Robustesse Reprise sur panne

11 Fonctionnalités Stockage dun document du modèle Génération de lURI Récupération du document Dans son intégralité Juste une sous partie Basé sur lutilisation des URIs WebContent Requêtes XQuery complexes sur les documents

12 Démo du store centralisé

13 Enseignements Lutilisation simple de fichiers naurait pas fonctionné Le système passe à léchelle en terme de documents (plusieurs milliers) Un système dindexation simple aurait pu suffire Peu de fonctionnalités véritables du SGBD ont été utilisées Il est difficile de séparer le service de stockage du service dinterrogation

14 3- Store P2P

15 Outline of P2P services SOAP access Local P2P SPARQL processor Local P2P XML- AXML query processor Local P2P XML- AXML query optimizer XML store + Xquery processing Local part of the P2P index File storage Peer 2 Peer 4 Peer 1 Peer 3

16 Peer-to-peer storage service Implemented jointly by several peers DHT service is implemented on top of DHTs Basic functionality of a DHT put(k,v) get(k) Different DHTs may have different algorithmic properties Goal: combine the advantages of the available DHTs

17 KadoP Index keys: all element & attribute names Index values: structural identifiers (docID, start, end) Kadops query language: tree pattern language each node is labeled with a XML node or word edges are / or // Query evaluation: holistic join on the list of identifiers associated to the query node labels Advantage: fast tree patern query execution based on the one and only holistic join

18 PathFinder Index keys: linear parent-child rooted paths Index values: sorted docId list of documents that contain a given path PathFinders query language: conjunctions of disjunctions of atomic path expressions atomic path: XPath with child axis + predicate Special hash function: keys that are lexicographically close are stored to peers that are close between themselves Advantage: inequality queries e.g. /article[ year > 2005 ]

19 Movies AXML language Data-centric Web service composition ActiveXML document = XML document including calls to (continuous) Web services A service call contains contact info for the Web service When the calls is activated, results are added to the document as siblings of the service call. Movies Shrek 3 Movies Shrek 3 Persepolis

20 AXML evaluation AXML document sc in d calls Activating sc entails: stream $in to p2 evaluate stream the results of to p1 p1 p2 d

21 OptimAX A rule based AXML optimizer uses an extensible set of rules (cooperates with other programs to perform better document opimization) rewrites an AXML document to another one with smaller overall evaluation cost uses statistics for document optimization

22 Putting everything together When a query arrives: it is introduced into a document d 1 d 1 is given to optimAX for optimization optimAX will cooperate with TGV – an algebraic XQuery compiler – to decompose it into sub-queries based on the type of the sub-query, optimAX will create a call to the right DHT a compensation query will be added in the new document d 2 above all the calls to the DHTs further optimization if needed will be performed d 2 will be given to the AXML engine for evaluation

23 Outline of P2P services SOAP access Local P2P SPARQL processor Local P2P XML- AXML query processor Local P2P XML- AXML query optimizer XML store + Xquery processing Local part of the P2P index File storage Peer 2 Peer 4 Peer 1 Peer 3

24 Example Original query for $d1 in /Col1/Book, $d2 in /Col2/Book where $d1/PageNo < 400 and $d2/Author = "Ullman" and $d2/Code = $d1/Code return $d2/Title OptimAXTGV

25 Example Join query for $x_0 in $in_0//res, $x_1 in $in_1//res where $x_0//Code= $x_1/Code return $x_0//Title Join query for $x_0 in $in_0//res, $x_1 in $in_1//res where $x_0//Code= $x_1/Code return $x_0//Title Tree pattern query Ullman Tree pattern query Ullman Query with inequality for $d1 in /Col1/Book where $d1/PageNo {$d1/Code} Query with inequality for $d1 in /Col1/Book where $d1/PageNo {$d1/Code}

26 SPARQL processor In WebContent there are semantic data to be queried. A semantic peer marks available resources according to the appropriate ontologies. Semantic peers interact with each other by means of mapping. With the use of ontologies and mappings, reasoning can be inferred.

27 Semantic example Query: Q(X) :- P1:Aircraft(X) Max conjunctive rewritings: R1(X) :- P1:Aircraft(X) R2(X) :- P2:Airplane(X) R3(X) :- P2:Airliner(X) R4(X) :- P2:Cargo(X) Aircraft Airplane AirlinerCargo P1 P2