La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Organisation de l’entrepôt edot Revue RNTL edot 29 Juin 2004 Bernd Amann, Jérôme Baumgarten, Benjamin Nguyen.

Présentations similaires


Présentation au sujet: "Organisation de l’entrepôt edot Revue RNTL edot 29 Juin 2004 Bernd Amann, Jérôme Baumgarten, Benjamin Nguyen."— Transcription de la présentation:

1 Organisation de l’entrepôt edot Revue RNTL edot 29 Juin 2004 Bernd Amann, Jérôme Baumgarten, Benjamin Nguyen

2 2 Revue E.Dot 29/6/2004 Entrepôt e.dot : Architecture Xyleme ActiveXML Miel++ Services edot Entrepôt edot CG BD Interface edot ACWare

3 3 Revue E.Dot 29/6/2004 Entrepôt e.dot Entrepôt de travail Échange de données entre les services Stockage des résultats intermédiaires (validation)  Schéma « orienté-services » Entrepôt final Interrogation par MIEL++  Schéma « orienté-domaine »

4 4 Revue E.Dot 29/6/2004 Entrepôt de travail Toutes les données (paramètres, fichiers etc…) utilisées et générées par les services edot sont stockées dans un entrepôt Le déclenchement des services (workflow) est implicite et contrôlé par l’entrepôt

5 5 Revue E.Dot 29/6/2004 Organisation de l’entrepôt : Modèle ACWare Modélisation des données : Types de données : types simples + constructeurs de types complexes (n-uplet, collection) + clés Schéma : organisation des données Modélisation des services : Règles de mise-en-correspondance : Schéma  entrées/sorties de services Web Modèle : Xquery (extraction) + Xupdate (MAJ)

6 6 Revue E.Dot 29/6/2004 Entrepôt de travail : Contenu et Structure Globale Initialisation : Parmètres d’initialisation du crawler Ontologie Un ensemble de pages web Un ensemble de documents PDF Un ensemble de documents Excel Pour chaque document/page: Les résultats des traitements appliqués (services edot) E.Dot PageWeb Initialisation PDFDoc ExcelDoc

7 7 Revue E.Dot 29/6/2004 Initialisation UrlsExclus Ontologie Version String UrlsIncl Souscriptions MaxDur MaxNum Crawl E.Dot

8 8 Revue E.Dot 29/6/2004 Ontologie edot Ontologie SymPrevius infos Combase traduction Merge synonymes schemaRel taxonomie Initialisation

9 9 Revue E.Dot 29/6/2004 Pages web PageWeb String Acqu Xtab SML URL Les documents (pdf, excel) et le pages web sont les unités centrales de l’entrepôt auxquelles on applique des traitements Chaque document/page est identifié par une URL (clé) Les résultats des traitements sont stockés « avec » le document/la page E.Dot

10 10 Revue E.Dot 29/6/2004 Phase Acquisition Xyleme Crawler : Fonction : crawl exhaustive et filtrage brut (monitor) Résultat : {(URL, mots clés)} E.Dot Filter : Fonction : crawl + filtrage intelligent Résultat : {(URL, contenu, score) Thesus : Fonction : classement Résultat : {(URL, mots clés)} Filter Crawl Date Thesus Acqu String PageWeb

11 11 Revue E.Dot 29/6/2004 Crawl Id Souscription Int String Date String xsxs:date [1] [0..*] xs:string [1]xs xsxs:string [1] xsxs:string [1] Xquery/Xupdate

12 12 Revue E.Dot 29/6/2004 Thesus Initialisation : Activate = true Le service Thesus et lancé périodiquement avec le résultat d’une requête XQuery qui retourne les URLs des pages avec Activate = true Les résultats obtenus sont stockés dans l’entrepôt avec la page traitée et Activate := false Thesus Activate true Keywords Date 17/6/04 false aliment ph

13 13 Revue E.Dot 29/6/2004 EdotFilter Filter Requête Activate Boolea n Date Texte Score Contenu Type

14 14 Revue E.Dot 29/6/2004 Schéma : ExcelDoc et pdfDoc

15 15 Revue E.Dot 29/6/2004 Implantation de l’entrepôt Le schéma ACWare est traduite en application ActiveXML : Ensemble de documents XML intensionnels accessibles à travers des requêtes XQuery publiées sous forme de services Web Limitations actuelles : Gestion de grands volumes de documents/données Outils d’exploration et de validation de l’entrepôt

16 16 Revue E.Dot 29/6/2004 État d’avancement Travail accompli : Définition des signatures WSDL des services edot Définition du schéma ACWare de l’entrepôt de travail Travail en cours: Intégration des services edot (requêtes entrées/sorties) dans le schéma ACWare Interface graphique de conception et de pilotage interactif (pour la validation) Intégration ActiveXML/Xylème Zone Server


Télécharger ppt "Organisation de l’entrepôt edot Revue RNTL edot 29 Juin 2004 Bernd Amann, Jérôme Baumgarten, Benjamin Nguyen."

Présentations similaires


Annonces Google