Présentation du projet edot Revue intermédiaire - 29 Juin 2004.

Slides:



Advertisements
Présentations similaires
Les technologies décisionnelles et le portail
Advertisements

Les fonctionnalités de STAR : archivage, signalement et diffusion STAR 8ième cercle le 27 septembre 2013.
Xavier Blanc Web Services Xavier Blanc
N.C. – Décembre Page : 1 Action Syntax Identification des priorités daction EADS S&DE - BDSI / IT N. CHANCHEVRIER.
19 septembre 2006 Tendances Logicielles IBM Rational Data Architect Un outil complet de modélisation et de conception pour SGBD Isabelle Claverie-Berge.
Connecter des données métier à Office SharePoint Server 2007 via le Business Data Catalog.
Analyse et innovation curriculaires de lEducation Pour Tous en Afrique Subsaharienne I. Rappel de la structure de loutil première version II. Rappel des.
Navigation Interactive dans les documents
Intégrer vos données avec.
TP 3-4 BD21.
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
> a patent search service supplied by Patents & Technology Surveys Ltd PROFESSIONAL ONLINE PATENT INFORMATION SERVICE.
Septembre Interconnexion entre HAL et dautres systèmes dinformation.
E.Dot – juillet 2005 Page 1 Projet R.N.T.L. e.Dot – Entrepôts de Données Ouverts sur la Toile – Organisation et Structuration.
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
XML-Family Web Services Description Language W.S.D.L.
Développement d’IHM* et d’applicatifs spécifiques
Annotations sémantiques pour le domaine des biopuces
Développement d’IHM* et d’applicatifs spécifiques
Le portail des MSH
Revue qualité Equipe 24 - groupe B1 - ING  Présentation du Projet  Méthodologie  Dates et points clés  Responsabilités  Critères d’acceptation.
La problématique de la recherche de document Journée de formation 29 février 2008.
Intégration ActiveXML - Xyleme
Les concepts et les méthodes des bases de données
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Projet de Master première année 2007 / 2008
Les techniques des moteurs de recherche
Vers une génération automatique du mapping de sources biomédicales
Bases de données phénotypique et ontologie
De l’extraction des connaissances au Knowledge Management
La veille numérique : un outil pour s'informer intelligemment &
ISICIL Mai 2010 Nicolas Delaforge Architecture serveur(s) et prototypes de social bookmarking/tagging dans ISICIL Avancement technique.
2.1 Le sujet et la question de recherche
Dominique Buffet Ministère de la Région Wallonne
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
Organisation de l’entrepôt edot
La sécurité alimentaire L’existant
E.Dot – juillet 2005 Page 1 Projet R.N.T.L. e.Dot – Entrepôts de Données Ouverts sur la Toile Rapport Final 4 juillet.
Gestion active de l’entrepôt edot avec ACWare Revue edot du 29 Juin 2004 Lot 3 : Création de l’entrepôt S. Abiteboul, B.Amann, N. Azis, B. Nguyen, G. Ruberg.
Réaliser et diffuser un projet intégrant les TIC
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
Concepts. Procédures 1 EWS Excel Web Services. © Partouche David / 2007 version 0.1 Présentation des Excel Services Définition de base : Excel Services.
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
Content Management System CMS. Pourquoi ? Obligation de ressaisir des contenus publiés à plusieurs endroits Pas d’outils de gestion de qualité de l’information.
L’art 3D. Le but Le site a pour but de faire découvrir au monde de nouveaux artistes 3D. Il permet de faire connaitre au public la scène 3D. Il est autant.
Ontologies et description du contenu de documents AV : Une expérimentation dans le domaine médical Mardi 31 mai 2005 Raphaël Troncy 1 & Antoine Isaac 2.
Atelier de recherche en gestion internationale
Arrondissement.com : un concept de cybercollectivité locale Un espace d’expression, de publication et de collaboration pour tous les acteurs (citoyens,
Présentation du produit
09/11/2006 CMS Content Management System Système de Gestion de Contenu.
Soutenance ProJet Individuel
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Moteurs de recherche ontologiques
Web sémantique est pratique documentaire
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
Recherche d’information
1 e.dot – septembre e.dot Entrepôts de Données Ouverts sur la Toile RNTL.
Visualisation d’un entrepôt de données Pré soutenance technique
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
© WYNIWYG / Communication, reproduction interdite sauf autorisation.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
 Formulaires HTML : traiter les entrées utilisateur
Cours MIAGE « Architectures Orientées Services »Henry Boccon-GibodCours MIAGE « Architectures Orientées Services »Henry Boccon-Gibod 1 Architectures Orientées.
Edot Groupe de travail sur l’intégration. Le problème Intégration de nouvelles données avec les données existantes dans l’entrepôt Les données existantes:
La veille à l’Institut national du cancer Identifier des sources d’information fiables Rencontre De la veille à la gestion des connaissances, Bordeaux,
19/9/03Réunion plénière E.Dot E.Dot – Épisode 2. 19/9/03Réunion plénière E.Dot Objectif: Athènes 2004 Application/démo –Interface de consultation uniforme.
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Responsable : Serge Hamon
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
module SIE depuis 2011 et IAMD depuis l’an dernier ! Gestion de Masse de Données (GMD) Introduction Adrien Coulet
Transcription de la présentation:

Présentation du projet edot Revue intermédiaire - 29 Juin 2004

Revue E.Dot 29/6/2004 De plus en plus d’informations utiles pour les entreprises accessibles via le Web Requêtes par mot clé pour rechercher des pages web Que trouve-t-on sur le Web public et privé ? Des documents (HTML, doc, pdf…), des données semi structurées (XML), des données structurées (BD relationnelles) Motivations

Revue E.Dot 29/6/2004 Ce qui est en train de changer Format d’échange universel (XML) Mariage entre documents et bases de données Standard de langage de requêtes: XQuery Services Web (SOAP, WSDL) Format pour exporter des services sur le Web Format pour encapsuler des requêtes Web sémantique (ontologies) Trouver et utiliser l’information pertinente Le projet e.dot est fondé sur ces technologies

Revue E.Dot 29/6/2004 Objectifs d’edot Génériques Outils pour construire des entrepôts de données thématiques en découvrant des données sur le Web et en enrichissant des systèmes d’information existants par intégration de ces données Particulier Développer un entrepôt de données XML intégrant de manière automatique des informations liées au risque de contamination des aliments, qu’elles soient issues du Web, privées ou obtenues sous licence

Partenaires

Revue E.Dot 29/6/2004 Calendrier Labelisation par le RNTL : mai 2002 Date de début officielle : janvier 2003 durée : 2 ans Notification : Juillet-Septembre 2003 Demande d’avenant en Janvier 2004 date de fin : juin 2005 rapport intermédiaire : juin 2004

Revue E.Dot 29/6/2004 Organisation du projet Tous les partenaires participent à tous les sous projets Sous projet 1 (BIA): spécification d’un entrepôt de données pour le risque de contamination des aliments Sous projet 2 (Xyleme): acquisition de données du Web Sous projet 3 (IASI): organisation et structuration de l’entrepôt Sous projet 4 (BIA): validation auprès des utilisateurs Durée 2 ans et demi

Revue E.Dot 29/6/2004 Spécification de l’entrepôt Analyse des besoins Avec l’aide de biologistes et d’industriels, analyse des manques dans la base existante Sym’Previus Analyse du contenu d’autres bases nationales ou internationales Analyse de sites du Web qui pourraient contenir des informations intéressantes

Revue E.Dot 29/6/2004 Données existantes 2 formats différents BD relationnelle BD semistructurée Ontologie commune Hiérarchie de termes Noms d’attributs ou de valeurs d’attribut du schéma relationnel Noms de concepts du schéma de graphes Exemple: produit, scarole, germe, listeria

Revue E.Dot 29/6/2004 Interface de requêtes commune L’ontologie: sert de schéma médiateur entre les utilisateurs et les 2 bases de données MIEL: langage de requêtes simple critères de sélection + attributs de projection quels sont tous les germes contaminants de la scarole ? Requêtes exécutées sur la BD relationnelle et sur la BD de graphes

Revue E.Dot 29/6/2004 Nos choix Se servir de l’ontologie existante pour intégrer de nouvelles données Choix cohérent avec celui fait pour l’acquisition Nécessite de savoir/pouvoir caractériser les nouvelles données en fonction de l’ontologie Problème inverse de ce qu’on fait habituellement en BD Pour pouvoir interroger de façon uniforme (via MIEL) les données existantes et les données nouvelles

Revue E.Dot 29/6/2004 Données extérieures utiles Des pages Web ou des documents (XML, pdf, doc) localisés par le crawler de Xylème Des sites bibliographiques répertoriant des articles scientifiques (en pdf) portant sur le risque alimentaire Des fiches excel transmises par des experts Des bases de données de partenaires de Sym’Previus : ComBase

Revue E.Dot 29/6/2004 Principales tâches Crawling et filtrage de pages web Extraction de données structurées de documents html, pdf ou excel Transformation de ces données en XML avec le plus possible de balises provenant de l’ontologie Résultat: base documentaire en XML annotée par les termes de l’ontologie Reformulation des requêtes MIEL en des requêtes XML Résultat: interrogation uniforme des données existantes et des données ajoutées

Revue E.Dot 29/6/2004 Vue globale Relational tables Conceptua l graphs MIEL existing data Web Combase Exce l files external data Bibliographic sites crawling + filtering structure extracting semantic tagging XML

Revue E.Dot 29/6/2004 Architecture E.Dot

Revue E.Dot 29/6/2004 Data flow Crawler EdotFilter Store Validation Miel++ External DBs Web Any2SML Workspaceurl doc Thesu url+meta Ontology query data docdata Expert

Revue E.Dot 29/6/2004 Exposés du matin Modules de Crawling et filtrage Crawl + thesu EdotFilter Modules d’extraction et transformation des données en XML Any2Xtab Xtab2SML PDF2SML

Revue E.Dot 29/6/2004 Exposés de l’après-midi Modules d’interrogation MIEL++ Couplage entre ontologies Plateforme d’intégration ACWare Schéma de l’entrepôt de travail Démonstrations Conclusion