1 e.dot – septembre 2002 1 e.dot Entrepôts de Données Ouverts sur la Toile RNTL.

Slides:



Advertisements
Présentations similaires
Les technologies décisionnelles et le portail
Advertisements

Description des services EEN Module B: opportunités technologiques Eric Chataigné Delivery Manager – Intrasoft International Rabat – Maroc 07 Avril 2009.
Internet et le client- serveur Licence Pro IE Cours Internet / Intranet Le Web HTML Protocoles Le client universel Contenus dynamiques.
N.C. – Décembre Page : 1 Action Syntax Identification des priorités daction EADS S&DE - BDSI / IT N. CHANCHEVRIER.
Introduction Pour concrétiser l’enseignement assisté par ordinateur
« ARCHEODOC, un portail dynamique pour la recherche d’information en archéologie » Véronique HUMBERT (Lattes) Blandine.
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Page 1 Direction Scientifique 2005 GET Recherche Enseignement et Recherche au service de la Société de lInformation Groupe des Ecoles des Télécommunications.
Les Web Services.
Diffusion Nationale TOULOUSE -Mars 2006 Structure et Services « STS » Les échanges.
Institut national du cancer Mise en place de la veille sur le cancer Lyon, 26 octobre 2005 Ingrid Aubry.
IronWEB : Une architecture distribuée
ETAPES DE LA RECHERCHE DOCUMENTAIRE
CERN – Organisation Européenne pour la Recherche Nucléaire Services dInformation Administrative Le projet DocLeg et léchange électronique de données personnelles.
Création du site internet de la société Accueil Chef de projet : Jean julien GUYOT.
La GSL : un outil pour mutualiser linformation scientifique Guilde des Doctorants © Guilde des Doctorants – 2001.
ASA Algerian scientific Abstracts المستخلصات العلمية الجزائرية
E.Dot – juillet 2005 Page 1 Projet R.N.T.L. e.Dot – Entrepôts de Données Ouverts sur la Toile – Organisation et Structuration.
Communication Scientifique
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Etude des Technologies du Web services
Intégrer IdRef dans les applications documentaires de votre université. Pourquoi ? Comment ? Atelier JABES2011.
Lexemple dun master en agroalimentaire. Contexte Déroulement du projet La formation Les acteurs Le transfert pédagogique Bilan Conclusion.
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
COPIL SINP 28/03/2014 PRÉSENTATION DES APPLICATIONS OGAM (WEB ET NOMADE)
Introduction à KB Crawl
Annotations sémantiques pour le domaine des biopuces
Le portail des MSH
Intégration ActiveXML - Xyleme
Modèle d’entrepôt de données à base de règles
Production des supports multi-média et denseignement à distance : Aspects conceptuels et pédagogiques. Dr Riadh Gouider, Faculté de Médecine de Tunis 2006.
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Catalogage de données Notions, enjeux et initiatives actuelles.
Création du site Internet du Centre des Ressources Informatiques
Vers une génération automatique du mapping de sources biomédicales
Internet et le client- serveur Licence Pro IE Cours Internet / Intranet Le Web HTML Protocoles Le client universel Contenus dynamiques.
Présentation du projet edot Revue intermédiaire - 29 Juin 2004.
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
Organisation de l’entrepôt edot
Gestion active de l’entrepôt edot avec ACWare Revue edot du 29 Juin 2004 Lot 3 : Création de l’entrepôt S. Abiteboul, B.Amann, N. Azis, B. Nguyen, G. Ruberg.
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
Atelier de recherche en gestion internationale
E-Technology lab Plateformes, Technologies et Architectures pour les systèmes eGouvernement Par: Dr Mamadou Koné Université Laval, Québec, Canada et Houda.
LES INFOS de Philippe et Patrick Journal d'informations en ligne Infospp.free.fr Mai 2006.
MEMOIRE INDUSTRIEL ESIEA
Dr Ph CARDI - Interfaces 27/09/2001 Configuration des logiciels par les Praticiens de Santé mythe ou réalité Copyright 2001 © Intensive Care View.
Présentation du rapport « Financements innovants de l’efficacité énergétique » Point presse Inès Reinmann – Olivier Ortega 18 février 2013 Plan Bâtiment.
Web sémantique est pratique documentaire
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
Recherche d’information
LE DATA WAREHOUSE.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
© WYNIWYG / Communication, reproduction interdite sauf autorisation.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
1 Deux exemples de management (et d’organisation) de la recherche : le CNRS et l’INRIA Club EEA, Tours, 13 mai 2009.
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
Edot Groupe de travail sur l’intégration. Le problème Intégration de nouvelles données avec les données existantes dans l’entrepôt Les données existantes:
La veille à l’Institut national du cancer Identifier des sources d’information fiables Rencontre De la veille à la gestion des connaissances, Bordeaux,
TEXT MINING Fouille de textes
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Responsable : Serge Hamon
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
R ETOURS SUR LE PROJET DISTIL ET PERSPECTIVES 2011 Sylvie Ranwez Gérard Dray.
Proposition de possibilité d’évolution de nos spécialités Deux projets (liés) : Projet 1 : Informatique Computationnelle – Etudiants 4 e et 5 e IR Projet.
Atelier n°3 : Schéma de diffusion des données sur l’eau dans les bassins 24 mars 2011.
Lancement du projet de refonte du portail eaufrance Groupe de coordination inter bassins 28/01/2014 – Anne Macaire.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Refonte du portail eaufrance : Etat d’ avancement GCIB - 29/04/2014 – Anne Macaire.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
module SIE depuis 2011 et IAMD depuis l’an dernier ! Gestion de Masse de Données (GMD) Introduction Adrien Coulet
Transcription de la présentation:

1 e.dot – septembre e.dot Entrepôts de Données Ouverts sur la Toile RNTL

2 e.dot – septembre Organisation Introduction Objectifs de e.dot Retombées techniques et commerciales Partenaires Principes de base Organisation Financement

3 e.dot – septembre Introduction: le contexte

4 e.dot – septembre De plus en plus d’informations utiles pour les entreprises Milliards de pages et millions de serveurs Que trouve-t-on sur le Web public et privé ? –Des documents (HTML, doc, pdf…), des données semi structurées (XML, formats exotiques), des données structurées (« hidden Web » -- accès BD via formulaires, services Web), Qualité médiocre: spamming, données pas à jour Requêtes par mot clé pour obtenir des pages Intégration d’information: basées sur des adapteurs (wrappers) La toile aujourd’hui

5 e.dot – septembre Ce qui est en train de changer Format d’échange universel (XML) –Mariage entre documents et bases de données –Standard de langage de requêtes: XQuery Services Web (SOAP, WSDL) –Format pour exporter des services sur le Web –Format pour encapsuler des requêtes Web sémantique (RDF, etc.) –Indispensable pour pouvoir trouver et utiliser l’information Le projet e.dot est fondé sur ces technologies

6 e.dot – septembre Objectifs de e.dot

7 e.dot – septembre Objectifs Génériques: Outils pour construire des entrepôts de données thématiques en découvrant des données sur le Web et en enrichissant des systèmes d’information existants par intégration automatiques de ces données Particulier: Développer un entrepôt de données XML intégrant de manière automatique des informations liées au risque de contamination des aliments, qu’elles soient issues du Web, privées ou obtenues sous licence Appel d’offre: étendre les systèmes d’information collectifs ou individuels via Internet

8 e.dot – septembre Principes de base Surveillance continue du Web : – Crawling du Web HTML et XML – Classification automatique des pages d’intérêt Intégration simple dans l’entrepôt : – Récupération automatique des données (en particulier XML) traitant du risque de contamination des aliments – Possibilité d’enrichir les documents XML Interrogation très fine des données stockées : – Ecrans intuitifs et spécifiques – Navigation dans le corpus via des hyperliens. – Mise en place de thésaurus agro-alimentaire Fourniture rapide de réponses précises : – Liste triée de réponses – Calcul original de la pertinence – Accès direct aux éléments du document – Granularité des réponses – Gestion de liens vers des documents PDF, photos…

9 e.dot – septembre Architecture simplifiée + BD relationnelles

10 e.dot – septembre Innovations et points forts Un projet en rupture avec l’existant : vers le « tout- XML » Surveillance automatique du Web (XML, HTML…) Extraction automatique de données de sources hétérogènes Classification thématiques des informations récupérées Intégration sémantique de données hétérogènes Stockage des données dans un entrepôt natif XML Utilisation du langage de requêtes Xquery

11 e.dot – septembre Retombées

12 e.dot – septembre Retombées directes La création de nouveaux outils logiciels et de services dans l’offre de Xyleme La construction d’un entrepôt de données sur le « risque de contamination des aliments » directement opérationnel pour les industriels de l’agro-alimentaire Des avancées technologiques en matière d’intégration de données et de recherche d’informations sur le web

13 e.dot – septembre Retombées commerciales Patrick Ferran

14 e.dot – septembre Retombées dans le domaine du risque de contamination des aliments Passer de bases de données disparates existantes à un entrepôt uniforme, facilitant l'évaluation du risque de contamination des aliments La connaissance sur le risque des aliments étant un domaine émergeant, fort intérêt des industriels pour les résultats et les connaissances les plus récents (amélioration de leur réactivité face au risque) Diffusion à tous les industriels, y compris les PME de l'agro-alimentaire qui ont peu de moyens d'accès à l'information

15 e.dot – septembre Partenaires

16 e.dot – septembre Partenaires Une entreprise experte des technologies liées à XML : Xyleme –Guy Ferran (Directeur Technique) Trois équipes de recherche en informatique : –BIA/INRA-INAPG: O. Haemmerlé et P. Buche (MDC) –Verso/INRIA: B. Amann (MDC) et S. Abiteboul (DR) –IASI/Paris11: M.-C. Rousset (Prof) et N. Pernelle (MDC)

17 e.dot – septembre Xyleme SA Xyleme, spécialisée dans la recherche et l’intégration de larges volumes de contenus XML hétérogènes et multi sources. Xyleme a développé un entrepôt de données XML très performant + un crawler puissant qui permet de surveiller le Web de façon très pointue Xyleme a été créée en 2000 à partir de travaux de Verso/INRIA Aujourd’hui: environ 30 personnes (20 techniques), capitaux de DB, Viventure, SGAM

18 e.dot – septembre BIA/INRA – INA P-G –BIA est spécialisée dans la représentation et l'interrogation de connaissances incomplètes, imprécises et faiblement structurées –Le domaine d'application est l'évaluation du risque lié à la contamination des aliments –BIA participe au projet national Sym'Previus (mise en place d'un système d'information sur le risque microbiologique des aliments) –5 enseignants-chercheurs et chercheurs de l'équipe sont concernés par le projet e.dot

19 e.dot – septembre Verso/INRIA Projet de Recherche de l’INRIA-Rocquencourt; transfert prochain à INRIA-Futurs/Saclay Equipe spécialisée dans les bases de données XML et le Web –Projet Européen DbGlobe (mi-parcours) –Travaux ayant conduit à la création de Xyleme –Projet GAEL (RNRT) Devient début 2003 composante de Gemo/INRIA-Futurs

20 e.dot – septembre IASI/Paris11 –Laboratoire de Recherche en Informatique –Equipe spécialisée dans la représentation de connaissances et la médiation de données via des ontologies Projet PICSEL et PICSEL2 (avec France Télécom R&D) Projet GAEL (RNRT) Action spécifique du CNRS sur le Web sémantique –Devient début 2003 composante de Gemo

21 e.dot – septembre Organisation de e.dot

22 e.dot – septembre Organisation du projet Tous les partenaires participent à tous les sous projets Sous projet 1 (BIA): spécification d’un entrepôt de données pour le risque de contamination des aliments Sous projet 2 (Xyleme): acquisition de données du Web Sous projet 3 (IASI): organisation et structuration de l’entrepôt Sous projet 4 (BIA): validation auprès des utilisateurs Durée 2 ans

23 e.dot – septembre Sous projet 1: Spécification de l’entrepôt Analyse des besoins –Avec l’aide de biologistes et d’industriels, analyse des manques dans la base existante Sym’Previus –Analyse du contenu d’autres bases nationales ou internationales –Analyse de sites du Web qui pourraient contenir des informations intéressantes

24 e.dot – septembre Sous projet 2: Acquisition A partir de bases de données structurées ou de bases documentaires Spécification déclarative de la recherche et de l’intégration de données Import et stockage dans un entrepôt XML Découverte de données sur le Web Exploration du « hidden Web » Pré validation par BIA des données

25 e.dot – septembre Sous projet 3: Organisation de l’entrepôt Extraction des méta données Définition du schéma global de l’entrepôt Réalisation d’un environnement de spécification d’entrepôt Maquette

26 e.dot – septembre Sous projet 4: Validation De l’architecture Des différents modules De l’information obtenue Dans cette dernière phase, on incitera les partenaires de Sym’Previus à diffuser leurs informations sur le Web via ce nouveau média

27 e.dot – septembre Financement original demandé XylemeINRIABIALRITotal Coût Auto Aide demandée

28 e.dot – septembre Conclusion Présentations complémentaire possibles –Xyleme SA (G. Ferran) –Active XML: intégration de services Web dans des documents XML (B. Amann) –TreeFinder: Fouille de données XML (M.-C. Rousset) –Entrepôt de données sur le risque de contamination des aliments (O. Haemmerlé)

29 e.dot – septembre Merci