Edot Groupe de travail sur l’intégration. Le problème Intégration de nouvelles données avec les données existantes dans l’entrepôt Les données existantes:

Slides:



Advertisements
Présentations similaires
Définitions Analyse documentaire
Advertisements

Projet RNRT ICare: Services évolués de signature
HTML Abda Anne Plan Présentation Structure Texte Listes Images Liens Tableaux Formulaires.
Langage de manipulation de données Ensemble de commandes permettant : – modifier la base : ajout, modification et suppression – interroger la base ex :
Benoît Piranda Équipe SISAR Université de Marne La Vallée Bases de données Algèbre relationnelle, opérations Requêtes SQL.
Informatique appliquée à la gestion Bases de données www. labri
Linq, fonctionnement et architecture
Conception de Site Webs Interactifs Cours 4
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Intégrer vos données avec.
TP 3-4 BD21.
Gestion de la persistance des objets
Bases de données Objet singleton pour la connexion
Base de données: Généralité
> a patent search service supplied by Patents & Technology Surveys Ltd PROFESSIONAL ONLINE PATENT INFORMATION SERVICE.
E.Dot – juillet 2005 Page 1 Projet R.N.T.L. e.Dot – Entrepôts de Données Ouverts sur la Toile – Organisation et Structuration.
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Contrôles d'accès aux données
Bouchra SOUKKARIEH Florence SEDES SIG - Université de Paul Sabatier
Xml/xslt : Extensible Stylesheet Language Transformation réalisé par: saÏd NAÏM.
Chap 4 Les bases de données et le modèle relationnel
Annotations sémantiques pour le domaine des biopuces
Le portail des MSH
XML: Syntaxe XML, DTD et Schémas
La problématique de la recherche de document Journée de formation 29 février 2008.
Projet Génie Logiciel & UML, Bases de Données & Interfaces
Juliette Dibie-Barthélemy2
Base de données: Généralités IFT6800 – E 2008 Pierre Poulin.
Les concepts et les méthodes des bases de données
Initiation aux bases de données et à la programmation événementielle
Initiation aux bases de données et à la programmation événementielle
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Les techniques des moteurs de recherche
Présentation du projet edot Revue intermédiaire - 29 Juin 2004.
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
Organisation de l’entrepôt edot
Content Management System CMS. Pourquoi ? Obligation de ressaisir des contenus publiés à plusieurs endroits Pas d’outils de gestion de qualité de l’information.
Création d’une communauté web scénarisée : le projet Crealys
Présentation du produit
ETAPE04 « Des besoins d’information… » « Des besoins d’information » En définissant son schéma relationnel, le Moulin des Costières définit une organisation.
 Objet window, la fenêtre du navigateur
BASES DE DONNEES RELATIONNELLES DES CONCEPTS AUX APPLICATIONS.
Gestion de documents XML hétérogènes
Moteurs de recherche ontologiques
Web sémantique est pratique documentaire
S'initier au HTML et aux feuilles de style CSS Cours 5.
Recherche d’information
1 e.dot – septembre e.dot Entrepôts de Données Ouverts sur la Toile RNTL.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
© WYNIWYG / Communication, reproduction interdite sauf autorisation.
 Formulaires HTML : traiter les entrées utilisateur
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
Module : Langage XML (21h)
La veille à l’Institut national du cancer Identifier des sources d’information fiables Rencontre De la veille à la gestion des connaissances, Bordeaux,
 Les bases de données MySQL
19/9/03Réunion plénière E.Dot E.Dot – Épisode 2. 19/9/03Réunion plénière E.Dot Objectif: Athènes 2004 Application/démo –Interface de consultation uniforme.
Introduction avec Access Quinio Nanterre 2008
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
Responsable : Serge Hamon
Initiation aux bases de données et à la programmation événementielle
Introduction Module 1.
Mise en forme avancée et Publication. Le CSS Avertissement : vous ne devez pas maitriser le CSS juste savoir qu’il existe et à quoi il sert ! CSS signifie.
Dreamweaver MX Jauneau Marie Claude-Antoine Zarate.
Cours 11 Entrepôts de données
Le langage XML Documents bien formés Un document XML est dit bien formé lorsque le document est correct sans toutefois posséder une DTD. Le prologue du.
STRATÉGIE DE RECHERCHE DOCUMENTAIRE Trouver des articles de périodiques Adèle Flannery, Cynthia Lisée et Christine Médaille, bibliothécaires.
1 er séance SI28 A2004 YIN Lei Emmanuel Eugene. Plan de l’exposé  Introduction au HTML  Le HTML dans le bloc-notes (notepad)  Présentation de Dreamweaver.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
module SIE depuis 2011 et IAMD depuis l’an dernier ! Gestion de Masse de Données (GMD) Introduction Adrien Coulet
Transcription de la présentation:

edot Groupe de travail sur l’intégration

Le problème Intégration de nouvelles données avec les données existantes dans l’entrepôt Les données existantes: 2 formats différents BD relationnelle BD semistructurée Ontologie commune Hiérarchie de termes Noms d’attributs ou de valeurs d’attribut du schéma relationnel Noms de concepts du schéma de graphes Exemple: produit, scarole, germe, listeria

Interface de requêtes commune L’ontologie: sert de schéma médiateur entre les utilisateurs et les 2 bases de données MIEL: langage de requêtes simple critères de sélection + attributs de projection quels sont tous les germes contaminants de la scarole ? Requêtes exécutées sur la BD relationnelle et sur la BD de graphes

Notre choix pour l’intégration Se servir de l’ontologie existante pour intégrer de nouvelles données Choix cohérent avec celui fait pour l’acquisition Nécessite de savoir/pouvoir caractériser les nouvelles données en fonction de l’ontologie Problème inverse de ce qu’on fait habituellement en BD Pour pouvoir interroger de façon uniforme (via MIEL) les données existantes et les données nouvelles

Données extérieures utiles des pages Web ou des documents (XML, pdf, doc) localisés par le crawler de Xylème Des sites bibliographiques répertoriant des articles scientifiques (en pdf) portant sur le risque alimentaire Des données importées de bases de données de partenaires de Sym’Previus

Principaux problèmes Mettre les documents (ou des parties de documents) dans un format XML avec le plus possible de balises provenant de l’ontologie Résultat: base documentaire en XML annotée par les termes de l’ontologie Reformulation des requêtes MIEL en des requêtes XML Résultat: interrogation uniforme des données existantes et des données ajoutées

<doc … de la scarole dans le frigo de Serge Abiteboul vieille de 8 jours bla bla bla méchante listeria mortelle E. Coli pas méchant …

Exemple <doc … de la scarole dans le frigo de Serge Abiteboul vieille de 8 jours bla bla bla méchante listeria mortelle E. Coli pas méchant Quels sont les germes contaminants de la scarole ?

Questions ouvertes /tâches … Extraction de tableaux ou graphiques de documents pdf ??? Mise sous forme XML de tableaux html facile avec des balises XML non sémantiques difficile de remplacer ces balises par des termes de l’ontologie Mise sous forme XML de tableaux Excel Format de documents d’experts en attente de traitement a priori, plus facile de faire le lien avec l’ontologie Reformulation de requêtes MIEL en requêtes XML