Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parÉloise Brunet Modifié depuis plus de 9 années
1
edot Groupe de travail sur l’intégration
2
Le problème Intégration de nouvelles données avec les données existantes dans l’entrepôt Les données existantes: 2 formats différents BD relationnelle BD semistructurée Ontologie commune Hiérarchie de termes Noms d’attributs ou de valeurs d’attribut du schéma relationnel Noms de concepts du schéma de graphes Exemple: produit, scarole, germe, listeria
3
Interface de requêtes commune L’ontologie: sert de schéma médiateur entre les utilisateurs et les 2 bases de données MIEL: langage de requêtes simple critères de sélection + attributs de projection quels sont tous les germes contaminants de la scarole ? Requêtes exécutées sur la BD relationnelle et sur la BD de graphes
4
Notre choix pour l’intégration Se servir de l’ontologie existante pour intégrer de nouvelles données Choix cohérent avec celui fait pour l’acquisition Nécessite de savoir/pouvoir caractériser les nouvelles données en fonction de l’ontologie Problème inverse de ce qu’on fait habituellement en BD Pour pouvoir interroger de façon uniforme (via MIEL) les données existantes et les données nouvelles
5
Données extérieures utiles des pages Web ou des documents (XML, pdf, doc) localisés par le crawler de Xylème Des sites bibliographiques répertoriant des articles scientifiques (en pdf) portant sur le risque alimentaire Des données importées de bases de données de partenaires de Sym’Previus
6
Principaux problèmes Mettre les documents (ou des parties de documents) dans un format XML avec le plus possible de balises provenant de l’ontologie Résultat: base documentaire en XML annotée par les termes de l’ontologie Reformulation des requêtes MIEL en des requêtes XML Résultat: interrogation uniforme des données existantes et des données ajoutées
7
<doc … de la scarole dans le frigo de Serge Abiteboul vieille de 8 jours bla bla bla méchante listeria mortelle E. Coli pas méchant …
8
Exemple <doc … de la scarole dans le frigo de Serge Abiteboul vieille de 8 jours bla bla bla méchante listeria mortelle E. Coli pas méchant Quels sont les germes contaminants de la scarole ?
9
Questions ouvertes /tâches … Extraction de tableaux ou graphiques de documents pdf ??? Mise sous forme XML de tableaux html facile avec des balises XML non sémantiques difficile de remplacer ces balises par des termes de l’ontologie Mise sous forme XML de tableaux Excel Format de documents d’experts en attente de traitement a priori, plus facile de faire le lien avec l’ontologie Reformulation de requêtes MIEL en requêtes XML
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.