Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parCharles Bédard Modifié depuis plus de 8 années
1
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier ronan.tournier@irit.fr ronan.tournier@univ-tlse1.fr
2
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 2 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion
3
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 3 Les systèmes d’aide à la décision (DSS) Contexte SourcesEntrepôtMagasinAnalyseUtilisateur Environnement de stockage Exploration / Manipulation (OLAP) Requêtes Visualisation
4
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 4 L’environnement de Stockage Contexte EntrepôtMagasin Vision uniforme Des données Structuration pour l’analyse (bases multidimensionnelles) Cube = vision simpliste du magasin
5
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 5 Données décisionnelles 20 % numériques Provenance : système d’information local 80 % autres Rapports Pages Web Notes de travail … => Intégration de documents Format de plus en plus utilisé : XML Contexte Données hors du système d’aide À la prise de décision
6
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 6 Deux types de documents XML Orienté données Ordre des éléments importe peu Contexte =>
7
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 7 Deux types de documents XML Orienté données Ordre des éléments importe peu Orienté document Ordre des éléments important Contexte =>
8
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 8 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion
9
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 9 Documents XML => Interopérabilité Intégration de documents SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML
10
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 10 Documents XML => Intégration Intégration de documents SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML
11
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 11 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion
12
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 12 Documents XML = l’entrepôt Entrepôts de données XML SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML XML multidimensionnel Similaire aux Bases de données relationnelles
13
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 13 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion
14
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 14 Documents XML textuels Entrepôts de documents XML SourcesEntrepôtMagasin Documents XML Orientés documents X
15
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 15 Documents XML textuels Entrepôts de documents XML SourcesEntrepôt Requêtes Documents XML Orientés documents Pas d’analyse mais de la recherche d’information Fragments de Documents Stockage dans un environnement uniforme
16
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 16 Et l’analyse ?? => « Contextualisation » Entrepôts de documents XML SourcesEntrepôt Requêtes Fragments de Documents
17
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 17 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion
18
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 18 L’environnement Idéal OLAP et XML SourcesEntrepôtMagasinAnalyseUtilisateur Environnement de stockage Exploration / Manipulation (OLAP) Requêtes Visualisation
19
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 19 OLAP et XML : l’agrégation Analyse multidimensionnelle
20
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 20 OLAP et XML : l’agrégation Analyse multidimensionnelle
21
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 21 OLAP et XML : Problématique Actuellement OLAP ne gère pas Données textuelles Structure Contenu Comment analyser données textuelles ? But : Analyser 100% des données d’un SI Données transactionnelles Documents XML
22
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 22 OLAP et XML XML: exemple de document Contenu… … …
23
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 23 OLAP et XML : fonction d’agrégation Analyse multidimensionnelle De l’analyse numérique… Vers l’analyse non numérique Sujet des publications Nombre de publications par auteur InstitutInst1 AuteurAu1Au2Au3 Conference DaWaK 21- ICEIS 13- CAiSE -12 InstitutInst1 AuteurAu1Au2Au3 Conference DaWaK XML, Temporel Entrepôts de données - ICEIS XML, BD temporelles XML, Fouille, Contraintes - CAiSE - Entrepôts de données Modèle conceptuel, Fouille de données Sujets des 2 publications
24
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 24 OLAP et XML : fonction d’agrégation Principe d’agrégation Exemple de somme
25
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 25 OLAP et XML : fonction d’agrégation Problématique Agréger des données textuelles Règle d’agrégation: ontologie Ontologie légère [Lassila-01] Ontologie de domaine
26
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 26 OLAP et XML : fonction d’agrégation Exemple d’ontologie (SI)
27
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 27 OLAP et XML : fonction d’agrégation Exemple d’agrégation LCA (Design, Processing) = OLAP D=3 D=1 Distance (Design, Processing) = 3 Entrée { (Design, d=0), (Processing, d=0) } Sortie (OLAP, d=3)
28
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 28 Deux opérations de manipulation LCA: plus petit ancêtre commun Distance structurelle entre deux nœuds AVG_KW : Processus d’agrégation Remplacement de mots-clef le LCA Problème: forte probabilité de retourner la racine Contrôle de la perte de sémantique Limiter l’agrégation (distance heuristique = 3) OLAP et XML : fonction d’agrégation
29
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 29 OLAP et XML : fonction d’agrégation Adaptation au décisionnel Changement de la notion de collections (RI) Analyse des 2 principaux termes d’articles scientifiques En fonction de l’auteur et de la date de publication 4 collections à raison d’une par cellule
30
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 30 OLAP et XML : fonction d’agrégation Fonction d’agrégation Retourne les k termes les plus « représentatifs » Liste ordonnées des termes selon leur poids Liste des termes d’une cellule
31
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 31 OLAP et XML : fonction d’agrégation Analyse des 2 principaux termes d’articles scientifiques En fonction de l’auteur et de la date de publication
32
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 32 Exemple Détails de l’agrégation d’une cellule Pondération des termes TOP_KW 2
33
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 33 Exemple SOMME
34
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 34 Exemple
35
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 35 Implantation : architecture Restitution / analyse
36
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 36 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion
37
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 37 Tour d’horizon Intégration de documents XML Entrepôts de données XML Entrepôts de documents (de contenu) OLAP et XML (l’analyse) Problématique d’indicateur textuels Agrégation de données textuelles Perspectives Alternatives aux fonctions de pondération Conclusion et perspectives
38
IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier Novembre 2010 38 - Merci Ronan Tournier, tournier@irit.frtournier@irit.fr SIG/ED : Systèmes d’Informations Généralisés / Entrepôts de Données IRIT, Institut de Recherche en Informatique de Toulouse Université de Toulouse (UT1C, UTM, UPS).
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.