La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier

Présentations similaires


Présentation au sujet: "Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier"— Transcription de la présentation:

1 Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier ronan.tournier@irit.fr ronan.tournier@univ-tlse1.fr

2 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 2 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

3 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 3 Les systèmes d’aide à la décision (DSS) Contexte SourcesEntrepôtMagasinAnalyseUtilisateur Environnement de stockage Exploration / Manipulation (OLAP) Requêtes Visualisation

4 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 4 L’environnement de Stockage Contexte EntrepôtMagasin Vision uniforme Des données Structuration pour l’analyse (bases multidimensionnelles) Cube = vision simpliste du magasin

5 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 5 Données décisionnelles 20 % numériques Provenance : système d’information local 80 % autres Rapports Pages Web Notes de travail … => Intégration de documents Format de plus en plus utilisé : XML Contexte Données hors du système d’aide À la prise de décision

6 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 6 Deux types de documents XML Orienté données Ordre des éléments importe peu Contexte =>

7 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 7 Deux types de documents XML Orienté données Ordre des éléments importe peu Orienté document Ordre des éléments important Contexte =>

8 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 8 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

9 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 9 Documents XML => Interopérabilité Intégration de documents SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML

10 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 10 Documents XML => Intégration Intégration de documents SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML

11 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 11 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

12 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 12 Documents XML = l’entrepôt Entrepôts de données XML SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML XML multidimensionnel Similaire aux Bases de données relationnelles

13 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 13 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

14 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 14 Documents XML textuels Entrepôts de documents XML SourcesEntrepôtMagasin Documents XML Orientés documents X

15 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 15 Documents XML textuels Entrepôts de documents XML SourcesEntrepôt Requêtes Documents XML Orientés documents Pas d’analyse mais de la recherche d’information Fragments de Documents Stockage dans un environnement uniforme

16 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 16 Et l’analyse ?? => « Contextualisation » Entrepôts de documents XML SourcesEntrepôt Requêtes Fragments de Documents

17 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 17 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

18 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 18 L’environnement Idéal OLAP et XML SourcesEntrepôtMagasinAnalyseUtilisateur Environnement de stockage Exploration / Manipulation (OLAP) Requêtes Visualisation

19 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 19 OLAP et XML : l’agrégation Analyse multidimensionnelle

20 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 20 OLAP et XML : l’agrégation Analyse multidimensionnelle

21 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 21 OLAP et XML : Problématique Actuellement OLAP ne gère pas  Données textuelles  Structure  Contenu Comment analyser données textuelles ? But : Analyser 100% des données d’un SI Données transactionnelles Documents XML

22 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 22 OLAP et XML XML: exemple de document Contenu… … …

23 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 23 OLAP et XML : fonction d’agrégation Analyse multidimensionnelle De l’analyse numérique… Vers l’analyse non numérique Sujet des publications Nombre de publications par auteur InstitutInst1 AuteurAu1Au2Au3 Conference DaWaK 21- ICEIS 13- CAiSE -12 InstitutInst1 AuteurAu1Au2Au3 Conference DaWaK XML, Temporel Entrepôts de données - ICEIS XML, BD temporelles XML, Fouille, Contraintes - CAiSE - Entrepôts de données Modèle conceptuel, Fouille de données Sujets des 2 publications

24 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 24 OLAP et XML : fonction d’agrégation Principe d’agrégation Exemple de somme

25 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 25 OLAP et XML : fonction d’agrégation Problématique Agréger des données textuelles Règle d’agrégation: ontologie Ontologie légère [Lassila-01] Ontologie de domaine

26 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 26 OLAP et XML : fonction d’agrégation Exemple d’ontologie (SI)

27 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 27 OLAP et XML : fonction d’agrégation Exemple d’agrégation LCA (Design, Processing) = OLAP D=3 D=1 Distance (Design, Processing) = 3 Entrée { (Design, d=0), (Processing, d=0) } Sortie (OLAP, d=3)

28 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 28 Deux opérations de manipulation LCA: plus petit ancêtre commun Distance structurelle entre deux nœuds AVG_KW : Processus d’agrégation Remplacement de mots-clef le LCA Problème: forte probabilité de retourner la racine Contrôle de la perte de sémantique Limiter l’agrégation (distance heuristique = 3) OLAP et XML : fonction d’agrégation

29 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 29 OLAP et XML : fonction d’agrégation Adaptation au décisionnel Changement de la notion de collections (RI) Analyse des 2 principaux termes d’articles scientifiques En fonction de l’auteur et de la date de publication 4 collections à raison d’une par cellule

30 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 30 OLAP et XML : fonction d’agrégation Fonction d’agrégation Retourne les k termes les plus « représentatifs » Liste ordonnées des termes selon leur poids Liste des termes d’une cellule

31 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 31 OLAP et XML : fonction d’agrégation Analyse des 2 principaux termes d’articles scientifiques En fonction de l’auteur et de la date de publication

32 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 32 Exemple Détails de l’agrégation d’une cellule Pondération des termes TOP_KW 2

33 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 33 Exemple SOMME

34 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 34 Exemple

35 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 35 Implantation : architecture Restitution / analyse

36 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 36 Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

37 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 37 Tour d’horizon Intégration de documents XML Entrepôts de données XML Entrepôts de documents (de contenu) OLAP et XML (l’analyse) Problématique d’indicateur textuels Agrégation de données textuelles Perspectives Alternatives aux fonctions de pondération Conclusion et perspectives

38 IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre 2010 38 - Merci Ronan Tournier, tournier@irit.frtournier@irit.fr SIG/ED : Systèmes d’Informations Généralisés / Entrepôts de Données IRIT, Institut de Recherche en Informatique de Toulouse Université de Toulouse (UT1C, UTM, UPS).


Télécharger ppt "Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier"

Présentations similaires


Annonces Google