Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier

Slides:



Advertisements
Présentations similaires
Master SIR (M2) Année Développement en environnement J2EE de Web services pour l'interopérabilité du projet CASTORE ce stage de fin d’étude a.
Advertisements

SmartPlanet Smart Business Intelligence Smart Enterprise Data Mangement Smart Business Process Management.
IREMIA : Institut de REcherche en Mathématiques et Informatique Appliquées Université de la Réunion Uniformisation des mécanismes de conception de SMA.
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold.
Analyse en ligne (OLAP) de documents
Systèmes à base de connaissances
Module d’Enseignement à Distance pour l’Architecture Logicielle
D5 : Maitrise de l’Information
Vue d’ensemble du Data warehousing et de la technologie OLAP
ANALYSE DE FABRICATION
La dynamique dans les modèles, méthodes et outils pour les systèmes daide à la décision : Cadre du processus dintelligence économique Amos DAVID Septembre.
CH18 LES SYSTEMES DECISIONNELS
Localisation de services techniques dans un modèle à composants H. GRINE, C. Hérault, S. Lecomte, T. Delot Journées Composants, le Croisic 7 avril 2005.
Gestion de la persistance des objets
Institut national du cancer Mise en place de la veille sur le cancer Lyon, 26 octobre 2005 Ingrid Aubry.
Modèle et instrumentation du suivi d’apprenants dans la FOAD
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Estella Annoni, Franck Ravat, Olivier Teste, Gilles Zurfluh
Université Mouloud Mammeri de Tizi-Ouzou
E.Dot – juillet 2005 Page 1 Projet R.N.T.L. e.Dot – Entrepôts de Données Ouverts sur la Toile – Organisation et Structuration.
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
Bouchra SOUKKARIEH Florence SEDES SIG - Université de Paul Sabatier
OLAP : Un pas vers la navigation
Anne Tchounikine, Maryvonne Miquel, Robert Laurini,
Annotations sémantiques pour le domaine des biopuces
Université Mouloud Mammeri de Tizi-Ouzou
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
MOT Éditeur de modèles de connaissances par objets typés
La problématique de la recherche de document Journée de formation 29 février 2008.
Article présentée par : Étudiante en 2ème année mastère F.S.T. Tunisie
Constitution des bases de données. n Partenaires u Creatis u Liris/Systèmes dinformation communicants n Lot de travail situé entre le lot Applications.
Modèle d’entrepôt de données à base de règles
LE TABLEUR Généralité Organisation Manipulation Les formules Graphisme
Initiation aux bases de données et à la programmation événementielle
Thésaurus de lactivité gouvernementale Richard Parent 17 novembre 2006 Ressource de soutien à linteropérabilité sémantique.
IFT6255 – Recherche d’information Jian-Yun Nie
MODELE CONCEPTUEL POUR L’ANALYSE MULTIDIMENSIONELLE DE DOCUMENTS
CSC All Reserved, Usinor Leading to Succes with CSC in the Business Intelligence Projects BW Petit Bateau 28 février 2002.
Organisation de l’entrepôt edot
PROGRAMMATION WEB FRONT-END.
Ranking the web frontier Nadav Eiron, Kevin S. McCurley, John A. Tomlin IBM Almaden Research Center Bah Thierno Madiou.
ASKIT v2.0 Gestion de l’ASCII DAUVERGNE Sébastien DEZE Simon Master 1 Informatique.
D4 : Organiser la recherche d'informations numériques
LE DATA WAREHOUSE.
1 e.dot – septembre e.dot Entrepôts de Données Ouverts sur la Toile RNTL.
Améliorer la performance des organisations en apportant à toutes les équipes la meilleure compréhension de leur activité pour des décisions plus rapides.
Nicolas Rageul, Yvan Bédard, Jacynthe Pouliot, Michel Fortin
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
Edot Groupe de travail sur l’intégration. Le problème Intégration de nouvelles données avec les données existantes dans l’entrepôt Les données existantes:
Recherche Documentaire et traitement de l’information
TEXT MINING Fouille de textes
Réunion GafoDonnées: Equipe SIG/IRIT 24/25 janvier 2002
Faiza GHOZZI, Olivier TESTE, Gilles ZURFLUH
Intégration des Tableaux Multidimensionnels en Pig pour
Cours MIAGE M1 « Urbanisation des Systèmes d’Information » Henry Boccon-Gibod Urbanisation des Systèmes d’Information Plan de cours.
Présenté par : Benoit Frédéricque Directrice : Sylvie Daniel Co-directeur : Yvan Bédard UNIVERSITÉ LAVAL Gestion contextuelle des méthodes de saisie volumétrique.
Présentation et compétences
DATA Warehouse Elabore par: Ajlani Wael Karous Nabil Salhi Mahmoud.
Proposition de possibilité d’évolution de nos spécialités Deux projets (liés) : Projet 1 : Informatique Computationnelle – Etudiants 4 e et 5 e IR Projet.
Cours 11 Entrepôts de données
Les bases, les entrepôts et l’exploration de données
Projet de session Par Eve Grenier Dans le cadre du cours SCG Réalisation d’applications en SIG Jeudi le 20 avril 2006.
PROJET DE SESSION PRÉSENTÉ PAR : Rosemarie McHugh DANS LE CADRE DU COURS : SCG Réalisation d’applications en SIG 16 avril 2007.
PROJET DE SESSION DANS LE CADRE DU COURS: SCG Réalisation d’applications en SIG PRÉSENTÉ PAR: Marie-Andrée Levesque 18 AVRIL 2006.
Activités de recherches de la composante SIG – Entrepôts de données 7 Novembre 2005 IRIT/UT1.
module SIE depuis 2011 et IAMD depuis l’an dernier ! Gestion de Masse de Données (GMD) Introduction Adrien Coulet
Implémentation d’une interface pour l’exécution d’ETL à distance Projet de développement logiciel dans le cadre du cours SCG : « Réalisation d’Applications.
Transcription de la présentation:

Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Les systèmes d’aide à la décision (DSS) Contexte SourcesEntrepôtMagasinAnalyseUtilisateur Environnement de stockage Exploration / Manipulation (OLAP) Requêtes Visualisation

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre L’environnement de Stockage Contexte EntrepôtMagasin Vision uniforme Des données Structuration pour l’analyse (bases multidimensionnelles) Cube = vision simpliste du magasin

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Données décisionnelles 20 % numériques Provenance : système d’information local 80 % autres Rapports Pages Web Notes de travail … => Intégration de documents Format de plus en plus utilisé : XML Contexte Données hors du système d’aide À la prise de décision

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Deux types de documents XML Orienté données Ordre des éléments importe peu Contexte =>

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Deux types de documents XML Orienté données Ordre des éléments importe peu Orienté document Ordre des éléments important Contexte =>

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Documents XML => Interopérabilité Intégration de documents SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Documents XML => Intégration Intégration de documents SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Documents XML = l’entrepôt Entrepôts de données XML SourcesEntrepôtMagasinAnalyse Documents XML Orientés données XML XML multidimensionnel Similaire aux Bases de données relationnelles

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Documents XML textuels Entrepôts de documents XML SourcesEntrepôtMagasin Documents XML Orientés documents X

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Documents XML textuels Entrepôts de documents XML SourcesEntrepôt Requêtes Documents XML Orientés documents Pas d’analyse mais de la recherche d’information Fragments de Documents Stockage dans un environnement uniforme

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Et l’analyse ?? => « Contextualisation » Entrepôts de documents XML SourcesEntrepôt Requêtes Fragments de Documents

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre L’environnement Idéal OLAP et XML SourcesEntrepôtMagasinAnalyseUtilisateur Environnement de stockage Exploration / Manipulation (OLAP) Requêtes Visualisation

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : l’agrégation Analyse multidimensionnelle

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : l’agrégation Analyse multidimensionnelle

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : Problématique Actuellement OLAP ne gère pas  Données textuelles  Structure  Contenu Comment analyser données textuelles ? But : Analyser 100% des données d’un SI Données transactionnelles Documents XML

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML XML: exemple de document Contenu… … …

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : fonction d’agrégation Analyse multidimensionnelle De l’analyse numérique… Vers l’analyse non numérique Sujet des publications Nombre de publications par auteur InstitutInst1 AuteurAu1Au2Au3 Conference DaWaK 21- ICEIS 13- CAiSE -12 InstitutInst1 AuteurAu1Au2Au3 Conference DaWaK XML, Temporel Entrepôts de données - ICEIS XML, BD temporelles XML, Fouille, Contraintes - CAiSE - Entrepôts de données Modèle conceptuel, Fouille de données Sujets des 2 publications

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : fonction d’agrégation Principe d’agrégation Exemple de somme

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : fonction d’agrégation Problématique Agréger des données textuelles Règle d’agrégation: ontologie Ontologie légère [Lassila-01] Ontologie de domaine

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : fonction d’agrégation Exemple d’ontologie (SI)

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : fonction d’agrégation Exemple d’agrégation LCA (Design, Processing) = OLAP D=3 D=1 Distance (Design, Processing) = 3 Entrée { (Design, d=0), (Processing, d=0) } Sortie (OLAP, d=3)

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Deux opérations de manipulation LCA: plus petit ancêtre commun Distance structurelle entre deux nœuds AVG_KW : Processus d’agrégation Remplacement de mots-clef le LCA Problème: forte probabilité de retourner la racine Contrôle de la perte de sémantique Limiter l’agrégation (distance heuristique = 3) OLAP et XML : fonction d’agrégation

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : fonction d’agrégation Adaptation au décisionnel Changement de la notion de collections (RI) Analyse des 2 principaux termes d’articles scientifiques En fonction de l’auteur et de la date de publication 4 collections à raison d’une par cellule

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : fonction d’agrégation Fonction d’agrégation Retourne les k termes les plus « représentatifs » Liste ordonnées des termes selon leur poids Liste des termes d’une cellule

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre OLAP et XML : fonction d’agrégation Analyse des 2 principaux termes d’articles scientifiques En fonction de l’auteur et de la date de publication

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Exemple Détails de l’agrégation d’une cellule Pondération des termes TOP_KW 2

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Exemple SOMME

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Exemple

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Implantation : architecture Restitution / analyse

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Plan Introduction Intégration de documents Entrepôts de données Entrepôts de documents OLAP et XML Conclusion

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Tour d’horizon Intégration de documents XML Entrepôts de données XML Entrepôts de documents (de contenu) OLAP et XML (l’analyse) Problématique d’indicateur textuels Agrégation de données textuelles Perspectives Alternatives aux fonctions de pondération Conclusion et perspectives

IRIT, SIG/ED Les entrepôts de donnés et les documents XML Ronan Tournier  Novembre Merci Ronan Tournier, SIG/ED : Systèmes d’Informations Généralisés / Entrepôts de Données IRIT, Institut de Recherche en Informatique de Toulouse Université de Toulouse (UT1C, UTM, UPS).