Cours 11 Entrepôts de données

Slides:



Advertisements
Présentations similaires
Material/Sources: Daniel Bardou, Julie Dugdale &
Advertisements

Base de Données / MCD Introduction en utilisant un SGBD simple (Access) Quinio Université Paris Ouest2010 Quinio.
BASES DE DONNÉES AVANCÉES
Introduction Pour concrétiser l’enseignement assisté par ordinateur
INTRODUCTION Grande quantité de données
UML - Présentation.
Le Modèle Logique de Données
Vue d’ensemble du Data warehousing et de la technologie OLAP
Techniques dindexation Implémentation du modèle relationnel ~ LIF10: Fondements des bases de données relationnelles.
La base de données : le modèle relationnel.
VI. Analyse des solutions techniques
Initiation au système d’information et aux bases de données
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
Initiation au système d’information et aux bases de données
Contrôles d'accès aux données
Rappel sur les bases de données et le vocabulaire
Initiation à la conception de systèmes d'information
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
Introduction à la conception de Bases de Données Relationnelles
Chap 4 Les bases de données et le modèle relationnel
Les bases de donnÉes I DÉFINITION Ensemble structuré d’informations
La comptabilité par activités
La structuration et la représentation informatique de l'information
Modèle Logique de Données
SYSTEME DE GESTION DE BASES DE DONNEES
VI. Analyse des solutions techniques
VI. Analyse des solutions techniques
Universté de la Manouba
Article présentée par : Étudiante en 2ème année mastère F.S.T. Tunisie
Les concepts et les méthodes des bases de données
Initiation aux bases de données et à la programmation événementielle
Initiation aux bases de données et à la programmation événementielle
Michel Tollenaere SQL et relationnel ENSGI Cours MSI 2A Relationnel et SQL version 1.4 du 25 septembre 2007 (ajout jointures) 1 Modèle relationnel Historique.
Informatique décisionnelle
1. Représentation des informations
Systèmes d’information d’entreprise
1 BDs Orientées Objets Witold LITWIN. 2 Pourquoi ? F Les BDs relationnelles ne sont pas adaptées aux applications CAD/CAM, cartes géo... F le problème.
Optimisation de requêtes
Développé par : CHAFYQ El Hassan & Krachli Ayoub
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II PRO-1024.
ASKIT v2.0 Gestion de l’ASCII DAUVERGNE Sébastien DEZE Simon Master 1 Informatique.
DOSSIER G10 – La base de données Relationnelle
Initiation à la conception des systèmes d'informations
P2. Le modèle multidimensionnel est bien adapté pour mesurer des données que l’on peut exprimer comme cela. Le modèle OLAP STD - Notes1.
Sélection de colonnes (la projection)
Darties, qui êtes – vous ? Vendeur et distributeur de produits à valeur ajoutée Fours, Hifi, Magnétoscopes Acteur historique présent en France 48 magasins.
LE DATA WAREHOUSE.
1 Mini projet sur les entrepôts de données. 2 Un DW dans les télécoms Sujets – suivi du marché: lignes installées/ désinstallées, services et options.
SYSTEMES d’INFORMATION séance 1 : Introduction et définitions
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
Quinio1 Bases de données : modèlisation et SGBD Séance 3 B Quinio.
Intégration des Tableaux Multidimensionnels en Pig pour
Introduction avec Access Quinio Nanterre 2008
1 Structure en MC Principes Stockage des données dans la mémoire volatile d’un ordinateur Problèmes Stockage temporaire «Petits» volumes de données Langages.
Systèmes d'information décisionnels
Introduction aux Bases de Données et au langage SQL
Initiation aux bases de données et à la programmation événementielle
Introduction Module 1.
Le modèle logique des données relationnel
DATA Warehouse Elabore par: Ajlani Wael Karous Nabil Salhi Mahmoud.
Analyse, élaboration et exploitation d’une Base de Données
Les bases, les entrepôts et l’exploration de données
Projet de session Par Eve Grenier Dans le cadre du cours SCG Réalisation d’applications en SIG Jeudi le 20 avril 2006.
PROJET DE SESSION PRÉSENTÉ PAR : Rosemarie McHugh DANS LE CADRE DU COURS : SCG Réalisation d’applications en SIG 16 avril 2007.
SQLSaturday Paris 2015 SSAS et le moteur relationnel Faire son choix.
Schéma de base de données Présentation. Conception du schéma logique  Transformation du schéma conceptuel en structures de données supportées par les.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
module SIE depuis 2011 et IAMD depuis l’an dernier ! Gestion de Masse de Données (GMD) Introduction Adrien Coulet
Chapitre2: SGBD et Datawarehouse. On pourrait se demander pourquoi ne pas utiliser un SGBD pour réaliser cette structure d'informatique décisionnelle.
Transcription de la présentation:

Cours 11 Entrepôts de données

Plan et objectifs Informatique de production Transactions Informatique décisionnelle Entrepôts de données Datamarts Construction des entrepôts Opérations OLAP Problèmes

Informatique de production Interrogations et modifications fréquentes des données par de nombreux utilisateurs Nécessité de conserver la cohérence des données Les systèmes transactionnels (OLTP) garantissent la cohérence des données L’informatique de production est optimisée pour les tâches répétitives et planifiées Exemples: Factures, commandes…

Transactions Programmes informatiques qui inter-agissent avec les bases de données ayant les propriétés suivantes: A - Atomicité C - Consistance I - Isolation D - Durée

Informatique décisionnelle Chargement périodique des données Pas de modifications des données Interrogations non régulières, planifiées, parfois longues des systèmes d’information décisionnels Exemples de questions: Quelles sont les ventes du produit X pendant le trimestre A de l'année B dans la région C ? Comment se comporte le produit X par rapport au produit Y? Quel type de client peut acheter le produit X? Exemple: OLAP (Codd)

Entrepôt de données (1) Contient de grandes quantités de données provenant de diverses sources, sauvées sous un schéma de données unique, et résidant à un endroit unique Construit par: Nettoyage, transformation, intégration, chargement et rafraîchissement périodiques des données

Entrepôt de données (2) Organisés suivant des thèmes précis (clients, activités, items…) Organisés suivant une chronologie historique Résument les données Plus lisibles et plus simples que les données initiales Introduction de redondance éventuelle Cohérence globale des données Les données / informations des entrepôts ne sont pas modifiees

Datamarts Versions simplifiées, car plus ciblées, des entrepôts des données

Nettoyage des données Erreurs de saisie Intégrité des domaines Exemple: Les dates Données manquantes

Transformations des données Exemple: Type des données Consolidation Exemple: Choix des unités et des représentations Uniformisation d’échelle Exemple: Homogénéisation des échelles

Requêtes sur les entrepôts de données Extraire des données: Les outils OLAP Le progiciel SAS Un progiciel est un logiciel de gestion Outils de création de rapports Outils dans les SGBD Un language (Exemple: DMQL)

Représentation conceptuelle des entrepôts de données* Souvent représentés par une structure à plusieurs dimensions Une dimension est un attribut ou un ensemble d’attributs Les cellules sauvent des données agrégées appelées faits Représentations: Relations, cube de données, hyper-cube de données Utilisation d’un language (Exemples: SQL ou DMQL) pour peupler les entrepôts

Exemple Total des ventes à un client dans une tranche horaire d'un jour précis, pour un produit choisi

Représentation logique des entrepôts de données* Implantation classique: Modèle en étoile: Au centre la table des faits Les dimensions comme autant de branches à l'étoile. Les branches de l'étoile sont des relations de 1 à plusieurs La table des faits est énorme contrairement aux tables des dimensions Le modèle est très dissymétrique en comparaison avec les modèles relationnels des bases de production L’étoile est un modèle simple

Exemple Un enregistrement dans la table des faits Ventes correspond à un total des ventes à un client dans une tranche horaire d'un jour précis, pour un produit choisi.

Hiérarchies* Hiérarchies de schémas Hiérarchies de groupes Ordre total ou partiel sur les attributs des schémas Décrivent des relations sémantiques entre les attributs Exemple: Rue < Ville < État_ou_Province < Pays Hiérarchies de groupes Organise les valeurs d’attributs ou de dimensions en groupes Un ordre total ou partiel peut être défini entre les groupes Exemples: {0…45}  Jeune, {46…150}  Agé , {Jeune, Agé}  all(age)

Opération: Navigation ou Forage* Pour obtenir plus de détails sur la signification d'un résultat en affinant une dimension ou en ajoutant une dimension Exemple: Supposons qu'un utilisateur final demande les chiffres d'affaires par produit, et s'étonne d'un résultat pour un produit donné. Il aura sûrement l'envie d'en analyser les raisons. Une solution consisterait à ajouter la dimension temps, dans l'unité de temps trimestrielle pour trouver une variation saisonnière, dans l'unité hebdomadaire pour envisager l'effet week-end ou encore la dimension magasin pour mettre en évidence un effet géographique.

Opération: Agrégats* Pour obtenir moins de détails Élimination d’une dimension ou regroupement des éléments d’une dimension Exemple: Ville < Etat < Province < Pays Au lieu de regrouper les données par ville, elles sont regroupées par pays

Autres opérations* Sélection sur une dimension ou plusieurs dimensions (tranche du cube) Rotation / pivot du cube D’autres opérations impliquent plus d’une table des faits

Problèmes Supports physiques Problèmes des clés et des indexes Peupler l’entrepôt Calcul des valeurs de la table des faits Problèmes des clés et des indexes Organisation physique importante du point de vue des performances Les tables de dimension sont souvent indexées suivant tous leurs champs