LE DATA WAREHOUSE
Data Warehouse Introduction Présentation Historique Pour quoi un entrepôt de données? Les concept de base de l’entrepôt de données La conception de l’entrepôt de données Le concept OLAP Navigation dans les données Modélisation des données de l’entrepôt Le processus d’alimentation Facteurs de succès, Erreurs à éviter Les entrepôt de données en chiffres Conclusion
Introduction
Historique L’infocentre Les exécutive information système –EIS- L’entrepôt de données
L’infocentre
Les exécutive information système -EIS-
L’entrepôt de données
Pour quoi un entrepôt de données La problématique des entreprise La réalité des systèmes d’informations Définition Objectifs
La problématique des entreprise
La réalité des systèmes d’informations Deux types de systèmes: systèmes transactionnels les systèmes décisionnels Données des systèmes: Éparpillées Peu structurées pour l’analyse Focalisées sur l’amélioration du quotidien Utilisées pour des fonctions critiques
Définition
Objectifs
Les concepts de base de l’entrepôt de données La structure L’architecture L’implémentation
La structure
La structure
L’architecture
L’architecture
L’implémentation Implémentation selon l’architecture réelle Implémentation selon l’architecture virtuelle Implémentation selon l’architecture remote
L’implémentation Architecture Réelle Virtuelle remote Utilisation Retenue pour les systèmes décisionnels Rarement utilisée Stockage SGBD séparé du système de production, alimenté par des extractions périodiques Données résident dans le système de production Combinaison des architectures réelle et virtuelle Avantage Données préparées pour les besoins de la décision Pas de coût de stockage supplémentaire, accès en temps réel Inconvénient Coût de stockage supplémentaire, manque d’accès en temps réel Données non préparées
La conception de l’entrepôt de données Caractéristiques Les évolutions technologiques La stratégie de l’entreprise L’amélioration continue La maturité de l’entreprise Phases de conception Découvrir et définir les initiatives La détermination de l’infrastructure La mise en œuvre des applications
Découvrir et définir les initiatives
La détermination de l’infrastructure L’infrastructure technique L’infrastructure organisationnelle La conduite du changement
La mise en œuvre des applications Spécifier Concevoir Construire Déployer Mesurer
Le concept OLAP Activité globale de requêtage et de présentation de données textuelles et numériques contenues dans l’entrepôt de données ; style d’interrogation et de présentation spécifiquement dimensionnel . [Kimball 2000]
Les douze -12- règles OLAP Vue multidimensionnelle. Transparence du serveur OLAP à différents types de logiciels. Accessibilité à de nombreuses sources de données. Performance du système de Reporting. Architecture Client/Serveur. Dimension Générique. Gestion dynamique des matrices creuses. Support Multi-Utilisateurs. Calculs à travers les dimensions. Manipulation intuitive des données. Souplesse et facilité de constitution des rapports. Nombre illimité de niveaux d’agrégation et de dimension.
Les différents outils OLAP Deux versions d’OLAP Les outils MOLAP Les outils ROLAP
Les outils MOLAP
Les outils ROLAP
Navigation dans les données Drill Down & Drill Up Slice & Dice Data Surfing
Drill Down & Drill Up
Slice & Dice
Data Surfing
Modélisation des données de l’entrepôt Modélisation entité relation Modélisation dimensionnelle
Modélisation entité relation
Modélisation dimensionnelle Modélisation en Étoile Modélisation en Flocon
Modélisation en Étoile
Modélisation en Flocon
Processus d’alimentation Transformation Extraction Chargement
Facteurs de succès Il intègre des données de production avec des données externes et gère des historiques Il contient les informations utiles, les rend lisibles et manipulables Il regroupe des données de qualité (cohérentes, à jour, documentées) Il offre un accès direct aux utilisateurs Il augmente le nombre d’accès aux données Il offre une flexibilité supportant la croissance, tant du point de vue du nombre d’utilisateurs, des outils utilisés que des volumes à traiter
Erreurs à éviter Débuter le projet avec le mauvais sponsor. S’engager sur les possibilités qui ne peuvent pas être réalisées. S’engager sur des déclarations d’espérances naïves. Charger le Data Warehouse avec des données uniquement parce qu’elles sont disponibles. Croire que le schéma de la base de données qui supporte le Data Warehouse est organisé de la même manière qu’un schéma de base de données traditionnelle de type transactionnelle. Choisir un chef de projet orienté technologie. Se concentrer sur les données traditionnelles et internes. Croire aux promesses technologiques. Croire les problèmes terminés une fois le Data Warehouse terminé. Se focaliser sur les fonctions prédéfinies et périodiques.
Conclusion