Technologies d’intelligence d’affaires Leçon 4 Structures de données et agrégats
Références Aggregate Improvements, Lawrence Corr, Intelligent Enterprise, October 4 2001. Lost, Shrunken and Collapsed, Lawrence Corr, Intelligent Enterprise, January 1 2002. From Enterprise Models to Dimensional Models: A Methodology for Data Warehouse and Data Mart Design, D.L. Moody and M.A.R. Kortink
Classification des entités Transaction Décrit un événement Contient des valeurs mesurées, qui peuvent être résumées Montant Poids Volume Nombre Durée
Classification des entités Objets Décrit les détails d’un événement Réponds aux questions Qui (vendeur, client) Quand (date commande) Quoi (produit vendu) Où (adresse du client, entrepôt du produit) Comment (mode de paiement, mode de distribution)
Classification des entités Décrit, en plus de détails, les objets Hiérarchie
Hiérarchie Un ensemble de valeurs peut être partitionné Les ensembles qui forment une partition peuvent être partitionnés de nouveau
Hiérarchie temporelle Date Mois-An
Variables indicatrices On peut créer des variables pour indiquer des faits qui ne sont pas apparents dans les données
Hiérarchie - Exemple Client:
Opération sur une hiérarchie « Effondrer » une hiérarchie Amener un niveau supérieur à l’intérieur d’un niveau inférieur Ex: Pays dans Ville
Modèle Étoile 1 table de « faits » N tables de « dimensions » 2 niveaux: toutes les hiérarchies sont effondrées
Modèle Flocon de neige 1 table de « faits » N tables de dimension Les tables de dimensions sont reliées à leur niveau supérieur
Agrégation Mécanisme pour réduire le temps de traitement. On utilise les dimensions et les hiérarchies pour effectuer des résumés ré-utilisables L’utilisateur ne voit rien: c’est l’administrateur qui fait tout
Rappel SQL Fonctions de groupe Critère de regroupement Min, Max, Count, Sum, Variance, Stddev Critère de regroupement Liste de colonnes Chaque ensemble de valeurs différentes crée un groupe Les fonctions de groupe sont calculées pour chaque groupe
Structure des tables pré-calculées Hypercube On doit considérer la cardinalité des dimensions Moins il y a de dimensions Plus le cube est petit Plus la vitesse est accélérée Plusieurs dimensions Produit cartésien des dimensions
Hiérarchies et Pré-calculs des données INTERURB Deuxième partie Hiérarchies et Pré-calculs des données INTERURB
Tables APPELS TELEPHONES SERVICE Les données de chaque appel interurbain sont enregistrées TELEPHONES Chaque numéro de téléphone a un compte budgétaire SERVICE Chaque compte budgétaire appartient à un service
SERVICE
TELEPHONES
APPELS