La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Business Intelligence: introduction et concepts Datawarehouse

Présentations similaires


Présentation au sujet: "Business Intelligence: introduction et concepts Datawarehouse"— Transcription de la présentation:

1 Business Intelligence: introduction et concepts Datawarehouse
Séminaire UMH Marie-Laure Cheyns – Hermes Senior Consultant

2 Agenda Faisons connaissance Un peu d’architecture
Datawarehouse, datamart Composants d’un DWH Découverte des concepts à partir d’un cas pratique Dimension, fait Star Schema Slowly changing dimensions Conclusion 31/03/2017

3 Faisons connaissance Hermès Société de service 15 ans d’existence
Délégation d’experts (Business & IT) Projets « clé sur porte » Études fonctionnelles & techniques Formations 15 ans d’existence 100 collaborateurs en Belgique et au Luxembourg 31/03/2017

4 Faisons connaissance Hermès 4 pôles de compétence
Business Intelligence/Datawarehousing ETL, DB, outflow Architectures Distribuées Java, MS .NET, Mainframe Solutions d’entreprise ERP, CRM,… Méthodologies IT, gestion de projet 31/03/2017

5 Faisons connaissance Notre expérience Marie-Laure Pierre
chez Hermès depuis 2004 Analyste fonctionnelle – domaine BI BICS, Dexia Pierre chez Hermès depuis 2001 BI director – conseil, gestion de projet Cat, Dexia, Ing, Fortis, Unda, Gateway.com, tele2tango, Robecco, Ucm,… 31/03/2017

6 Un peu d’architecture…
Construire un datawarehouse… C’est-à-dire?? Données « opérationnelles », disséminées… Peut-on travailler directement dessus? Quels sont les composants d’un DWH et comment les organiser? 31/03/2017

7 Datawarehouse : Définitions
C’est le lieu de stockage intermédiaire des différentes données en vue de la constitution du système d'information décisionnel: entrepôt de données (data warehouse DWH). Le datawarehouse est ainsi le lieu unique de consolidation de l'ensemble des données de l'entreprises. « Un datawarehouse est une collection de données thématiques, intégrées, non volatiles et historisées pour la prise de décisions. » 31/03/2017

8 Datawarehouse : Définitions
Ses principales caractéristiques sont donc les suivantes : orienté sujets : les données collectées doivent être orientées « métier » et donc triées par thème. composé de données intégrées: un « nettoyage » préalable des données est nécessaire dans un souci de rationalisation et de normalisation. données non volatiles : n’ont pas vocation à être supprimées. données historisées, donc datées. 31/03/2017

9 Datawarehouse : Définition
Datamart : Littéralement : magasin de données désigne un sous-ensemble du data warehouse contenant les données pour un secteur particulier de l'entreprise (département, direction, service, gamme de produit, etc.). On parle ainsi par exemple de DataMart Marketing, DataMart Commercial, ... 31/03/2017

10 Composants d’un datawarehouse
31/03/2017

11 Composants d’un datawarehouse
31/03/2017

12 A la découverte des concepts DWH
Cas pratique : Belgacom International Carrier Services Société ‘wholesale’ : clients = autres opérateurs de télécom Vend et achète des minutes d’appel – trafic international France Télécom Deutsche Telekom Allemagne BICS 31/03/2017

13 Cas pratique : BICS Besoin du business : surveiller l’évolution de la marge Par destination Par responsable commercial (Account Manager, buyer) De manière journalière 31/03/2017

14 Cas pratique : BICS Données disponibles:
Pour chaque appel : 1 Call Data Report (CDR) numéros appelé/appelant, infos de routage d’appel (transmitting, receiving, destination) + durée France Télécom Deutsche Telekom Allemagne BICS Transmitting op. Receiving op. Destination Duration FT FRA DTAG DEU DEU 600 31/03/2017

15 Cas pratique : BICS Données disponibles
Système de billing  revenu, coût FT FRA paie pour que BICS forwarde l’appel: revenu : 0,8 €/min BICS paie DTAG DEU pour terminer l’appel sur son réseau : coût : 0,6 €/min On trouve 2 records pour le billing: Transm op. Receiving op. Destination Duration R/E Amount FT FRA DTAG DEU DEU 600 R 8 E 6 31/03/2017

16 Cas pratique : BICS Données disponibles
DB Commerciale : allocations des Account Managers et Buyers aux opérateurs AM : responsable ‘sales’ : côté ‘transmitting’, revenu Buyer : responsable côté ‘receiving’, coûts Les tarifs varient aussi en fonction de la qualité de l’appel  First Class, Business Class,… Cette notion est également présente dans les CDR et prise en compte par le billing 31/03/2017

17 Cas pratique : BICS Comment répondre à la demande du business?
Calcul d’une marge? Allocation d’un responsable commercial? Granularité temporelle? Et si une donnée change? 31/03/2017

18 Modèle de données On dispose de différentes données en input
On peut les transformer Quel modèle utiliser pour les stocker efficacement pour répondre au besoin? A votre avis? 31/03/2017

19 Modèle dimensionnel Définir la granularité du modèle
= niveau le plus détaillé de données dont on a besoin dans le reporting !! Pour le process qu’on souhaite modéliser, pas forcément pour l’entreprise 31/03/2017

20 Modèle dimensionnel Concept de fait (‘fact table’):
Sujet d’analyse : Ce dont on veut observer l’évolution Constitué d’une ou plusieurs mesures numériques Souvent continues - additives Concept de dimension: Critères suivant lesquels on va évaluer, qualifier, quantifier la mesure Dimensions d’analyse  description (‘dimension table’) 31/03/2017

21 Modèle dimensionnel ‘Star schema’ (schéma en étoile)
Une table contient les faits qu’on va mesurer, au plus fin niveau de granularité, ainsi que des clés (techniques) vers les dimensions d’analyse Autour, différentes tables contiennent les descriptions des dimensions 31/03/2017

22 Modèle dimensionnel Modèle en flocon (snowflake):
Même principe qu’un schéma en étoile Mais certaines dimensions sont décomposées en ‘sous-dimensions’ + : notion de hiérarchie, gain de place - : modèle plus complexe Modèle en constellation Plusieurs tables de faits utilisent les mêmes tables de dimensions + : gain de place - : modèle plus complexe (à parcourir par tool de reporting : notion de ‘contexte’) 31/03/2017

23 Cas pratique : BICS Granularité? Mesures?
1 route complète (transmitting, receiving, destination + quality) Journalier Mesures? Durées d’appel Revenu Coût (marge) 31/03/2017

24 Cas pratique : BICS Dimensions? Opérateurs Pays
Responsables commerciaux Qualité de la route Date 31/03/2017

25 Cas pratique : BICS Une solution de modélisation possible
Transformation des données: Billing : ramener coût et revenu sur une ligne et agréger par route et par jour date Trans op. TransCtry Recv op. Recv ctry Dest ctry quality Dur. Rev Cost 20/02/2008 FT FRA DTAG DEU FC 600 8 6 31/03/2017

26 Cas pratique : BICS Transformation des données:
Allocation des responsables commerciaux Éviter de travailler avec des date-from, date-to Denormaliser par date et par opérateur, les responsables Rem : en pratique on travaillera avec une date mensuelle et on utilisera une fonction dans la couche ‘reporting’ pour faire le lien entre date jour et date mois… Date Operator Acc_manager Buyer 31/03/2017

27 Cas pratique : BICS 31/03/2017

28 Cas pratique : BICS ‘Alias’ des tables  modèle en étoile avec quelques snowflakes 31/03/2017

29 Cas pratique : BICS Remarque : ‘factless fact’ table
Parfois on a besoin de garder des liens entre des dimensions, sans copier les détails d’une dimension dans l’autre pour chaque occurrence de l’association On peut utiliser alors une ‘factless fact’ table = une relation Par exemple pour les allocations de managers on pourrait avoir: 31/03/2017

30 Concepts DWH Et si une dimension change au cours du temps?
Par exemple, si la description du type de route ‘FC’ passe de ‘First’ à ‘First Class’… Que se passe-t-il? Comment gérer cela dans le modèle? 31/03/2017

31 Slowly changing dimensions
Si un attribut d’une dimension change: 3 solutions pour garder la nouvelle valeur: Ecrasement de l’ancienne version (SCD1) Versionnement (SCD2) Valeur d’origine / valeur courante (SCD3) 31/03/2017

32 Slowly Changing Dimensions
SCD1 : on écrase simplement la donnée dans la table de dimension  pas d’historique, données du passé seront liées à la nouvelle valeur SCD2 : notion de ‘record actif’ : on historise dans la dimension, on clôture la ligne précédente et on crée un nouveau record avec la nouvelle valeur et une nouvelle clé technique  les données du passé sont liées à l’ancienne valeur SCD3 : on maintient 2 colonnes : valeur d’origine, valeur actuelle  toutes les données seront liées aux 2 informations 31/03/2017

33 Conclusion A l’heure actuelle: énormément de données disponibles et éparses Important de les centraliser, les harmoniser et les organiser Pour en tirer de l’information utile et prendre des décisions 31/03/2017

34 Conclusion Un outil : le ‘datawarehouse’
‘single version of the truth’ Extract-Transform-load; architecture 3-tier Datamarts Modèle dimensionnel Orienté reporting De nombreux tools existent Aspect important à ne pas négliger: la qualité des données en input! ‘garbage in  garbage out’ 31/03/2017

35 QUESTIONS ? E-mail: services@hermes-ecs.com
Web site: 31/03/2017


Télécharger ppt "Business Intelligence: introduction et concepts Datawarehouse"

Présentations similaires


Annonces Google