La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Business Intelligence: introduction et concepts Datawarehouse Séminaire UMH Marie-Laure Cheyns – Hermes Senior Consultant ecs.com)

Présentations similaires


Présentation au sujet: "Business Intelligence: introduction et concepts Datawarehouse Séminaire UMH Marie-Laure Cheyns – Hermes Senior Consultant ecs.com)"— Transcription de la présentation:

1 Business Intelligence: introduction et concepts Datawarehouse Séminaire UMH Marie-Laure Cheyns – Hermes Senior Consultant ecs.com)

2 2 18/05/2014 Agenda Faisons connaissance Un peu darchitecture Datawarehouse, datamart Composants d un DWH Découverte des concepts à partir dun cas pratique Dimension, fait Star Schema Slowly changing dimensions Conclusion

3 3 18/05/2014 Faisons connaissance Hermès Société de service Délégation dexperts (Business & IT) Projets « clé sur porte » Études fonctionnelles & techniques Formations 15 ans dexistence 100 collaborateurs en Belgique et au Luxembourg

4 4 18/05/2014 Faisons connaissance Hermès 4 pôles de compétence Business Intelligence/Datawarehousing ETL, DB, outflow Architectures Distribuées Java, MS.NET, Mainframe Solutions dentreprise ERP, CRM,… Méthodologies IT, gestion de projet

5 5 18/05/2014 Faisons connaissance Notre expérience Marie-Laure chez Hermès depuis 2004 Analyste fonctionnelle – domaine BI BICS, Dexia Pierre chez Hermès depuis 2001 BI director – conseil, gestion de projet Cat, Dexia, Ing, Fortis, Unda, Gateway.com, tele2tango, Robecco, Ucm,…

6 6 18/05/2014 Un peu darchitecture… Construire un datawarehouse… Cest-à-dire?? Données « opérationnelles », disséminées… Peut-on travailler directement dessus? Quels sont les composants dun DWH et comment les organiser?

7 7 18/05/2014 Datawarehouse : Définitions Cest le lieu de stockage intermédiaire des différentes données en vue de la constitution du système d'information décisionnel: entrepôt de données (data warehouse DWH). Le datawarehouse est ainsi le lieu unique de consolidation de l'ensemble des données de l'entreprises. « Un datawarehouse est une collection de données thématiques, intégrées, non volatiles et historisées pour la prise de décisions. »

8 8 18/05/2014 Datawarehouse : Définitions Ses principales caractéristiques sont donc les suivantes : orienté sujets : les données collectées doivent être orientées « métier » et donc triées par thème. composé de données intégrées: un « nettoyage » préalable des données est nécessaire dans un souci de rationalisation et de normalisation. données non volatiles : nont pas vocation à être supprimées. données historisées, donc datées.

9 9 18/05/2014 Datawarehouse : Définition Datamart : Littéralement : magasin de données désigne un sous-ensemble du data warehouse contenant les données pour un secteur particulier de l'entreprise (département, direction, service, gamme de produit, etc.). On parle ainsi par exemple de DataMart Marketing, DataMart Commercial,...

10 10 18/05/2014 Composants dun datawarehouse

11 11 18/05/2014 Composants dun datawarehouse

12 12 18/05/2014 A la découverte des concepts DWH Cas pratique : Belgacom International Carrier Services Société wholesale : clients = autres opérateurs de télécom Vend et achète des minutes dappel – trafic international France Télécom Deutsche Telekom Allemagne France BICS

13 13 18/05/2014 Cas pratique : BICS Besoin du business : surveiller lévolution de la marge Par destination Par responsable commercial (Account Manager, buyer) De manière journalière

14 14 18/05/2014 Cas pratique : BICS Données disponibles: Pour chaque appel : 1 Call Data Report (CDR) numéros appelé/appelant, infos de routage dappel (transmitting, receiving, destination) + durée France Télécom Deutsche Telekom Allemagne France BICS Transmitting op.Receiving op.DestinationDuration FT FRADTAG DEUDEU600

15 15 18/05/2014 Cas pratique : BICS Données disponibles Système de billing revenu, coût FT FRA paie pour que BICS forwarde lappel: revenu : 0,8 /min BICS paie DTAG DEU pour terminer lappel sur son réseau : coût : 0,6 /min On trouve 2 records pour le billing: Transm op. Receiving op. DestinationDurationR/EAmount FT FRADTAG DEUDEU600R8 FT FRADTAG DEUDEU600E6

16 16 18/05/2014 Cas pratique : BICS Données disponibles DB Commerciale : allocations des Account Managers et Buyers aux opérateurs AM : responsable sales : côté transmitting, revenu Buyer : responsable côté receiving, coûts Les tarifs varient aussi en fonction de la qualité de lappel First Class, Business Class,… Cette notion est également présente dans les CDR et prise en compte par le billing

17 17 18/05/2014 Cas pratique : BICS Comment répondre à la demande du business? Calcul dune marge? Allocation dun responsable commercial? Granularité temporelle? Et si une donnée change?

18 18 18/05/2014 Modèle de données On dispose de différentes données en input On peut les transformer Quel modèle utiliser pour les stocker efficacement pour répondre au besoin? A votre avis?

19 19 18/05/2014 Modèle dimensionnel Définir la granularité du modèle = niveau le plus détaillé de données dont on a besoin dans le reporting !! Pour le process quon souhaite modéliser, pas forcément pour lentreprise

20 20 18/05/2014 Modèle dimensionnel Concept de fait (fact table): Sujet danalyse : Ce dont on veut observer lévolution Constitué dune ou plusieurs mesures numériques Souvent continues - additives Concept de dimension: Critères suivant lesquels on va évaluer, qualifier, quantifier la mesure Dimensions danalyse description (dimension table)

21 21 18/05/2014 Modèle dimensionnel Star schema (schéma en étoile) Une table contient les faits quon va mesurer, au plus fin niveau de granularité, ainsi que des clés (techniques) vers les dimensions danalyse Autour, différentes tables contiennent les descriptions des dimensions

22 22 18/05/2014 Modèle dimensionnel Modèle en flocon (snowflake): Même principe quun schéma en étoile Mais certaines dimensions sont décomposées en sous-dimensions + : notion de hiérarchie, gain de place - : modèle plus complexe Modèle en constellation Plusieurs tables de faits utilisent les mêmes tables de dimensions + : gain de place - : modèle plus complexe (à parcourir par tool de reporting : notion de contexte)

23 23 18/05/2014 Cas pratique : BICS Granularité? 1 route complète (transmitting, receiving, destination + quality) Journalier Mesures? Durées dappel Revenu Coût (marge)

24 24 18/05/2014 Cas pratique : BICS Dimensions? Opérateurs Pays Responsables commerciaux Qualité de la route Date

25 25 18/05/2014 Cas pratique : BICS Une solution de modélisation possible Transformation des données: Billing : ramener coût et revenu sur une ligne et agréger par route et par jour dateTrans op. Trans Ctry Recv op. Recv ctry Dest ctry quali ty Dur.RevCost 20/02/2008FTFRADTAGDEU FC60086

26 26 18/05/2014 Cas pratique : BICS Transformation des données: Allocation des responsables commerciaux Éviter de travailler avec des date-from, date-to Denormaliser par date et par opérateur, les responsables Rem : en pratique on travaillera avec une date mensuelle et on utilisera une fonction dans la couche reporting pour faire le lien entre date jour et date mois… DateOperatorAcc_managerBuyer

27 27 18/05/2014 Cas pratique : BICS

28 28 18/05/2014 Cas pratique : BICS Alias des tables modèle en étoile avec quelques snowflakes

29 29 18/05/2014 Cas pratique : BICS Remarque : factless fact table Parfois on a besoin de garder des liens entre des dimensions, sans copier les détails dune dimension dans lautre pour chaque occurrence de lassociation On peut utiliser alors une factless fact table = une relation Par exemple pour les allocations de managers on pourrait avoir:

30 30 18/05/2014 Concepts DWH Et si une dimension change au cours du temps? Par exemple, si la description du type de route FC passe de First à First Class… Que se passe-t-il? Comment gérer cela dans le modèle?

31 31 18/05/2014 Slowly changing dimensions Si un attribut dune dimension change: 3 solutions pour garder la nouvelle valeur: Ecrasement de lancienne version (SCD1) Versionnement (SCD2) Valeur dorigine / valeur courante (SCD3)

32 32 18/05/2014 Slowly Changing Dimensions SCD1 : on écrase simplement la donnée dans la table de dimension pas dhistorique, données du passé seront liées à la nouvelle valeur SCD2 : notion de record actif : on historise dans la dimension, on clôture la ligne précédente et on crée un nouveau record avec la nouvelle valeur et une nouvelle clé technique les données du passé sont liées à lancienne valeur SCD3 : on maintient 2 colonnes : valeur dorigine, valeur actuelle toutes les données seront liées aux 2 informations

33 33 18/05/2014 Conclusion A lheure actuelle: énormément de données disponibles et éparses Important de les centraliser, les harmoniser et les organiser Pour en tirer de linformation utile et prendre des décisions

34 34 18/05/2014 Conclusion Un outil : le datawarehouse single version of the truth Extract-Transform-load; architecture 3-tier Datamarts Modèle dimensionnel Orienté reporting De nombreux tools existent Aspect important à ne pas négliger: la qualité des données en input! garbage in garbage out

35 35 18/05/2014 QUESTIONS ? Web site:


Télécharger ppt "Business Intelligence: introduction et concepts Datawarehouse Séminaire UMH Marie-Laure Cheyns – Hermes Senior Consultant ecs.com)"

Présentations similaires


Annonces Google