La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Edition 2012 – 10 et 11 décembre Rejoignez la Communauté.

Présentations similaires


Présentation au sujet: "Edition 2012 – 10 et 11 décembre Rejoignez la Communauté."— Transcription de la présentation:

1 Edition 2012 – 10 et 11 décembre Rejoignez la Communauté

2 Edition 2012 – 10 et 11 décembre Sponsors Platinum Modélisation Dimensionnelle

3 Edition 2012 – 10 et 11 décembre  Expérience en Microsoft B.I. : 4 Ans  Site / Blog :   Mail: 4 pôles d’expertise .Net  Business Intelligence  Sharepoint  Application Lifecycle Management (ALM) Charles-Henri Sauget

4 Edition 2012 – 10 et 11 décembre Florian Eiden  Expérience en Microsoft B.I. : 6 Ans  Site / Blog :   Mail: Spécialisé en Décisionnel, Partenariats Editeurs  Pôle Microsoft – Gold Partner  DataViz : QlikTeck et Tableau Software  IBM / Cognos – TM1  SAP BPC – Elaboration budgétaire

5 Edition 2012 – 10 et 11 décembre Merci à nos Sponsors Rencontrez les dans l’espace partenaires Sponsors Platinum Sponsors Gold Sponsors Silver

6 Edition 2012 – 10 et 11 décembre Message Il existe des règles simples pour construire un datawarehouse. Elles sont vraiment simples. Utilisez les.

7 Edition 2012 – 10 et 11 décembre Cas réel simple Entraineur de natation

8 Edition 2012 – 10 et 11 décembre Suivi de la performance des nageurs Axes d’analyses Quand : la date Qui : le nageur Quoi : le type de nage Où : la compétition … Résultats Performance (temps)

9 Edition 2012 – 10 et 11 décembre Enregistrement des performances QuandQuiQuoiPerformance (s) 10/11/2012Charly100m libre105 10/11/2012Florian100m libre139 …………

10 Edition 2012 – 10 et 11 décembre Analyse des performances QuandQuiQuoiPerformance (s) 10/11/2012Charly100m libre105 10/11/2012Florian100m libre139 …………

11 Edition 2012 – 10 et 11 décembre Vive le sport!

12 Edition 2012 – 10 et 11 décembre Que faire quand ça se complique? Axes d’analyses Température de l’eau Combinaison Vitesse du courant Axes d’analyses Météo Etat de la route Vélo Axes d’analyses Météo Présence de spectateurs Equipement Mesures Temps du tour Nb de tours

13 Edition 2012 – 10 et 11 décembre On met tout dans la même table?

14 Edition 2012 – 10 et 11 décembre On utilise plusieurs tables? ? ?

15 Edition 2012 – 10 et 11 décembre La réponse évidemment: Il existe des règles simples qui permettent de construire un datawarehouse : la modélisation dimensionnelle.

16 Edition 2012 – 10 et 11 décembre Ressources

17 Edition 2012 – 10 et 11 décembre Mon problème Triathlon Natation Course à pied Cyclisme Nouveaux axes d’analyse Condition météo Equipement Compétition

18 Edition 2012 – 10 et 11 décembre Règles simples Dans une même table de faits 1 seul événement Toutes les lignes racontent la même histoire 1 seule granularité Toutes les lignes décrivent l’événement au même niveau 1 seule dimensionnalité Toutes les lignes utilisent les mêmes axes d’analyse

19 Edition 2012 – 10 et 11 décembre Etape 1 : Choisir l’événement Un résultat sportif Une ligne dans ma table correspond à :

20 Edition 2012 – 10 et 11 décembre Etape 2 : Définir la granularité Un triathlon Une ligne dans ma table correspond à :

21 Edition 2012 – 10 et 11 décembre Etape 2 : Définir la granularité Un triathlon Une ligne dans ma table correspond à : Une épreuve physique

22 Edition 2012 – 10 et 11 décembre Etape 2 : Définir la granularité Un triathlon Une ligne dans ma table correspond à : Une épreuve physique Un résultat partiel

23 Edition 2012 – 10 et 11 décembre Etape 2 : Définir la granularité Un triathlon Une ligne dans ma table correspond à : Soit: Un résultat partiel de Natation Un résultat partiel Cyclisme Un résultat partiel Course à pied Une épreuve physique Un résultat partiel

24 Edition 2012 – 10 et 11 décembre Etape 3 : Penser ses dimensions Athlète Compétition Météo Equipement Epreuve Date (départ/arrivée) Triathlon Résultat Partiel Nat. - Cycl. - C.P. Epreuve physique OK Tour OK KO OK Résultat Partiel … … … … … … … … …

25 Edition 2012 – 10 et 11 décembre Etape 3 : Cas particuliers 1.On peut dupliquer les colonnes par sport 2. On peut prendre une valeur moyenne La météo de la journée (niveau triathlon) plutôt que celle de l’épreuve (l’heure de la journée) 3. On peut spécialiser les dimensions Pour les équipements, soit on dispose de 3 tables spécifiques à chaque sport, Soit on est obligé de n’utiliser qu’une seule table de dimension pour tous les sports (mélangeant vélos, maillots de bain et chaussures) …Date départ Natation Date arrivée Natation Date départ Course à Pied Date arrivée Course à Pied …

26 Edition 2012 – 10 et 11 décembre Etape 4 : Identifier les mesures Temps Total Temps Epreuve Temps Partiel Un triathlonSoit: Un résultat partiel de Natation Un résultat partiel Cyclisme Un résultat partiel Course à pied Une épreuve physique Un résultat partiel Temps Total Temps Epreuve Temps Total Temps Partiel Temps Epreuve Temps Total Mesures Spécifiques

27 Edition 2012 – 10 et 11 décembre Le champ des possibles En fonction des besoins, de la vision choisie, définir le modèle qui convient Temps Partiel Un résultat partiel Temps Epreuve Temps Total Athlète Compétition Météo Equipement Epreuve Date (départ/arrivée) Tour OK … …

28 Edition 2012 – 10 et 11 décembre Enfin, le schéma en étoile Athlète Compétition Météo Equipement Epreuve Date (départ) Date (arrivée) Tour Fait : Résultat Partiel Sport Nom Sport Type Temps Partiel

29 Edition 2012 – 10 et 11 décembre Ce qu’il faut retenir Dans une même table de faits 1 seul événement Toutes les lignes racontent la même histoire 1 seule granularité Toutes les lignes décrivent l’événement au même niveau 1 seule dimensionnalité Toutes les lignes utilisent les mêmes axes d’analyse

30 Edition 2012 – 10 et 11 décembre GESTION DE PROJET ET MODÉLISATION DIMENSIONNELLE  Le Cycle de vie d’un projet Décisionnel de Kimball  La Matrice de Bus

31 Edition 2012 – 10 et 11 décembre LE CYCLE DE VIE D’UN PROJET PAR KIMBALL

32 Edition 2012 – 10 et 11 décembre LE CYCLE DE VIE D’UN PROJET PAR KIMBALL Il peut servir de guide de conduite lors de la définition de notre projet Ex : Création du Datamart Facturation Matrice de Bus Générale

33 Edition 2012 – 10 et 11 décembre MATRICE DE BUS DateClientProduitPromotionRevendeur Facturation Client xxxx Facturation Revendeur xxx Retours Client xxx Satisfaction xx  La matrice de bus n’est pas :  Un découpage par Département (Piloté par l’organigramme de l’entreprise)  Un découpage par Rapport Processus métier Dimensions Conformes

34 Edition 2012 – 10 et 11 décembre LE CYCLE DE VIE D’UN PROJET PAR KIMBALL Mais aussi lors de la définition des itérations et user stories Ex: En tant que contrôleur de gestion, je veux avoir les ventes par produit de cette année afin de pouvoir construire le workplan 2013 Matrice de Bus Détaillée

35 Edition 2012 – 10 et 11 décembre MATRICE DE BUS DÉTAILLÉE Date Client Produit Promotion Revendeur Facturation Client FaitVentes Une ligne par vente à un client Montant vente, Quantité xxxx FaitRaisonVente Une ligne par vente et par raison Nombre de lignexxxx FaitQuotaVentesUne ligne par produitQuotaxxxx Facturation Revendeur FaitVentesRevend eurs Une ligne par vente à un revendeur par produit Prix de ventexxx Retours Client FaitRetourClient Une ligne par retour client Nombre de lignexxx Satisfaction FaitSatisfactionCli ents Une ligne par réponse au questionnaire client Note Clientxx Dimensions Usuelles Processus métier Table de faitGranularitéFait

36 Edition 2012 – 10 et 11 décembre MATRICE DE BUS DÉTAILLÉE  Aide à identifier les Processus Métier (Lignes)  Aide à identifier les Dimensions Conformes  Permet une visualisation rapide de leur utilisation  Conséquences :  Permet d’identifier les éléments non parallélisables  Evite le travail en Silo, et permet une plus grande transparence

37 Edition 2012 – 10 et 11 décembre Use Case n°1 : Agilité décisionnelle POC : Proof of Concept Domaine HSE : Health / Safety / Environment Faisabilité technique (Sources IBM Lotus Domino…) Démonstration technologique (BI Microsoft)

38 Edition 2012 – 10 et 11 décembre Proof of Concept : périmètre Besoin décisionnel Reporting pré-formaté et analyses ad-hoc (Excel) Données multi-sources, gestion de la qualité de données Fonctionnel Fréquences d’incidents physiques (blessures et maladies) Bac à sable Extractions de sources choisies en fichiers Excel Environnement technique:

39 Edition 2012 – 10 et 11 décembre POC : Jour 1 ODS SSIS Chargement des données en 1:1 en base Data Profiling o Manuel (SQL / Excel…) o SSIS Data Cleaning o 1 ères règles de gestion o Quelques tables de transcodage IdSourceInOut 1ATotal 2ATotal Corp.Total 3ATOTALTotal ………… TRA

40 Edition 2012 – 10 et 11 décembre POC : Jour 2 DWH ODS TRA SSIS Dimensions Table de Faits SQL Server PK (indexes cluster) Rapide lecture qualité des données par requêtes SQL

41 Edition 2012 – 10 et 11 décembre POC : Jour 3 DWH ODS TRA SSAS Cube par Wizard Nettoyage Dimensions o Temps o Hiérarchies 2/3 Mesures calculées Agrégations Rôles

42 Edition 2012 – 10 et 11 décembre POC : Jour 4 DWH SSRS ODS TRA SSRS 2 Rapports avec navigation o Source SQL (listes) o Source SSAS (agrégations) Excel Validation de la connexion Quelques TCD

43 Edition 2012 – 10 et 11 décembre POC : Jour 5 DWH SharePoint SSRS ODS TRA Listes

44 Edition 2012 – 10 et 11 décembre 5 Jours!? Connaissances de toutes les briques Et de comment elles s’imbriquent!

45 Edition 2012 – 10 et 11 décembre 5 Jours!? Vision Agile La simplicité – l’art de s’économiser du travail – est essentielle Vision Lean Pull : on tire une fonctionnalité depuis l’utilisateur, plutôt que la pousser vers lui Waste Management : on élimine tout ce qui n’est pas nécessaire et qui alourdit la souplesse du système

46 Edition 2012 – 10 et 11 décembre Une approche différente

47 Edition 2012 – 10 et 11 décembre Découpage du besoin? POC : Blessures et Maladies Projets et Clients Indicateurs mensuels

48 Edition 2012 – 10 et 11 décembre Découpage du besoin? POC : Blessures et Maladies Projets et Clients Indicateurs mensuels Cause Conséquence Classification Employé Lieu Client Date Incidents 1 ligne = L’implication « d’un salarié » dans un incident

49 Edition 2012 – 10 et 11 décembre Découpage du besoin? POC : Blessures et Maladies Projets et Clients Indicateurs mensuels Cause Conséquence Classification Employé Date Indicateurs Lieu Client Incidents (mois) (date) 1 ligne = Un relevé de compteur mensuel ( HeadCount / Exposure Hours ) 1 ligne = Un relevé de compteur mensuel ( HeadCount / Exposure Hours )

50 Edition 2012 – 10 et 11 décembre Livraison du POC Dimensions Cause Conséquence Classification Employé Client Date Lieu Mesures calculées : Fréquences Indicateurs Incidents

51 Edition 2012 – 10 et 11 décembre Evolutions! Blessures et Maladies Projets et Clients Indicateurs mensuels Evénements Blessures et Maladies (0:n) Environnementaux (0:n) Financiers (0:n) Indicateurs quotidiens Liste variable d’indicateurs Format pivot AttributsIndicateurValeur …HeadCount40 …Exposure Hours320 …Water Consumption (L)400

52 Edition 2012 – 10 et 11 décembre Evolutions! Blessures et Maladies Projets et Clients Indicateurs mensuels Evénements Blessures et Maladies (0:n) Environnementaux (0:n) Financiers (0:n) Indicateurs quotidiens Liste variable d’indicateurs Format pivot AttributsIndicateurValeur …HeadCount40 …Exposure Hours320 …Water Consumption (L)400 Factless Fact Table Entête + Détails Dim Indicateurs + Mesure « Value »

53 Edition 2012 – 10 et 11 décembre Factless Fact Table Pas de mesures pour un accident DimDateDimEmployéDimLieu DimDateDimEmployéDimLieuEstArrivé SUM(EstArrivé) > COUNT(*)

54 Edition 2012 – 10 et 11 décembre Tables Entête + Détails Dimensions Cause Conséquence Mat. Blessures Classification Employé Client Date Lieu Evénements B / M Evénements Blessures et Maladies (0:n) Environnementaux (0:n) Financiers (0:n) Env. Fin. Tables de Faits

55 Edition 2012 – 10 et 11 décembre Lier les entêtes et le détail Dimensions Cause Conséquence Mat. Blessures Classification Employé Client Date Lieu Evénements B / M Env. Fin. Dim Evénement Id_DimEvénement Dd_NumEvénement

56 Edition 2012 – 10 et 11 décembre Dim Indicateur et Mesure « Value » AttributsIndicateurValeur …HeadCount40 …Exposure Hours320 …Water Consumption (L)400 Dimensions Classification Employé Client Date Lieu Indicateur Indicateurs Value

57 Edition 2012 – 10 et 11 décembre Dim Indicateur : Astuce 1 AttributsIndicateurValeur …HeadCount40 …Exposure Hours320 …Water Consumption (L)400 Dimensions Classification Employé Client Date Lieu Indicateur Indicateurs Value AttributsHeadCountExp. Hours …40320 …42330 Pivot HeadCount Exp. Hours HeadCount Exp. Hours Indicateurs Pivotés

58 Edition 2012 – 10 et 11 décembre Dim Indicateur : Astuce 2 Dimensions Cause Conséquence Mat. Blessures Classification Employé Client Date Lieu Evénement Indicateur Evénements B / M Env. Fin.Indicateurs Dans SSIS : Indicateur = « Mesure »

59 Edition 2012 – 10 et 11 décembre Dim Indicateur : Astuces appliquées Pivotage d’une sélection d’indicateurs Sans/Avec « Mesures » dans la dimension Indicateur

60 Edition 2012 – 10 et 11 décembre Résultat Total Recordable Case Frequency TRCF = (LTI + MTC + RWC) X 1,000,000 / (Exposure Hours) (LTI) Lost Time Injuries (MTC) Medical Treatment Cases (RWC) Restricted Work Cases

61 Edition 2012 – 10 et 11 décembre USE CASE N°2  Comment gérer les changements dans notre DW ?  Les différents types de SCD  Et les Mini Dimensions ?

62 Edition 2012 – 10 et 11 décembre SCD : SLOWLY CHANGING DIMENSIONS OU VARIATION À DIMENSION LENTE Le choix du type de SCD à mettre en place  Type 1 : On écrase l’ancienne valeur  Mise en place avec PowerPivot  Mise en place avec SSIS  Type 2 : On Crée une nouvelle ligne avec une date de fin et une date de début.  Mise en place avec PowerPivot et DAX Power ! =MINX(Filter(Clients; Clients[Code Client]=Ventes[CodeClient] && (RELATED(Dates[Date]) >= Clients[Date Debut] &&(RELATED(Dates[Date]) <= Clients[Date Fin] || ISBLANK(Clients[Date Fin]))));Clients[ClientId])

63 Edition 2012 – 10 et 11 décembre SCD : ET EN CAS DE FORTE VOLUMÉTRIE ?  Utiliser les mini dimensions  Si la variation des données est trop rapide, ou si les volumétries sont trop importantes, il peut être nécessaire de créer une dimension dédiée et d’intégrer cette nouvelle dimension à notre table de fait. ETL Lookup sur le Rayon Clé ProduitCode ProduitNomRayon 29AA-56Lapin MalinJouet Instantané de stock Clé Date du Stock Clé ProduitClé RayonQuantité 28/02/ /03/ /04/ /05/ Clé RayonLibellé 2Jouet DimRayon Clé ProduitCode ProduitNom 29AA-56Lapin Malin DimProduit

64 Edition 2012 – 10 et 11 décembre  Type 3 : Nouvelle colonne  Et les hybrides SCD : SLOWLY CHANGING DIMENSIONS OU VARIATION À DIMENSION LENTE Clé ProduitCode ProduitNomRayon ActuelAncien Rayon 29AA-56Lapin MalinJouet(NULL) Clé ProduitCode ProduitNomRayon ActuelAncien Rayon 29AA-56Lapin MalinBoucherieJouet UPDATE DimProduit SET… Clé ProduitCode ProduitNomRayonAncien RayonDate DébutDate Fin 29AA-56Lapin MalinJouet(NULL)01/01/201031/03/ AA-56Lapin MalinBoucherieJouet01/04/2011(NULL)

65 Edition 2012 – 10 et 11 décembre Conclusion Etat actuel Théorie stable Indépendante de la techno o Microsoft PowerPivot : schéma en étoile o Microsoft SSAS Tabular : schéma en étoile o Et également chez les autres éditeurs! Utilisée comme catalyseur pour les nouveaux besoins

66 Edition 2012 – 10 et 11 décembre Conclusion Prochains challenges Transmettre ce savoir aux utilisateurs, pour la BI Self-Service Passer aux briques du dessus: Information > Connaissance o Modélisations statistiques et analyses prédictives o Visualisation de données

67 Edition 2012 – 10 et 11 décembre Continuez l’expérience online Rejoignez la Communauté

68 Edition 2012 – 10 et 11 décembre


Télécharger ppt "Edition 2012 – 10 et 11 décembre Rejoignez la Communauté."

Présentations similaires


Annonces Google