Analyse de données avec PowerPivot

Analyse de données avec PowerPivot

Analyse de données avec PowerPivot Objectif de la formation
Objectifs pédagogiques Se connecter à des sources de données variées (Cubes OLAP, entrepôts de données, fichiers plats et tableaux Excel) Associer des tables de différentes provenances pour en faire des ensembles cohérents Effectuer des calculs et concevoir des indicateurs avec le langage DAX Utiliser Excel afin de concevoir des tableaux croisés, des graphes et des tableaux de bord

Analyse de données avec PowerPivot Participants et pré requis
Tout utilisateur d'Excel ayant besoin d'analyser et de synthétiser des données. Pré-requis Bonnes connaissances d'Excel ou niveau équivalent aux cours Excel Niveau 1. Connaissances de base des SGBD relationnels.

La formatrice Laure BERENGUER, consultante et formatrice indépendante

Table des matières Introduction à la BI et bases de données Page 6
La Business Intelligence Page 8 OLTP Page 10 OLAP Page 23 Restitution des données avec PowerPivot Page 30 Ajout des données Page 38 Diagramme Page 43 Power Pivot et Analysis Services Page 55 Calcul dans le tableau croisé dynamique Page 60 Création d’un graphique Page 68 Création d’un KPI Page 70

Introduction à la BI et aux bases de données
La Business Intelligence dans l’entreprise Qu'est-ce qu'une base et un serveur de base de données ? Lire un modèle relationnel.

A la fin de cette session, vous serez capable de :
Comprendre l’intérêt de la Business Intelligence Comprendre l’architecture d’une base de données relationnelle et lire un modèle physique de données Reconnaître les tables Reconnaître les champs Reconnaître les clés (Primaires et Etrangères) Connaître les différents types de données Comprendre la contrainte d’intégrité fonctionnelle Faire la différence entre une base OLTP et une base OLAP Introduction aux bases de données Qu'est-ce qu'une base et un serveur de base de données ? Lire un modèle relationnel. Composition d'une table. Notion de colonne et de types. Clé primaire et unicité. Liens entre les tables et intégrité référentielle. Métadonnées des tables, colonnes et clés. Outil pour interroger une base.

La Business Intelligence dans l’entreprise
Du transactionnel au décisionnel….. La BI : Ensemble des moyens, outils et méthodes qui permettent de collecter, de consolider, de modéliser et de de restituer les données, matérielles ou immatérielles, d´une entreprise en vue d´offrir une aide à la décision. Du transactionnel au décisionnel Depuis un demi-siècle, l’informatique envahit nos activités, augmentant notre productivité. Avec l’apparition de l’informatique de gestion, les années 60 ont vu naître les premières bases de données. Des entreprises essayent de comprendre comment fonctionnent nos sociétés, et ce que l’informatique peut leur apporter. Faire entrer les registres, les fichiers, les transactions dans la mémoire de l’ordinateur permet à l’entreprise d’aller plus vite, de gérer plus de volume d’activité, d’augmenter ses profits. En 1970, le célèbre E.F. Codd, chercheur au sein d’IBM, énonce huit formes normales pour concevoir un système transactionnel robuste. Il vient d’inventer le SGBDR (Système de Gestion de Bases de Données Relationnelles, RDBMS en anglais) qui va rapidement devenir le socle indispensable de l’OLTP (OnLine Transaction Processing, soit en français : processus de transaction en ligne). Toutes les opérations de gestion de l’entreprise peuvent être modélisées comme des transactions : encaisser un article en magasin, ajouter un client au fichier, saisir un inventaire, enregistrer les congés d’un salarié... Une transaction est atomique : c’est un ensemble indivisible. Une transaction est cohérente : elle modifie les objets de la base de données de telle manière qu’ils soient dans un état cohérent fonctionnellement à sa fin. Une transaction est isolée des autres : elle ne les voit pas et les autres ne la voient pas tant qu’elle est en cours. Enfin, une transaction est durable : l’état du système à sa fin est mémorisé. Ce modèle gère très efficacement les accès concurrentiels et l’intégrité des données de l’entreprise. Ses différentes implémentations commerciales (IBM, Oracle...) connaissent rapidement un fort succès que l’essor des microprocesseurs dans les années 70, puis des micro-ordinateurs dans les années 80, vient renforcer. Les systèmes OLTP et les SGBDR ont littéralement envahi l’entreprise moderne qui ne peut fonctionner sans ERP (Enterprise Resource Planning ou Progiciel de Gestion Intégré), CRM (Customer Relationship Management ou Gestion de la Relation Client), gestion des stocks, comptabilité, caisses électroniques... Toutes ces applications remplissent des bases de données transactionnelles : des millions d’enregistrements, des milliards de transactions, dans des milliers de tables parfois liées les unes aux autres par un schéma complexe, dit normalisé, qui répond parfaitement au besoin de gestion de l’activité, mais qui reste opaque pour les gestionnaires de l’entreprise. Et si à partir de cette mine d’informations, on essayait d’augmenter notre connaissance sur le fonctionnement de l’entreprise ? Sur les actions qui ont été profitables ? Sur les produits en forte croissance ? Sur les goûts des clients ? Sur la qualité de la production ? Sur les niveaux de stock ? Augmenter la connaissance pour améliorer le processus de prise de décision : décider mieux et plus vite.

1. Conception d’une base de données de stockage : DW
BI : Architecture type 1. Conception d’une base de données de stockage : DW Les services informatiques tentent d’abord de répondre à ces questions en programmant des algorithmes, des requêtes qui vont lire les bases transactionnelles. Mais obtenir une information nécessite de parcourir de nombreuses tables en suivant des relations complexes et d’attendre la fin des transactions pendant lesquelles l’information ne peut être exploitée car incohérente... La lecture elle-même a pour effet de bloquer l’activité de gestion car ce qui est lu doit être cohérent. Les données sont volatiles, elles ne sont pas conservées en ligne, mais sur des systèmes de sauvegarde, des bandes archivées en lieu sûr. Enfin, chaque logiciel possède son schéma de données, sa fiche produit, sa fiche client... Comment rapprocher toutes ces informations ? Dans ces conditions, répondre aux questions que se posent les dirigeants de l’entreprise est un casse-tête... Le décisionnel, ou l’informatique décisionnelle, est l’ensemble des réponses à ce besoin. Il concentre les différentes techniques qui permettent à une organisation de disposer de l’information juste et à temps pour prendre des décisions et mesurer leurs résultats. Son principe de base est la modélisation OLAP (OnLine Analytical Processing, soit en français : processus d’analyse en ligne), formalisée à nouveau par E.F. Codd, à la fin de l’année Son objectif est d’apporter aux utilisateurs finaux de l’informatique l’information cachée dans les systèmes de l’entreprise, d’« être capable de distribuer les données aux utilisateurs sans les obliger à apprendre des langages de programmation, d’interrogation ou même qu’ils aient à programmer des tableurs ». Elle repose sur une remise à plat du schéma normalisé, la dénormalisation, création d’axes d’analyse simples et orientés métier : les dimensions. Le second principe est la distribution ou la mise à disposition de l’information qui doit être accessible facilement à un utilisateur non initié. Les données sont soit poussées vers lui soit retirées par lui. L’analyse est soit statique soit dynamique. Comme l’OLTP a peu à peu envahi notre univers, l’OLAP est aisément accessible ou vient à l’utilisateur. Il fait progressivement son apparition dans notre quotidien : les clients qui ont commandé tel produit ont aussi commandé ceux-là... Le troisième principe est de conserver les données produites par les transactions dans une base de données isolée des systèmes de production : l’entrepôt de données. Il permet de conserver un historique plus important, de fusionner dans une même unité, les données de différents systèmes. Il constitue un socle pour réaliser toutes les analyses souhaitées sans gêner et être incommodé par les milliers de transactions qui touchent le cœur des systèmes de gestion de l’entreprise. Enfin, il est la source unique d’information des différents décideurs de l’entreprise. Cela permet de mettre tout le monde d’accord sur les chiffres, et d’éviter qu’une analyse soit lancée autant de fois qu’il y a de personnes concernées par son résultat. 3. Exploitation des données grâce aux outils de reportings, au datamining, aux outils OLAP, etc. 2. Extraction puis transformation des différentes données de l’entreprise pour chargement sur DW

SGBD : Eléments constitutifs
Les modèles de données : Conceptuel (MCD) si possible Physique (MPD) indispensable Les tables Les champs (colonnes) et les types de données Les enregistrements (lignes) Les clés et les contraintes Les relations Les index Les 2 modèles associés sont : Le modèle conceptuel (MCD) Modèle fondamental qui rend compte des structures d’organisation, des informations et des contraintes. Il est indépendant de toute « réalité » physique. Le modèle physique (MPD) Concerne le stockage physique, ainsi que l’accès aux données. Ce modèle intègre la réalité de l’entreprise (choix techniques, matériel, système d’exploitation) Les tables C’est l’unité fondamentale, qui stocke les données Les colonnes (champs) Représente la plus petite structure logique d’une base de données. C’est une structure verticale qui contient les valeurs sur chaque ligne de la table Chaque champ possède un type de données U NIQUE et représentatif Les lignes Collection de valeurs inscrites dans les colonnes successives d’une table. L’ensemble doit former un enregistrements unique Les clés 3 types de clés: Primaire (PK), étrangère (FK) et alternative (AK) Ces clés seront étudiées plus loin. Les relations Permettent d’unir deux tables entre elles (un client et ses commandes, un produit et ses fournisseurs, etc…) Elles sont la plupart du temps entre PK et FK Les index pour améliorer les temps de réponse

SGBD : Notions fondamentales
Une base de données est un ensemble structuré et organisé (en tables) permettant le stockage de grandes quantités d'informations afin d'en faciliter l'exploitation (ajout, mise à jour, recherche et analyse des données). Afin de la créer et de la construire, nous allons dessiner deux modèles : Le modèle conceptuel (MCD) Modèle fondamental qui rend compte des structures d’organisation, des informations et des contraintes. Il est indépendant de toute « réalité » physique. Le modèle physique (MPD) Concerne le stockage physique, ainsi que l’accès aux données. Ce modèle intègre la réalité de l’entreprise (choix techniques, matériel, système d’exploitation) Une base de données se traduit physiquement par un ensemble de fichiers sur disque. Structure: Le point le plus important pour pouvoir considérer un logiciel comme une base de données est son processus aux accès concurrent aux données/enregistrements. Ce point est primordial pour permettre le développement, durable, sécuritaire, répartie et efficace d'une base de données. Un Système de Gestion de Bases de Données (SGBD) est un logiciel de haut niveau permettant aux utilisateurs de structurer, d’insérer, de modifier, de rechercher de manière efficace des données spécifiques, au sein d’une grande quantité d’informations, stockées sur mémoires secondaires partagée de manière transparente par plusieurs utilisateurs. Plus précisément, les systèmes de gestion de bases de données (SGBD) sont des programmes permettant à l’utilsateur de créer et de gérer des bases de données. les SGBD sont des logiciels à usage général qui assurent les processus de définition, de construction, de manipulation et de partage des bases de données par et entre les différents utilisateurs et applications. La définition d’une base de données implique une spécification des types de données, des structures et des contraintes. La construction d’une base de données consiste à enregistrer les données proprement dites sur un support de stockage contrôlé par le SGBD. La manipulation de la base consiste notamment à l’interroger afin d’en extraire des informations, à l’actualiser en fonction des modifications du microcosme considéré et à générer des rapports. Le partage d’une base de données permet à différents utilsateurs et applications d’y accéder simultanément. (source wikipedia)

SGBD : Le modèle conceptuel (MCD)
Le modèle conceptuel de données sert à ... conceptualiser l'application! Il met en évidence deux éléments : les entités et les associations. L'entité L'entité est un objet que l'on souhaite modéliser, par exemple une facture, une voiture, un appartement. Chaque entité possède des attributs : la voiture possède par exemple une couleur, une marque, un nombre de portes... Il peut exister de 0 à n occurrences d'une entité. Les attributs des entités possèdent des types standardisés pour les décrire, par exemple : D : Date, BL : Booléen, I : Nombre entier (int), etc. Les associations Les associations illustrent le lien entre les entités : les relations sémantiques. Par exemple, Mr Dupont possède 4 voitures, mais chaque voiture n'a qu'un seul propriétaire. On parle alors de cardinalité : le nombre de fois où une entité peut appartenir à une association. Exemple : Un humain possède de 0 à n voitures, Une voiture appartient à au moins une personne, sans maximum de propriétaires, Un humain utilise une seule voiture à la fois quand il conduit.Une voiture peut être conduite par 0 ou n personne!

SGBD : Le modèle logique (MLD) et modèle physique (MPD)
Le MLD Explication rapide : il s'agit de convertir notre MCD en un ensemble compréhensible pour un SGBD. Les entités sont remplacées par des des éléments de bases de données : les tables. Le MPD Il absorbe souvent le MLD : en effet il s'agit d'un affinement du MLD pour un SGBD spécifique. Exemple de MPD : Ici le champ Ville de la table humain est une clé étrangère dont la valeur correspondante se trouve dans la table Ville. Cette liaison via une clef étrangère est renseignée dans la base de données sous le nom FK_VILLE (FK pour FOREIGN KEY).

Le MPD de la base DistrisysDW

Le MPD de la base ContosRetailDw

Bases de données (SGBD) : Une table

Terminologie Bases de données (SGBD) : Contenu d’une table
Ensemble de données relatives à un même concept, ou permettant de lier d'autres tables. Table des clients, table des commandes Colonne Élément vertical dans une table représentant un ensemble de valeurs d'un attribut. le mot champ n'est pas approprié à la terminologie des bases de données car il suppose une notion visuelle qui n'existe pas dans une base de données relationnelle (exemple champ opératoire du chirurgien, champ visuel du pilote...). Colonne "Nom" de la table des clients, colonne "Mode de paiement" de la table des commandes Ligne Élément horizontal dans une table représentant une énumération des valeurs des différents attributs (colonne) pour une même référence (identifiant). le mot enregistrement n'est pas approprié à la terminologie des bases de données car il suppose une notion physique (support magnétique de stockage) qui n'existe pas dans une base de données relationelle. Ligne de référence N° de commande = 328 de la table commande Clef (Clé ou Clef primaire) Identifiant d'une table composé d'un ou plusieurs attributs ou colonne. Une clef permet de retrouver sans ambiguïté la ligne dans une table. Les valeurs d'une clef doivent être unique au sein de la table. 328 est la valeur unique de la clef n° de commande permettant de retrouver l'enregistrement 2884 du fichier commande.DB Clef étrangère Colonne, ou groupe de colonne représentant une clef d'une table, insérée dans une autre table afin d'assurer la relation entre les deux tables. Le n° de client dans la table des commandes est une clef étrangère dans cette table, et une clef primaire dans la table des clients

Structure d’une base de données : Les tables
La structure de la base (nom de tables) est une bonne indication de la facilité (ou non) avec laquelle on va pouvoir extraire Les données,

Structure d’une base de données : Les champs
Champs normalisés Le nom des champs est également un indicateur fiable pour se retrouver dans le méandre des données Le type de données doit être connu, Champs non normalisés

Structure d’une base de données : Les types de données courants
Texte Char(n), VarChar(n), nChar(n), nVarchar(n) 0 à 255 Char(10) : 10 octets sur le disque /et en mémoire même si la valeur du champ est « Paris » Varchar(10) : 5 octets sur disque/mémoire si le champ contient « Paris » Numérique (entier ou décimal) Int, Smallint, bigint selon la valeur maximale acceptée Decimal (x,y) : Decimal (5,2) indique 5 chiffres avant la virgule et une précision à 2 chiffres après la virgule Numeric (x,y) : Identique à Decimal Float : Réservé aux calculs scientifiques (très gourmand en mémoire) Date DateTime, SmallDateTime (« juste » la date, ou date jusqu’au centièmes de seconde) Le nom des champs est également un indicateur fiable pour se retrouver dans le méandre des données Le type de données doit être connu,

Structure d’une table : Les clés
Clé étrangère Foreign Key / FK) Clé primaire (primary Key /PK) Clé primaire La clé primaire est un champ identifiant, c’est àdire sans doublon, On a coutume de dire que la clé primaire garantit l’unicité de l’enregistrement, Une « bonne » clé primaire est un artefact, c’est à dire une donnée qui n’a aucune valeur intrinsèque, Une clé primaire composée d’un champ numérique auto-incrémenté, c'est-à-dire que les enregistrements sont numérotés automatiquement dans la table., est excellente, Le premier enregistrement aura le numéro 1 et ainsi de suite. Une « mauvaise » clé primaire serait, par exemple, une référence produit composée de chiffres et de lettres (AlphaNumérique) On reconnaît une clé primaire dans une table par ce qu'elle est soulignée, ou/et qu’elle est représentée par une petite clé jaune LE rôle d’une clé primaire est – fondamentalement – de permettre une RELATION avec une autre table La PK de la table parent (côté 1) est reliée avec la FK de la table enfants (côté n) Clé étrangère Une clé étrangères est une clé qui représente la valeur de la clé primaire d'une table connexe. Elles servent à établir des relations entre les tables, ce sont elles qui permettent les jointures entre les tables. Contrairement aux clés primaires, qui doivent être uniques, les clés étrangères peuvent prendre plusieurs fois la même valeur dans une table. Relation 0,1….n

Structure d’une table : Les index
Un index est une liste ordonnée qui permet un accès rapide à un enregistrement spécifique d'une base de données à partir de la valeur de l'un des éléments de cet enregistrement (cela signifie que l'on ne va pas parcourir toute la base pour trouver une valeur). Index indispensables : Clés primaires (par défaut, les enregistrements sont classés – ordonnées – dans l’ordre de la clé primaire) Clés étrangères : Vital pour la performance dès que l’on interroge plus d’une table Index utiles : Ils peuvent être construits de nombreuses colonnes (Nom du client, ville, pays, etc,,) mais doivent toujours être construits – et testés - en production Analogie pour comprendre les index en SQL Un index, dans le domaine bibliographique, permet de lister les mots-clés importants abordés dans un ouvrage et d’indiquer les pages où le mot est mentionné. Ainsi, un lecteur qui recherche une thématique spécifique peut se baser sur cet index pour trouver les pages qui abordent le sujet. Ainsi un index est une ressource non indispensable, mais c’est un un gain de temps terrible pour l’utilisateur qui accède facilement à l’information recherchée.

OLAP Du modèle au réel….. OLAP et la business intelligence
L’entrepôt de données (Datawarehouse) Les dataMarts Tables de faits et de dimension La matrice dimensionnelle Schémas en flocons et en étoiles La dénormalisation (traitée au chapître suivant)

Techniques de modélisation OLAP L’entrepôt de données (DataWarehouse)
Qu’est ce qu’un entrepôt de données ? Quelle structure permet-elle d'avoir les fonctionnalités requises pour un entrepôt de données ? Quelles sont les techniques utilisées pour bien concevoir ? Quels sont les indicateurs d'une bonne conception ? Un entrepôt de données, ou data Warehouse, est une vision centralisée et universelle de toutes les informations de l'entreprise. C'est une structure (comme une base de données) qui à pour but, contrairement aux bases de données, de regrouper les données de l'entreprise pour des fins analytiques et pour aider à la décision stratégique. La décision stratégique étant une action entreprise par les décideurs de l'entreprise et qui vise à améliorer, quantitativement ou qualitativement, la performance de l'entreprise. En gros, c'est un gigantesque tas d'informations épurées, organisées, historisées et provenant de plusieurs sources de données, servant aux analyses et à l'aide à la décision. L'entrepôt de données est l'élément central de l'informatique décisionnelle. En effet, l'entrepôt de données est le meilleur moyen que les professionnels ont trouvé pour modéliser de l'information pour des fins d'analyse, et il ne serait pas étonnant que d'ici quelques années un nouveau concept apparaisse pour révolutionner l'informatique décisionnelle…

Techniques de modélisation OLAP Les Datamarts
Les DataWarehouses étant, en général, très volumineux et très complexes à concevoir, on les divise en « sous systèmes » plus faciles à créer et entretenir : Les Datamarts On peut faire des divisions par fonction (un datamart pour les ventes, pour les commandes, pour les ressources humaines) ou par sous-ensemble organisationnel (un datamart par succursale).

Techniques de modélisation OLAP Les tables de dimensions
Lorsqu'on fait un schéma de BD pour un système d'information classique, on parle en termes de tables et de relations, une table étant une représentation d'une entité et une relation une technique pour lier ces entités. En BI, on parle en termes de Dimension et de Faits. C'est une autre approche des données. On entend par dimensions les axes avec lesquels on veut faire l'analyse. Il peut y avoir une dimension client, une dimension produit, une dimension géographie (pour faire des analyses par secteur géographique), etc. Une dimension est tout ce qu'on utilisera pour faire nos analyses.

Techniques de modélisation OLAP Les tables de faits
Les faits, en complément aux dimensions, sont ce sur quoi va porter l'analyse. Ce sont des tables qui contiennent des informations opérationnelles qui relatent la vie de l'entreprise. Un fait (ou mesure) est tout ce qu'on veut pouvoir analyser. On aura des tables de faits pour les ventes (chiffre d'affaire net, quantités et montants commandés, quantités facturées, quantités retournées, volumes des ventes, etc.) par exemple ou sur les stocks (nombre d'exemplaires d'un produit en stock, niveau de remplissage du stock, taux de roulement d'une zone, etc.), ou peut être sur les ressources humaines (performances des employés, nombre de demandes de congés, nombre de démissions, taux de roulement des employés, etc.).

Techniques de modélisation OLAP Le schéma en étoile

Techniques de modélisation OLAP Le schéma en flocon

Restitution des données : Excel PowerPivot comme interface
Créer des Tableaux Croisés Dynamiques et des graphes croisés dynamiques. Définir des mesures dans les TCD : fonctions, ratio, écarts, progression. Définir des niveaux de groupement chronologique, définir des tranches de valeurs. Utiliser les segments pour qualifier dynamiquement les données. Utiliser les chronologies pour filtrer les analyses.

Installer PowerPivot (jusqu’à la version 2010)
Télécharger la dernière version sinon le produit n’est pas complet et ne peut pas fonctionner

Installer PowerPivot (depuis 2013)
Ouvrir Excel et Cliquer sur l’onglet Fichier (tout à gauche) puis OPTIONS Ensuite, cliquer sur Compléments, sélectionner Power Pivot et dans gérer (Compléments COM) Puis cliquer sur Atteindre et OK

Ouvrir PowerPivot 2010 2010 Ouvrez Excel 2010 sur un ordinateur où PowerPivot pour Excel est installé. Dans le ruban Excel, cliquez sur l'onglet PowerPivot. Sous l'onglet PowerPivot, cliquez sur Fenêtre PowerPivot 2013

Champs et mesures Les mesures (somme, moyenne…) sont des valeurs calculées agrégées Les champs (colonnes ) sont des axes d’analyse

PowerPivot : La démarche
Ajouter les données (Accéder aux bases de données relationnelles : SQL Server, Access, ODBC etc.) Sauvegarder le classeur Créer / vérifier relations (Utiliser la vue Diagramme) Supprimer les colonnes inutiles Créer les colonnes calculées Masquer les colonnes inutiles (utilisateur) Marquer l’onglet date en tant que table de dates Créer les hiérarchies Créer et tester le tableau croisé Créer les mesures Créer les graphiques (si nécessaire) Ajouter les segments (slicers) Créer KPI si utiles

La fenêtre PowerPivot 2010 Srce : Excellente présentation Microsoft 2013

Les outils PowerPivot Page Microsoft très bien détaillée

Ajouter les données Accéder aux bases relationnelles
2010 2013

Ajouter les données : Etapes de connexion / import
1 2 4 3

Ajouter données Les tables importées… et sauvegarder le classeur
Les tables sont représentées par des onglets Le classeur est un classeur Excel « standard », qui contient un accès à la fenêtre PowerPivot

Ajouter un fichier Excel, un fichier texte… 2010
Attention à lier les tables (fenêtre diagramme) par un champ commun (PK/unique vers FK multiple)

Ajouter un fichier Excel, un fichier texte… 2013
Attention à lier les tables (fenêtre diagramme) par un champ commun (PK/unique vers FK multiple)

Vérifier (créer) les relations
A partir de la vue de diagramme (disponible uniquement avec la dernière version) La vue de diagramme est disponible dans l'onglet Dossier de base de la fenêtre PowerPivot et vous permet d'afficher des tableaux de façon organisée et d'ajouter et modifier facilement les relations et les hiérarchies.

La vue de diagramme et les relations
Cette vue est indispensable pour créer les (non moins indispensables) hiérarchies

Créer une relation en Cliquer-Glisser

Gérer les relations manuellement
1 2 Cliquer sur l’onglet Conception Cliquer sur Gérer les relations

Supprimer les colonnes inutiles

Marquer l’onglet date en tant que table de dates
Onglet Conception Marquer en temps que table de date Choisir la clé primaire

Créer champs calculés : Calculs simples

Créer champs calculés : Fonctions avancées
Ces deux colonnes calculées vont permettre de créer une hiérarchie sur Pays, département et site

Champs calculés : NumMois (pour trier les mois dans l’ordre du calendrier)
1: Créer le champ NumMois 2 : trier par colonne 3 : trier le nom du mois sur le champs NumMois

Créer les hiérarchies Vue de diagramme
1 2 3 Une hiérarchie est une liste visuelle, une collection de colonnes que vous créez sous la forme de niveaux enfants classés dans un ordre quelconque dans la hiérarchie. Les hiérarchies peuvent apparaître séparément des autres colonnes dans un outil client de création de rapports, ce qui les rend faciles à sélectionner et à parcourir par les utilisateurs du client via les chemins d'accès aux données habituels. Les tableaux peuvent inclure des douzaines voire des centaines de colonnes avec des noms de colonne complexes. C'est pourquoi les utilisateurs du client peuvent avoir des difficultés à trouver et à inclure les données dans un rapport. L'utilisateur du client peut ajouter la totalité de la hiérarchie (comprenant plusieurs colonnes) dans un rapport, en un seul clic. Les hiérarchies peuvent également fournir une vue simple et intuitive de la structure de données. Par exemple, dans un tableau de dates, vous pouvez créer une hiérarchie de calendrier. « Année civile » est utilisé comme niveau parent de premier niveau, avec « Mois », « Semaine » et « Jour » inclus comme niveaux enfants (Année civile->Mois->Semaine->Jour). Cette hiérarchie montre une relation logique entre « Année civile » et « Jour ».

Masquer des colonnes dans l’outil client (le tableau croisé)

Créer un tableau croisé dynamique

Powerpivot et Analysis Services Se connecter au cube
Se connecter à SSAS, puis au cube Cliquer sur Conception , puis choisir les mesures, attributs et hiérachies de dimensions Le CUBE est bien entendu déjà crée et processé,

Powerpivot et Analysis Services Importer les données
Faire glisser les champs Renommer la requête et terminer Le CUBE est bien entendu déjà crée et processé. .

Powerpivot et Analysis Services La feuille générée
A l’issue de l’importation, un seul onglet est créé La feuille et ses colonnes renommées

Powerpivot et Analysis Services Le tableau croisé dynamique
Le « problème » des mois non triés est toujours le même… Importer une feuille Excel dans le PowerPivot, puis trier la colonne Mois sur le NumMois

Powerpivot et Analysis Services Le tableau croisé dynamique trié

Calcul dans le tableau croisé
Fonctions DAX, fonctions Excel et calcul dans le TCD. Trier et filtrer les données. Organiser les colonnes et éliminer les informations inutiles. Créer des colonnes calculées. Convertir et formater les données. Préparer les niveaux de regroupement. Concevoir des champs calculés. Réaliser des mesures pré-calculées. Mettre en œuvre une gestion des dates intelligente.

Mesures calculées et fonctions DAX
Les champs calculés s’appliquent aux lignes et colonnes du tableau (voir champs calculés plus haut dans le support) Les mesures s’appliquent aux agrégations(même si Excel indique « champ calculé » dans le tableau croisé La plupart des fonctions DAX seront copiées_collées à partir du document : Practical PowerPivot & Dax Formulas for Excel 2010

Mesures calculées et fonctions DAX : Exemple (1/2)
Création de la mesure 1: La somme des montants des ventes =SUM(FactSales[SalesAmount]) : (somme : (nomtable[nomchamp]) On pourrait avoir average, count, max, min, etc. Création de la mesure 2 : La somme des montants des ventes de l’année précédente =Calculate(SUM(FactSales[SalesAmount]), DateADD(DimDate[Datekey], -1, YEAR)) Ou =Calculate([Measure 1], DateADD(DimDate[Datekey], -1, YEAR)) Si nous n’avons pas renommer notre mesure 1, elle s’appellera Measure 1 et nous pouvons utiliser son nom (sans ré-écrire le code)

Mesures calculées et fonctions DAX : Exemple (2/2)
Ratio année présente / Année précédente (Mesure 3) = SUM(FactSales[SalesAmount]) / Calculate(SUM(FactSales[SalesAmount]), DateADD(DimDate[Datekey], -1, YEAR)) OU =[Measure 1]/ [Measure 2] Même mesure mais avec une précaution (IF et BLANK – NON NULL) =IF(Calculate(SUM(FactSales[SalesAmount]), DateADD(DimDate[Datekey] , -1, YEAR)), (si je peux calculer une somme sur l’année n-1 ALORS) SUM(FactSales[SalesAmount]) / Calculate(SUM(FactSales[SalesAmount]), DateADD(DimDate[Datekey] , -1, YEAR)), BLANK()) (alors je fais ma division, sinon Null – rien)

Mesures calculées et fonctions DAX : Nom des mesures et ré-utilisation
Soit nous n’avons pas renommer la colonne : il faut donc reprendre le nom créer automatiquement [Measure 1] Sinon, renommer avec un nom qui nous parle et l’utiliser avec les [] dans la formule DAX

Mesures calculées et fonctions DAX : First Date ou LastNonBlank
=CALCULATE(SUM('Order Details'[Sales Amount]), FIRSTDATE(Orders[OrderDate])) LASTNONBLANK =CALCULATE(SUM('Order Details'[Sales Amount]), LASTNONBLANK(Orders[OrderDate],SUM('Order Details'[Sales Amount]))) Je souhaite la somme des montants des ventes correspondant à la première date La seconde formule : il ne prend pas la première valeur à la première date, mais la première valeur non null

Mesures calculées et fonctions DAX : NextMonth (nextquarter, nextday, etc.)
Exemple avec NEXTMONTH : =CALCULATE(SUM('FactSales'[SalesAmount]), NEXTMONTH(DimDate[Datekey])) Je souhaite la somme des montants des ventes correspondant à la première date La seconde formule : il ne prend pas la première valeur à la première date, mais la première valeur non null

Mesures calculées et fonctions DAX : PARALLELPERIOD()
Exemples courants avec PP (comme dateADD ou sameperiod) : =CALCULATE(SUM('FactSales'[SalesAmount]), PARALLELPERIOD(DimDate[Datekey],-1,MONTH)) =CALCULATE(SUM('FactSales'[SalesAmount]), PARALLELPERIOD(DimDate[Datekey],1,QUARTER)) =CALCULATE(SUM('FactSales'[SalesAmount]), PARALLELPERIOD(DimDate[Datekey],1,YEAR)) Je souhaite la somme des montants des ventes correspondant à la première date La seconde formule : il ne prend pas la première valeur à la première date, mais la première valeur non null

DAX (Data Analysis Expressions) : Autres exemples représentatifs
= IF( ISNUMBER( Sales[Price] ), Sales[Quantity] * Sales[Price], BLANK() ) = IF( ISERROR( Sales[Quantity] * Sales[Price] ), BLANK(), Sales[Quantity] * Sales[Price] ) Day = DAY( Calendar[Date] ) Month = FORMAT( Calendar[Date], "MM - mmmm" ) Year = YEAR( Calendar[Date] ) Between = =CALCULATE(SUM('Order Details'[Sales Amount]), DATESBETWEEN(Orders[OrderDate],DATE(1997,12,1),DATE(1997,12,3))) Les deux ouvrages cités sur la page bibliographie contiennent toutes les formules et calculs utilisés dans PowerPivot

DAX (Data Analysis Expressions) : Autres exemples représentatifs
ParallelPeriod:=CALCULATE(SUM('FactSales'[SalesAmount]); PARALLELPERIOD(FactSales[DateKey]; -2;YEAR)) SPLY:=CALCULATE(SUM(FactSales[SalesAmount]);SAMEPERIODLASTYEAR(DimDate[Datekey])) ParallelePeriod : Retourne une table contenant une colonne de dates qui représente une période parallèle aux dates de la colonne dates spécifiée, dans le contexte actuel. Les dates sont avancées ou reculées d'un certain nombre d'intervalles. Syntaxe PARALLELPERIOD(<dates>,<number_of_intervals>,<interval>) Paramètres dates Colonne qui contient des dates. number_of_intervals Entier qui spécifie le nombre d'intervalles à ajouter aux dates ou à en soustraire. interval Intervalle selon lequel décaler les dates. La valeur de l'intervalle peut être l'une des suivantes : year, quarter, month. SamePeriodLastYear Retourne une table qui contient une colonne de dates décalées d'une année en arrière par rapport aux dates de la colonne dates spécifiée, dans le contexte actuel. SAMEPERIODLASTYEAR(<dates>)

Créer une mesure calculée dans le tableau croisé (à partir de mesures créées sur la fenêtre Powerpivot)

Insérer un segment (slicer) Excel 2010

Insérer un segment (slicer) Excel 2013

Création d’un graphique
On peut créer autant de graphiques (indépendants) que nécessaire

Mise en forme du graphique
Cliquer sur le graphique et faire glisser les champs sur axe, catégorie et valeurs Faire de même pour le tableau croisé

KPI : Définition Un indicateur de performance clé (KPI) est basé sur une mesure spécifique et est conçu pour aider l'utilisateur final à évaluer la valeur et l'état actuels d'une métrique par rapport à une cible définie. Le KPI évalue la performance de la valeur, définie par une mesure de base, par rapport à une valeur cible, également définie par une mesure ou par une valeur absolue. Un KPI inclut : Valeur de base : Une valeur de base est définie par une mesure qui restitue une valeur. Cette valeur, par exemple, peut être une mesure créée sous la forme d'un agrégat des ventes ou une mesure créée pour définir la marge sur une période donnée. Valeur cible : Une valeur cible est définie par une mesure qui restitue une valeur, ou par une valeur absolue. Une mesure peut être utilisée comme valeur cible lorsque, par exemple, les décideurs d'une entreprise souhaitent comparer la façon dont le service commercial respecte un quota donné, où la mesure du budget représenterait la valeur cible. Seuils d'état : Un seuil d'état est défini par la plage allant du seuil le plus bas au seuil le plus élevé. Le seuil d'état s'affiche sous la forme d'un graphique pour aider les utilisateurs à déterminer facilement l'état de la valeur de base comparée à la valeur cible. Prendre une mesure quelle qu’elle soit et tu la mesure en fonction d’une mesure absolue ou d’une mesure créée (cible) et mettre des Symboles. Compare valeur à une cible (résultat d’un calcul aussi) D’abord, l’a créé sur une mesure dans la fenêtre Power Pivot (diapos) : Dans la table de faits, et 1ère colonne Ensuite, la gérer dans l’onglet power pivot : en étant sur un tableau pour rajouter (les 3)

KPI : Création (2010) Avant de créer un KPI vous devez d'abord créer une mesure de base qui retourne une valeur. Cette mesure de base doit être étendue à un KPI.

KPI : Création (2013) Fenêtre Power Pivot Onglet Excel
Avant de créer un KPI vous devez d'abord créer une mesure de base qui retourne une valeur. Cette mesure de base doit être étendue à un KPI. D’abord, l’a créé sur une mesure dans la fenêtre Power Pivot (diapos) : LE MIEUX A FAIRE Dans la table de faits, et 1ère colonne Ensuite, la gérer dans l’onglet power pivot : en étant sur un tableau pour rajouter (les 3) Fenêtre Power Pivot Sous la table de faits : Sur les mesures Onglet Excel Gérer indicateur

Liens web utiles http://www.powerpivot-info.com/
ot-with-excel-2013/ key-performance-indicators-kpis-with-powerpivot/ fr/library/ee634938(v=sql.120).aspx

Bibliographie Practical PowerPivot & Dax Formulas for Excel 2010
Microsoft PowerPivot for Excel 2010 (Marco Russo) Data Analysis Expressions in PowerPivot for Excel docx (word)

Analyse de données avec PowerPivot

Présentations similaires

Présentation au sujet: "Analyse de données avec PowerPivot"— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

Analyse de données avec PowerPivot

Présentations similaires

Présentation au sujet: "Analyse de données avec PowerPivot"— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back