Business Intelligence BI = est l’exploitation des données d’entreprise afin de faciliter la prise de décision par les décideurs Exposé Système-Réseaux IR3 Deltil Emilie Pereira Gérald 13/11/2018
Exposé Système-Réseaux DELTIL/PEREIRA Sommaire Présentation Notions Entrepôt de données Analyse multidimensionnelle Les 4 étapes du processus Cibles des logiciels de la BI Exemple de logiciel Démonstration 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Présentation Le besoin Application classique stocke, restitue, modifie des données métier Différentes applications pour tous les services d’une entreprise Codifications des mêmes données de façon différentes Calcul d’indicateurs calculés différemment selon les services 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Présentation La solution BI Obtenir une vision synthétique d’un service ou de l’ensemble de l’entreprise Centraliser les données dans un entrepôt de données Aider à la décision via une exploitation efficace des données prendre connaissance des données à un niveau global et ainsi prendre des décisions plus pertinentes, d’où le nom d’informatique décisionnelle ces données soient filtrées, croisées et reclassées dans un entrepôt de données central compréhension du fonctionnement actuel de l’entreprise jusqu'à l’anticipation des actions a venir Transition : La BI désigne donc les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données d'une entreprise en vue d'offrir une aide à la décision. 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Notions Fonctionnement 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Notions Entrepôt de données Datawarehouse Globalisation des données de l’entreprise Centralisation d’applications diverses Datamarts Alimentés depuis le datawarehouse Sous-ensemble concernant les métiers de l’entreprise Spécifique suivant une fonction Alimentation des bases de données multidimensionnelles Transition : Après avoir expliquer les notions indispensables nous allons maintenant voir les étapes du processus décisionnel qui les utilise. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant : les données de l'informatique de production (également appelée « informatique transactionnelle »), notamment les progiciels de gestion intégrés (ou ERP, Enterprise Resource Planning) ne se prêtent pas à une exploitation dans un cadre d'analyse décisionnelle. Les systèmes de production sont en effet construits dans le but de traiter des opérations individuelles qui peuvent impliquer différents métiers de l'entreprise et surtout, ne se préoccupent pas de leur compilation ou historisation dans le temps. À l'inverse, les systèmes décisionnels doivent permettre l'analyse par métiers ou par sujets et le suivi dans le temps d'indicateurs calculés ou agrégés. Il est donc souvent indispensable de séparer ces deux mondes et de repenser les schémas de données, ce qui implique l'unification des différents gisements de données de l'entreprise en un entrepôt de données global (datawarehouse) ou dédié à un sujet/métiers (datamart). datamarts (généralement alimentés depuis les données du datawarehouse) sont des sous-ensembles d’informations concernant un métier particulier de l’entreprise (marketing, risque, contrôle de gestion, ... Les datamart et/ou les datawarehouses peuvent aussi alimenter des bases de données multidimensionnelles, qui permettent l’analyse très approfondie de l’activité de l’entreprise, grâce à des statistiques recoupant des informations relatives à des activités apparemment très différentes ou très éloignées les unes des autres, mais dont l’étude fait souvent apparaître des dysfonctionnements, des corrélations ou des possibilités d’améliorations très sensibles. Multidimensionnelle : ex : Le chiffre d'affaires par catégorie de client sur un produit donné se décline en trois axes au minimum : chiffre d'affaires, catégorie de clients, et produit. De nombreux autres axes peuvent être définis, notamment en fonction de la zone géographique, du prix, ou d'un commercial de l'équipe en charge des opérations. 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Les 4 étapes du processus La collecte Aller à la recherche des données dans des bases de données 2 formes de sources : Constat au fil du temps des opérations Image à l’instant t de l’entreprise Les charger dans l’entrepôt de données via un ETL Collecte : Recherches données d’application diverses dans des sources de données diverses et variées de format différents Deux optiques dans la recherche de données historique intemporel Utilisation d’un ETL ETL = « extract transform and load » ou en français ETC (Extraction-Tranformation-Chargement) Transistion : Donc un outil d’ETL ça permet … 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Les 4 étapes du processus La collecte Fonctionnement d’un ETL Synchronisations massives depuis des bases de données vers une autre Basé sur Des connecteurs Des transformateurs Chargement régulier de données Via des batch ETL : Synchronisation de données de tous types dans notre Datawarehouse et nos Datamarts Le principe Connecteurs -> permettant l’extraction ou l’importation des données de types divers Transformateurs -> manipulent les données : agrégations, filtres, conversions, mises en correspondance. Utilisation de batch par exemple ETL tous les soirs a minuit Transition : L’outil d’ETL permet aussi l’intégration des données dans le datawarehouse. 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Les 4 étapes du processus L’intégration Structuration de données utiles à la décision Unifié l’espace de données Données épurées et transformées par : Un filtrage et une validation des données Une synchronisation Une certification Intégration : Toujours avec l’ETL Structuration des données Création de datawarehouse/datamart -> dont les données sont facilement exploitables -> pour la prise de décision Unifié l’espace de données Par exemple -> modifier des valeurs ayant même sens mais codées différemment pour les rendre compatible -> modifier des formats de chiffres ou dates -> ajouter des indicateurs pas présents et calculables Données épurées -> filtrage et une validation => maintien de la cohérence d'ensemble (d'introduire des incohérences de référentiel rejetées piintégrées avec un statut spécial) -> synchronisation (intégrer en même temps ou à la même « date de valeur » des événements reçus ou constatés de manière décalée ou déphasée) -> certification (pour rapprocher des autres systèmes « légaux » de l'entreprise comme la comptabilité ou les déclarations réglementaires). Transition : Ces données centralisées peuvent ensuite être retournées aux décideurs … 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Les 4 étapes du processus La diffusion Mettre à disposition les données selon les utilisateurs Segmenter les données Définir les contextes multidimensionnels de diffusion pour chaque datamart Définition des agrégats de façon persistante ou dynamique Diffusion : par exemple utilisation d un serveur d application Gestion des profils utilisateurs profil ou au métier de chacun segmenter les données en contextes informationnels cohérents simples à utiliser correspondant à une activité décisionnelle particulière datamarts donc BD multidimentionnelles différents contextes pas besoin du même niveau de détail agrégats ou cumuls spécifiques Agrégats calculés ou sauvegardés en BD selon la cible (voir slides suivants) 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Les 4 étapes du processus La restitution Présenter les informations de la façon la plus lisible possible pour le décideur Modéliser des représentations pour faire du reporting Permet aussi La sélection de critères de filtre De trier, répartir ou regrouper les données De présenter les calculs Restitution : Présenter les info de la façon la plus lisible possible pour le décideur Création de rapports ou tableaux de bords Pour cela on modélise des représentations à base de requêtes, on parle ainsi de reporting. Possibilités en plus sur ces rapports Selections multiples Tris, regroupements Calculs Diagrammes Transition : Selon les quatre grandes étapes qui viennent d'être déclinées (extraction, consolidation, traitement, restition) entre en jeu une première segmentation des acteurs. 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Cibles des logiciels de BI 2 approches Concentré pour quelques décideurs Analyse poussée Affinage de la requête Applications analytiques Périmètre large d’utilisateurs Reporting de masse Requêtes pré-paramétrées Pas d’affinage Concentré pour quelques décideurs : BO Périmètre large d’utilisateurs : BRIO Approches de l’informatique décisionnelle Fournir une aide pour … l'analyse poussée d'un grand nombre de données pour diffuser les résultats à la demande vers un petit nombre d'utilisateurs, les décideurs + créations de le propres requêtes via des applications analytiques reporting vers un grand nombre d'utilisateurs notion de portail d entreprise 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Exemple de logiciel Pentaho Open source Java Porte sur toute la chaîne décisionnelle Reporting de masse et aide à la décision 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Exemple de logiciel Pentaho Différents outils et composants Collecte et intégration : outil d’ETL Kettle ou Mondarian Diffusion : serveur d’application JBoss ou TOMCAT Restitution : JFreeReport BIRT JasperReport Transition : Gérald va maintenant nous expliquer la démonstration mise en place avec Pentaho 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Démonstration Outils Kettle Outil d’ETL intégré dans la solution Pentaho Bases de données MySQL et Postgres Pentaho design studio et Pentaho report design wizard Création simplifiée de rapports JFreeReport Pentaho demo Installation préconfigurée de Pentaho sur un serveur JBoss 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Démonstration Principe L’entreprise groupes Dawa et Azimut Les applications celles de génie logiciel Le but appliquer l’informatique décisionnelle à ce référentiel 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA Démonstration 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA
Exposé Système-Réseaux DELTIL/PEREIRA MERCI 13/11/2018 Exposé Système-Réseaux DELTIL/PEREIRA