La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Business Intelligence Présentation. Sommaire 1.Le système dinformation Décisionnel 2.Les modèles de données 3.Le Data Mining 4.Loffre BI de Microsoft.

Présentations similaires


Présentation au sujet: "Business Intelligence Présentation. Sommaire 1.Le système dinformation Décisionnel 2.Les modèles de données 3.Le Data Mining 4.Loffre BI de Microsoft."— Transcription de la présentation:

1 Business Intelligence Présentation

2 Sommaire 1.Le système dinformation Décisionnel 2.Les modèles de données 3.Le Data Mining 4.Loffre BI de Microsoft 5.Les nouveautés avec SQL Server 2012

3 La BI pour qui ? Pourquoi ?

4 La chaine décisionnelle Proactif Interactif Passif Présentation ExplorationDécouverte Outils BI Rendu Reporting de masse Reporting Adhoc OLAP Data Mining

5 Définitions – Vocabulaire Infocentre = Base de données dédiée à lanalyse dune application A lorigine des copies de base de production Staging Area : Espace de stockage temporaire des données provenant des différentes sources. Cest un lieu où lon va pouvoir stocker des données qui arrivent à des moments différents. Cest une zone dattente, une salle dembarquement. ODS (Operating Data Store) – Lieu où vont être effectuées les transformations, les croisements, etc. Cest létape juste avant lalimentation du Datawarehouse et il utilise, comme source la Staging Area. – Le modèle de données de l'ODS est un modèle relationnel classique assez proche des modèles de production – Ce « sas » assure l'isolation des mondes "opérationnel" et "décisionnel" (performances, exploitabilité...) Datawarehouse = Entrepôt de données, destiné à centraliser, nettoyer, et uniformiser les données de lentreprise à des fins de reporting et danalyse. Il stocke lhistorique des données avec la granularité la plus fine, Data Mart : Entrepôt de données dédié à un métier particulier. Il est situé en aval du Datawarehouse

6 Architecture cible Source OLTP Infocentre (Miroir OLTP) Staging Area ODS DataWarehouse Data Mart1 OLAP Cubes Outils Clients (Excel, Proclarity…) Reporting Custom Data Mining Data Mart2 Modélisation Stockage Multidimensionnel Restitution

7 Typologie et périmètre des projets décisionnels Un SID (système dinformation décisionnel), cest : « un système permettant aux utilisateurs de lentreprise de disposer dinformations pertinentes et doutils danalyse puissants pour les aider à prendre les bonnes décisions au bon moment » (Bill Inmon) Un projet décisionnel est réussi quand lutilisateur dit : « Jai linformation, elle est sûre, je la comprends, donc je lutilise »

8 Modélisation BI KIMBALL : Tables de fait, Tables de Dimensions Stockage dénormalisé des données Inmons: S appuie sur une modélisation en BD relationnelle complexe Les données sont stockées dans la 3éme Forme Normale (3NF) Lequel Choisir? Traditionnellement la modélisation Kimbal est utilisée Kimball permet un Feedback rapide / demandes métier

9 La pierre angulaire dun système décisionnel Le modèle de donnée OLTP (Online Transaction Processing ) Reporting opérationnel OLAP (Online Analytical Processing ) Pilotage métier et entreprise

10 OLTP VS OLAP Time-critical In-place data update Current data (Snapshot) Functional transaction focus Store details only Only keeps company internal data Small delays tolerable Append only Historical and current data Reporting (information delivery) focus Store summary + details (e.g. counts and aggregates) Warehouse also keeps external data (e.g. customer demographics) OLTPOLAP

11 Les modèle de données ROLAP Schéma en étoile Schéma en flocon Economie de jointures à l'interrogation Perte en espace de stockage Gain en espace de stockage Performance dinterrogations affectées

12 Les technologies Multidimensionnelles

13 Le Data Mining QU'EST-CE QUE LE DATA MINING ? Cest l'exploration et l'analyse de grandes quantités de données afin de découvrir des formes et des règles significatives en utilisant des moyens automatiques ou semi-automatiques. Basé sur des méthodes mathématiques +/- complexes : Méthodes de tri : Les algorithmes de Data Mining Technique: Statistique Résultat: Prédiction, estimation, classification Crédit Accordé (Oui/Non) StatutAgeSexe

14 Les Algorithmes de Data Mining - Naive Bayes -Arbre de décision -Réseaux de neurones -Réseaux Bayesiens -Régression logistique Classification - Arbre de décision -Régression linéaire -Réseaux de neurones -Régression logistique Estimation -Clustering Cluster - Time Series Forecast -Règles dAssociation -Arbre de décision Association Analyse supervisée (Y=fct(x1,x2…xn))Analyse Non-supervisée (pas de sortie à classer) Sans le savoir, vous utilisez le Data Mining tous les jours! Eg: Mozilla Thunderbird et Microsoft Outlook utilisent le classifier Naive Bayes pour filtrer les spam de vos mails.

15 Exemple de Data Mining: Entreprise : banque Activité : prêts hypothécaires Problème : accepter ou refuser une demande de crédit ? Solution: Analyser les données historiques : solvabilité observée lors des anciens crédits pour prévoir la solvabilité des Nouveaux demandeurs de crédit Crédits anciens (Oui/Non) Sexe=M Statut=M Age=60 … Crédit=Oui Modèle Arbre de Décision Prédire nouvelle Demande de crédit Sexe=M Statut=D Age=45 … Crédit =?

16 Quelques possibilités d'utilisation Marketing Quel profil de client cibler lors dune campagne marketing ? Quels clients sont susceptibles de réagir à une promotion déterminée ? (CRM) Quels produits offrir à quels clients ? (Eg: Amazone) Finances Quels produits financiers proposer à quels clients ? Comment détecter une faillite prochaine ? (Crise Boursière) Télécommunications Quels clients sont susceptibles de nous quitter ? Quel est le profil des clients très rentables, et des clients pas ou peu rentables ?

17 Loffre BI de Microsoft SSIS

18 Architecture fonctionnelle avec Microsoft BI Data Mining

19 SQL Server Management Studio SQL Server Management Studio est un environnement intégré qui permet d'avoir accès, de configurer, de gérer, d'administrer et de développer tous les composants de SQL Server. SQL Server Management Studio associe un groupe d'outils graphiques à des éditeurs de script T-SQL, MDX, …

20 SQL Server Integration Services Au-delà du simple transfert des données dune source vers une destination, lETL sert à : – Ordonnancer des taches – Nettoyer les données transférées – Augmenter la puissance de traitement pour faire face à laccroissement constant des volumes de données – Prendre en charge la totalité de la chaîne de traitement, cest-à-dire dêtre à même de mettre à jour les cubes OLAP construits à partir des entrepôts de données mis à jour À laide doutils de débogage, les développeurs peuvent définir des points darrêts sur les packages, les conteneurs, les événements de tâches et les observateurs de données pour surveiller les données pendant leur passage dans le ux. ExtraireTransformerCharger

21 SQL Server Reporting Services SQL Server Reporting Services est un outil de génération de rapports dentreprise. Le générateur de rapports, autorise les utilisateurs à : Créer leurs propres rapports : reporting Had-hoc avec ReportBuilder Sabonner à des rapports (Pull/Push) Exporter les rapports en différents formats

22 SQL Server Analysis Services SQL Server Analysis Services permet de concevoir, de créer et de gérer des structures multidimensionnelles qui contiennent des données agrégées provenant d'autres sources de données

23 Le Data Mining avec Xls 2010 il sagit dutiliser de manière transparente et naturelle de puissants outils statistiques. Des analyses prédictives rendues possibles directement depuis Excel 2007 grâce à ladd-in nommé « SQL Server 2008 Datamining pour Excel.»

24 Portail Collaboratif (SharePoint 2010) Les technologies SharePoint apportent : – Un portail dentreprise qui intègrent tous les composants de Microsoft Business Intelligence : rapports, analyses, tableaux de bord, Scorecards, feuilles Excel, … – La BI collaborative pour agir après lanalyse. – Des fonctionnalités clés telles que la recherche, la gestion de contenu, la collaboration, la visualisation de feuilles Excel en mode web.

25 Microsoft SQL Server 2012 : Denali High Availability EDIM Windows Server Core Support SSIS Server Security & Manageability User-Defined Server Roles Web & Breadth PHP Driver Scalability and Performance partitions/table Business Intelligence Unified Semantic Model Data Lineage Database Replay Semantic Platform CrescentCrescent Application Centric Failover Data Quality Contained Database Authentication LocalDBLocalDB Fast FileStream UTF-16UTF-16 Online Operations Fast Full Text AlertingAlerting Enhanced MDS In-memory BI for corporate Impact Analysis SQL Studio Reliable & Integrated Failover Detection Multiple Readable Secondaries Audit Enhancements Paging for result sets Column store DataWarehouse Win32 access to database files HA for StreamInsight Full Globe Spatial Support DAC Enhancements Sysprep for AS Management Pack for High Availability Backup Secondaries ODBC for Linux JDBC 4.0 driver SSMS Enhancements FileTableFileTable PowerPivot Enhancements AlwaysOnAlwaysOn Reporting as SharePoint Shared Service

26 Merci …

27 Unified Semantic Model

28 Projet Crescent : Power View

29


Télécharger ppt "Business Intelligence Présentation. Sommaire 1.Le système dinformation Décisionnel 2.Les modèles de données 3.Le Data Mining 4.Loffre BI de Microsoft."

Présentations similaires


Annonces Google