La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté

Présentations similaires


Présentation au sujet: "Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté"— Transcription de la présentation:

1 Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté par : Encadré par : OUAZZANI TOUHAMI Raouya Mr. HACHMOUD LAMRABET Betissam Année universitaire: 2007/2008

2 Plan I- Quest ce que le DW ? II- Concept du DW III- Mise en œuvre dun DW IV- Les aspects techniques V- Exploitation des entrepôts de données I- Quest ce que le Data Mining? II- Quel sont les techniques principales du Data Mining ? III- Domaines d'application du DATA MINING IV- Le Data Mining dans l'architecture du Data WAREHOUSE V- Les différents modules du Data Mining Introduction Conclusion Partie 1 : Data WAREHOUSE Partie 2 : Data MINING

3 On qualifie d'informatique décisionnelle (en anglais « Business intelligence », parfois appelé tout simplement « le décisionnel ») l'exploitation des données de l'entreprise dans le but de faciliter la prise de décision par les décideurs, c'est-à-dire la compréhension du fonctionnement actuel et l'anticipation des actions pour un pilotage éclairé de l'entreprise. Les outils décisionnels comme le Data Warehouse et le Data Mining sont basés sur l'exploitation d'un système d'information décisionnel alimenté grâce à l'extraction de données diverses à partir des données de production, d'informations concernant l'entreprise ou son entourage et de données économiques. Introduction

4 1- Définition Data Warehouse Ensemble de données historisées variant dans le temps, organisé par sujets, consolidé dans une base de données unique, géré dans un environnement de stockage particulier, aidant à la prise de décision dans lentreprise. Partie 1 : Data WAREHOUSE I- Quest ce que le DW ?

5 2 -Le schéma général d'un DATA WAREHOUSE

6 3- Objectifs intégrer différentes bases de données opérationnelles; intégrer différentes bases de données opérationnelles; donner l accès aux informations du passé; fournir des outils d analyse sur ces données; fournir des outils d analyse sur ces données; résumer les données; résumer les données; réconcilier des données inconsistantes. réconcilier des données inconsistantes.

7 4- La structure du DATA WAREHOUS Les données agrégées Les méta- données Les données historisées Les données détaillées DATA WAREHOUSE

8 Données détaillées Données détaillées - Données se représentant aux événement les plus récent; - données issues des systèmes de production qui se réalisent à ce niveau de classe. Données agrégées Données agrégées - données issues danalyse et de synthétisation au préalable des informations provenant des applications décisionnelles; - Elles représentent les informations ciblant directement les besoins des utilisateurs; - Elles sont sous une forme facilement accessible par lutilisateur et sémantiquement cohérente pour la bonne compréhension des utilisateurs.

9 Méta données Méta données - elles permettent de connaître le contenu du DW ; - ainsi de faciliter la recherche de données; - elles contiennent les informations sur lensemble du DW; Données historisées Données historisées - propres, validées et proprement agrégées. - en harmonie avec la stratégie de lentreprise. - elles ne sont ni écrasées, ni modifiées, ni supprimées.

10 II- Concept du DATAWARHOUSE Orientée sujet Orientée sujet Données intégrées Données intégrées Données non volatiles Données non volatiles DATA WAREHOUSE

11 III- Mise en œuvre dun DATA WAREHOUSE Un DATA WAREHOUSE fait partie du domaine stratégique de lentreprise, doù limplication nécessaire de la direction. 1- Bien connaître le métier des utilisateurs 2- Assurer une conduite de projet adapté 3- Critère de réussite

12 1- Bien connaître le métier des utilisateurs Les utilisateurs doivent sapproprier le projet pour que celui-ci puisse répondre pleinement à leurs attentes, et pour cela il faut : - les informer très tôt, leur présenter le projet, la démarche et leur implication dans celui-ci. - Les informer de létat davancement. - Leur présenter une version de pré production afin quils puissent se faire une idée de la « solution finale ».

13 2- Assurer une conduite de projet adapté La spécification, puis la qualification des besoins que lon chiffre pour donner naissance à une réalisation faisant lobjet dune recette finale. Cette démarche est inapplicable dans le cas des DWH, car les utilisateurs sont incapables dexprimer lintégralité de leur besoin en une seule fois, parce quils nimaginent pas les possibilités offerte par ce type doutil. Il faut donc construire son DWH par itérations successives

14 3- Critère de réussite Pour que la mise en place et la pérennité dun DWH se fasse, il faut: - une implication forte des utilisateurs; - un soutien convaincu de la direction générale; - un domaine dactivité et des objectifs clairs; - un effectif compétent; - un prototypage par itérations rapprochées; - un chef de projet expérimenté.

15 IV- Les aspects techniques 1-Les bases de données OLAP (On-Line Analitical Processing) - Cest un mode de stockage prévu pour lanalyse statistique des données contenues dans la base; - Il est appliqué à un modèle virtuel de représentation de donnée appelé cube ou hypercube OLAP. OLTP (On-Line Transactional Processing) - Cest un mode de stockage fait pour les systèmes opérationnels; - Ils supportent très bien une utilisation transactionnelle de la base de données; - À ce mode de stockage est associé des requêtes type sont courtes et ne demandant pas beaucoup de ressource du côté du serveur de la base de données.

16 Les tables de dimensions: - Elles contiennent les données qui permettent de définir un axe dune étude. - Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE Les tables de faits: - Comme leur nom lindique, Ces tables contiennent uniquement les données factuelles du DATA WAREHOUSE. Les tables d'agrégats: - Ces tables sont spéciales, elles permettent de simplifier le travail de restitution des logiciels danalyse; - Elles contiennent des données à un niveau de granularité plus grand que dans les tables de faits; 2- Modélisation

17 3.Les types de modéle Modèle en étoile Modèle en flocon

18 V- Exploitation des entrepôts de données 1)Outils dalimentation « ETL » 2) Outils de restitution et danalyse

19 1)Outils dalimentation « ETL » Les ETL (Extract, Transform, load) sont des outils qui ont pour but de transformer les données primaires en informations stockées dans le DATA WAREHOUSE. Pour cela il est nécessaire de réaliser les fonctions suivantes : - Recherche et identification des données; - Contrôle de qualité (épuration et validation); - Extraction; - Transformation; - Chargement.

20 Figure : Le système d'alimentation

21 2- Outils de restitution et danalyse Source : Business & Decision

22 Il sagit des outils qui se branchent sur le DATA WAREHOUSE. Il existe des logiciels de datamining qui permettent de trouver des corrélations entre les données, des tableurs et des requêteurs; Ces derniers créent la requête en fonction des paramètres que vous leur donnez.

23 - les grands acteurs du décisionnel:

24 I Quest ce que le Data Mining? 1- Définition Data Mining Le Data Mining, ou feuille de données, est l'ensemble des méthodes et techniques destinées à l'exploration et l'analyse de bases de données informatiques, afin d'en tirer des connaissances,des règles, des associations, des structures particulières restituant l'essentiel de l'information utile en réduisant la quantité de données. Entrepôt des données DATA MINING Connaissances (décision) Compréhension Prédiction Découverte de modèles Partie 2 : le Data Mining

25 2- Le Data Mining est un processus Formaliser un problème que l'organisation cherche à résoudre en terme de données Accéder aux données qu'elles en soient Préparer les données en vue des traitements et utilisations futurs Modéliser les données en leur appliquant des algorithmes d'analyse Évaluer et valider les connaissances ainsi extraites des analyses Déployer les analyses dans l'entreprise pour une utilisation effective

26 Les outils de data miningTechnique utilisée KnowledgeseekerArbres de décision Forecast ProPrévision Intelligent MinerPrévision AliceArbres de décision SaxonRéseaux neuronaux SAS SystemStatistiques, arbres de décision, réseaux neuronaux Mine SetArbres de décision, découverte de règles STATlabStatistiques SPSSRéseaux neuronaux Arbres de décision 3- Les outil de Data Mining

27 4- Les principales qualités d'un outil de Data Mining doivent offrir des richesses analytiques d'un niveau équivalent aux outils statistiques traditionnels. doivent offrir une ergonomie, une convivialité, une facilité de mise en oeuvre et d'interprétation les rendant accessibles à des utilisateurs non statisticiens. Les résultats fournis par l'outil doivent être clairs et compréhensibles il ne doivent pas contenir trop de termes techniques statistiques Ils ne doivent pas être dédiés à un domaine particulier et doivent pouvoir résoudre différents problèmes provenant de contextes différents.

28 les techniques du Data Mining Fractales Découverte des règles Arbres de décision Signal Processing Réseaux neuronaux II- Quel sont les techniques du Data Mining ?

29 Signal Processing Cette technique consiste à positionner les données et les filtrer à travers une hypothèse pour essayer de faire apparaître un lien entre ces données. Découverte de règles Cette technique consiste à demander au système daller chercher dans les données une validation dune règle connue ou de découvrir lui-même une règle. Arbres de décision Cette technique consiste à formaliser un arbre qui va procéder à une analyse critère par critère.

30 Fractales Cette technique consiste à Composer des segmentations à partir de modèles mathématiques basés sur des regroupements irréguliers de données. Réseaux neuronaux Cette technique consiste à lutilisation des technologies dintelligence artificielle afin de découvrir par lapprentissage du moteur des liens non procéduraux.

31 III Domaines d'application du DATA MINING Domaines d'application du DATA MINING Secteurbancaire La grande distribution Gestion du risque du risque Secteur médical Gestion de la relation client Marketingstratégique Assurance de biens et de personnes Vente par Correspondance(VPC)

32 Data Warehouse Bases de production Bases externes Outils dalimentation Data Marts IV- Le Data Mining dans l'architecture du Data WareHouse Meta données (Dictionnaire ) Utilisateurs SIAD Utilisateurs EIS Utilisateurs requêteurs OLAP Data Mining

33 V- Les différents modules du Data Mining Le Data Mining utilise la technique de la modélisation pour faire des découvertes ou des prévisions. loutil Data Mining est en mesure de proposer une technique différente correspondant à des algorithmes et une méthode dapproche des données adéquates a fin de répondre à des problématiques concernant :

34 La segmentation permet de fragmenter la base de données en segments ayant des caractéristiques similaires et des comportements homogènes. 2- Classification Il se propose de caractériser des groupes de populations homogènes en rapprochant des paramètres possédés par chacun des membres. Ainsi, la classification permet de développer des profils de groupe à partir des critères des enregistrements. 1- Segmentation 1- Segmentation

35 La prévision permet de mesurer linfluence d'un paramètre présent dans une population sur lensemble des autres paramètres de cette population. 4- Association Lassociation permet danalyser la présence simultanée de valeur de paramètres sur un même critère ou sur deux paramètres différents. 5-Modèle Séquentiel Le modèle séquentiel induit des découvertes liées à laxe temporel. Il permet de trouver des modèles de comportement qui présupposent des enchaînements systématiques qui suivront sur une période de temps. 3-Prévision 3-Prévision

36 Conclusion Lutilisation des DATAWAREHOUSE est aujourdhui très demandé dans le monde de lentreprise, demande qui répond au besoin toujours plus présent des utilisateurs davoir les bonnes informations au bon moment. Ainsi que le Data Mining participant dès lors à une meilleur compréhension de l'activité des entreprises, et à une rationalisation avancée du stockage de l'information. Autrement dit, le Data Mining ne consiste pas en une succession d'études ad hoc mais doit bien permettre à l'organisation de capitaliser sur les connaissances acquises. C'est sa raison d'être.

37 Webographie Introdution au DataWareHouse.htm lauteur Nicolas GUILLOT

38


Télécharger ppt "Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Présenté"

Présentations similaires


Annonces Google