Université Mohammed Ben Abdellah École Supérieure d Technologie Fès

Slides:



Advertisements
Présentations similaires
Définition de la compétence et du rôle de la formation
Advertisements

Linnovation sociale à travers une démarche collective paritaire dentreprises.
De lanalyse des données … … au Datamining Aide à la prise de décision.
Introduction Pour concrétiser l’enseignement assisté par ordinateur
INTRODUCTION Grande quantité de données
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Exemple : Itinéraire de lecture.
Vue d’ensemble du Data warehousing et de la technologie OLAP
Les axes directeurs de la rénovation de la filière ROC-SM Les besoins de la profession Les contraintes de linstitution.
CH18 LES SYSTEMES DECISIONNELS
Les Ateliers de Génie Logiciel
Le Workflow et ses outils
Organisation du système d’information comptable et de gestion
Initiation au système d’information et aux bases de données
MRP, MRP II, ERP : Finalités et particularités de chacun.
Control des objectifs des technologies de l’information COBIT
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Le BTS est un diplôme à finalité dinsertion professionnelle. La poursuite des études est envisageable principalement par la voie des licences professionnelles.
SECURITE DU SYSTEME D’INFORMATION (SSI)
LA SEGMENTATION STRATÉGIQUE
Si vous n’êtes pas sûr de l’endroit où vous voulez aller, vous risquez de vous retrouver ailleurs… et de ne pas le savoir ! (R.F. Mager) Master ISIF.
Marketing Engineering
Initiation à la conception de systèmes d'information
Réalisée par :Samira RAHALI
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
L ’approche par processus
L’ETUDE DE MARCHE Par M.NAFII CNAM.
Management stratégique et management opérationnel
Le Travail Collaboratif ...
Modèle Logique de Données
DataLab® Toute la connaissance client en quelques minutes
Gouvernance du Système d’Information
Etude globale de système.
Universté de la Manouba
RECHERCHE COMMERCIALE
Le forage de données ou data mining
SEMINAIRE DE CONTACT novembre 2008 Outils de gestion de projet.
Sensibilisation a la modelisation
Patrons de conceptions de créations
ANALYSE METHODE & OUTILS
Les Systèmes d’information INTRODUCTION
GESTION DE PROJET
Le système informatique et le système d’information
Réalisé par: BOUMSISS Hassnae OUED Zahra TABIT Youssef EZZIANI Hamza
Initiation à la conception des systèmes d'informations
LE DATA WAREHOUSE.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Management de la qualité
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
L’APPROCHE PAR LA COMPÉTENCE DU PROGRAMME D’ÉCONOMIE GESTION
LES SUPPORTS INDIVIDUELS D ’AIDE A LA DECISION UNE PRESENTATION DE : DIALLO, OUSMANE B UNE PRESENTATION DE : DIALLO, OUSMANE B.
Modélisation des flux Introduction et définition
L’enseignement de spécialité SLAM
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
Le marketing : comprendre le client
Le marketing : comprendre le client
M1 Miage Jour UE Veille Technologique
Video.
Vers l’exploitation de grandes masses de données Encadré par : Mme L.Lamarini Présenté par: Rhaz Yassine Smiri Safae Un article de: Raphaeil Féraud,Maroc.
INTRODUCTION AUX BASES DE DONNEES
Introduction Module 1.
Cours 11 Entrepôts de données
Réalisé par : Ibrahimi salma Elharnouny chaimae.
Projet de session Par Eve Grenier Dans le cadre du cours SCG Réalisation d’applications en SIG Jeudi le 20 avril 2006.
PROJET DE SESSION DANS LE CADRE DU COURS: SCG Réalisation d’applications en SIG PRÉSENTÉ PAR: Marie-Andrée Levesque 18 AVRIL 2006.
Le contrôle de gestion dans le secteur public
Risque et opportunité Elodie QUEIREL : EDF - UFPI
L’intelligence économique et le knowledge management
Transcription de la présentation:

Université Mohammed Ben Abdellah École Supérieure d Technologie Fès Licence Professionnelle: Management International Et NTIC Exposé sous thème: Data Warehouse et Data Mining Présenté par : Encadré par : OUAZZANI TOUHAMI Raouya Mr. HACHMOUD LAMRABET Betissam Année universitaire: 2007/2008

Partie 1 : Data WAREHOUSE Plan Introduction Partie 1 : Data WAREHOUSE I- Qu’est ce que le DW ? II- Concept du DW III- Mise en œuvre d’un DW IV- Les aspects techniques V- Exploitation des entrepôts de données I- Qu’est ce que le Data Mining? II- Quel sont les techniques principales du Data Mining ? III- Domaines d'application du DATA MINING IV- Le Data Mining dans l'architecture du Data WAREHOUSE V- Les différents modules du Data Mining Partie 2 : Data MINING Conclusion

Introduction On qualifie d'informatique décisionnelle (en anglais « Business intelligence », parfois appelé tout simplement « le décisionnel ») l'exploitation des données de l'entreprise dans le but de faciliter la prise de décision par les décideurs, c'est-à-dire la compréhension du fonctionnement actuel et l'anticipation des actions pour un pilotage éclairé de l'entreprise. Les outils décisionnels comme le Data Warehouse et le Data Mining sont basés sur l'exploitation d'un système d'information décisionnel alimenté grâce à l'extraction de données diverses à partir des données de production, d'informations concernant l'entreprise ou son entourage et de données économiques.

Partie 1 : Data WAREHOUSE 1- Définition Data Warehouse I- Qu’est ce que le DW ? 1- Définition Data Warehouse Ensemble de données historisées variant dans le temps, organisé par sujets, consolidé dans une base de données unique, géré dans un environnement de stockage particulier, aidant à la prise de décision dans l’entreprise.

2 -Le schéma général d'un DATA WAREHOUSE

3- Objectifs donner l ’accès aux informations du passé; intégrer différentes bases de données opérationnelles; donner l ’accès aux informations du passé; fournir des outils d ’analyse sur ces données; résumer les données; réconcilier des données inconsistantes.

4- La structure du DATA WAREHOUS Les données agrégées Les méta- données DATA WAREHOUSE Les données détaillées Les données historisées

Données détaillées - Données se représentant aux événement les plus récent; - données issues des systèmes de production qui se réalisent à ce niveau de classe. Données agrégées - données issues d’analyse et de synthétisation au préalable des informations provenant des applications décisionnelles; - Elles représentent les informations ciblant directement les besoins des utilisateurs; - Elles sont sous une forme facilement accessible par l’utilisateur et sémantiquement cohérente pour la bonne compréhension des utilisateurs.

Méta données - elles permettent de connaître le contenu du DW ; - ainsi de faciliter la recherche de données; - elles contiennent les informations sur l’ensemble du DW; Données historisées - propres, validées et proprement agrégées. - en harmonie avec la stratégie de l’entreprise. - elles ne sont ni écrasées, ni modifiées, ni supprimées.

II- Concept du DATAWARHOUSE Orientée sujet Données intégrées DATA WAREHOUSE Données non volatiles

III- Mise en œuvre d’un DATA WAREHOUSE Un DATA WAREHOUSE fait partie du domaine stratégique de l’entreprise, d’où l’implication nécessaire de la direction. 1- Bien connaître le métier des utilisateurs 2- Assurer une conduite de projet adapté 3- Critère de réussite

1- Bien connaître le métier des utilisateurs Les utilisateurs doivent s’approprier le projet pour que celui-ci puisse répondre pleinement à leurs attentes, et pour cela il faut : - les informer très tôt, leur présenter le projet, la démarche et leur implication dans celui-ci. - Les informer de l’état d’avancement. - Leur présenter une version de pré production afin qu’ils puissent se faire une idée de la « solution finale ».

2- Assurer une conduite de projet adapté La spécification, puis la qualification des besoins que l’on chiffre pour donner naissance à une réalisation faisant l’objet d’une recette finale. Cette démarche est inapplicable dans le cas des DWH, car les utilisateurs sont incapables d’exprimer l’intégralité de leur besoin en une seule fois, parce qu’ils n’imaginent pas les possibilités offerte par ce type d’outil. Il faut donc construire son DWH par itérations successives

3- Critère de réussite Pour que la mise en place et la pérennité d’un DWH se fasse, il faut: - une implication forte des utilisateurs; - un soutien convaincu de la direction générale; - un domaine d’activité et des objectifs clairs; - un effectif compétent; - un prototypage par itérations rapprochées; - un chef de projet expérimenté.

IV- Les aspects techniques 1-Les bases de données OLAP (On-Line Analitical Processing) - C’est un mode de stockage prévu pour l’analyse statistique des données contenues dans la base; - Il est appliqué à un modèle virtuel de représentation de donnée appelé cube ou hypercube OLAP. OLTP (On-Line Transactional Processing) - C’est un mode de stockage fait pour les systèmes opérationnels; - Ils supportent très bien une utilisation transactionnelle de la base de données; - À ce mode de stockage est associé des requêtes type sont courtes et ne demandant pas beaucoup de ressource du côté du serveur de la base de données.

2- Modélisation Les tables de dimensions: - Elles contiennent les données qui permettent de définir un axe d’une étude. - Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE Les tables de faits: - Comme leur nom l’indique, Ces tables contiennent uniquement les données factuelles du DATA WAREHOUSE. Les tables d'agrégats: - Ces tables sont spéciales, elles permettent de simplifier le travail de restitution des logiciels d’analyse; - Elles contiennent des données à un niveau de granularité plus grand que dans les tables de faits;

3.Les types de modéle Modèle en étoile Modèle en flocon

2) Outils de restitution et d’analyse Outils d’alimentation V- Exploitation des entrepôts de données 2) Outils de restitution et d’analyse Outils d’alimentation « ETL »

Outils d’alimentation « ETL » Les ETL (Extract, Transform, load) sont des outils qui ont pour but de transformer les données primaires en informations stockées dans le DATA WAREHOUSE. Pour cela il est nécessaire de réaliser les fonctions suivantes : - Recherche et identification des données; - Contrôle de qualité (épuration et validation); - Extraction; - Transformation; - Chargement.

Figure : Le système d'alimentation

2- Outils de restitution et d’analyse Source : Business & Decision

Il s’agit des outils qui se branchent sur le DATA WAREHOUSE. Il existe des logiciels de datamining qui permettent de trouver des corrélations entre les données, des tableurs et des requêteurs; Ces derniers créent la requête en fonction des paramètres que vous leur donnez.

- les grands acteurs du décisionnel:

I Qu’est ce que le Data Mining? Partie 2 : le Data Mining I Qu’est ce que le Data Mining? 1- Définition Data Mining Le Data Mining, ou feuille de données, est l'ensemble des méthodes et techniques destinées à l'exploration et l'analyse de bases de données informatiques, afin d'en tirer des connaissances ,des règles, des associations, des structures particulières restituant l'essentiel de l'information utile en réduisant la quantité de données. Entrepôt des données Connaissances (décision) DATA MINING Compréhension Prédiction Découverte de modèles

2- Le Data Mining est un processus Formaliser un problème que l'organisation cherche à résoudre en terme de données Accéder aux données qu'elles en soient Préparer les données en vue des traitements et utilisations futurs Modéliser les données en leur appliquant des algorithmes d'analyse Évaluer et valider les connaissances ainsi extraites des analyses Déployer les analyses dans l'entreprise pour une utilisation effective

3- Les outil de Data Mining Les outils de data mining Technique utilisée Knowledgeseeker Arbres de décision Forecast Pro Prévision Intelligent Miner Alice Saxon Réseaux neuronaux SAS System Statistiques, arbres de décision, réseaux neuronaux Mine Set Arbres de décision, découverte de règles STATlab Statistiques SPSS

4- Les principales qualités d'un outil de Data Mining doivent offrir des richesses analytiques d'un niveau équivalent aux outils statistiques traditionnels. doivent offrir une ergonomie, une convivialité, une facilité de mise en oeuvre et d'interprétation les rendant accessibles à des utilisateurs non statisticiens. Les résultats fournis par l'outil doivent être clairs et compréhensibles il ne doivent pas contenir trop de termes techniques statistiques Ils ne doivent pas être dédiés à un domaine particulier et doivent pouvoir résoudre différents problèmes provenant de contextes différents.

II- Quel sont les techniques du Data Mining ? Découverte des règles Réseaux neuronaux les techniques du Data Mining Arbres de décision Fractales Signal Processing

Signal Processing Cette technique consiste à positionner les données et les filtrer à travers une hypothèse pour essayer de faire apparaître un lien entre ces données. Découverte de règles Cette technique consiste à demander au système d’aller chercher dans les données une validation d’une règle connue ou de découvrir lui-même une règle. Arbres de décision Cette technique consiste à formaliser un arbre qui va procéder à une analyse critère par critère.

Fractales Cette technique consiste à Composer des segmentations à partir de modèles mathématiques basés sur des regroupements irréguliers de données. Réseaux neuronaux Cette technique consiste à l’utilisation des technologies d’intelligence artificielle afin de découvrir par l’apprentissage du moteur des liens non procéduraux.

III Domaines d'application du DATA MINING Secteur bancaire Marketing stratégique Domaines d'application du DATA MINING La grande distribution Gestion de la relation client Assurance de biens et de personnes Gestion du risque Vente par Correspondance (VPC) Secteur médical

Meta données (Dictionnaire) IV- Le Data Mining dans l'architecture du Data WareHouse Bases de production Data Marts Meta données (Dictionnaire) Utilisateurs SIAD OLAP Data Warehouse OLAP Utilisateurs EIS Data Mining Data Mining Outils d’alimentation Utilisateurs requêteurs Bases externes

V- Les différents modules du Data Mining Le Data Mining utilise la technique de la modélisation pour faire des découvertes ou des prévisions. l’outil Data Mining est en mesure de proposer une technique différente correspondant à des algorithmes et une méthode d’approche des données adéquates a fin de répondre à des problématiques concernant :

1- Segmentation La segmentation permet de fragmenter la base de données en segments ayant des caractéristiques similaires et des comportements homogènes. 2- Classification Il se propose de caractériser des groupes de populations homogènes en rapprochant des paramètres possédés par chacun des membres. Ainsi, la classification permet de développer des profils de groupe à partir des critères des enregistrements.

3-Prévision 4- Association La prévision permet de mesurer l’influence d'un paramètre présent dans une population sur l’ensemble des autres paramètres de cette population. 4- Association L’association permet d’analyser la présence simultanée de valeur de paramètres sur un même critère ou sur deux paramètres différents. 5-Modèle Séquentiel Le modèle séquentiel induit des découvertes liées à l’axe temporel. Il permet de trouver des modèles de comportement qui présupposent des enchaînements systématiques qui suivront sur une période de temps.

Conclusion L’utilisation des DATAWAREHOUSE est aujourd’hui très demandé dans le monde de l’entreprise, demande qui répond au besoin toujours plus présent des utilisateurs d’avoir les bonnes informations au bon moment. Ainsi que le Data Mining participant dès lors à une meilleur compréhension de l'activité des entreprises , et à une rationalisation avancée du stockage de l'information. Autrement dit, le Data Mining ne consiste pas en une succession d'études ad hoc mais doit bien permettre à l'organisation de capitaliser sur les connaissances acquises. C'est sa raison d'être.

Webographie www.wikipédia.org www.supinfo.com Introdution au DataWareHouse.htm l’auteur Nicolas GUILLOT www.ultrafluide.com www.journaldunet.com www.lincoln.fr

Merci pour votre attention