La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

28/04/2003©PEPITe S.A.Page 1

Présentations similaires


Présentation au sujet: "28/04/2003©PEPITe S.A.Page 1"— Transcription de la présentation:

1 28/04/2003©PEPITe S.A.Page 1

2 28/04/2003©PEPITe S.A.Page 2 « Data Mining » En bref… Techniques informatiques dexploration automatique de données Extraction de connaissances à partir de données assistée par ordinateur Les piliers: Visualisation dinformation La statistique Lapprentissage automatique: Réseaux de neurones Arbres dinduction (décision, régression,..) Lintelligence artificielle

3 28/04/2003©PEPITe S.A.Page 3 Collecte des données Spécification du problème TransformationTransformation ExplorationExploration Apprentissage des modèles Exploitation des nouvelles connaissances ValidationValidation

4 28/04/2003©PEPITe S.A.Page 4 CRISP-DM

5 28/04/2003©PEPITe S.A.Page 5 Statistique Synthétiser linformation (moyenne, écart-type, etc.) Sélection MANUELLE des modèles Tests dhypothèses pour valider les choix des modèles Mieux adapté pour des petites bases de données Méthodes plus complexes demandant une grande expertise pour une utilisation efficace

6 28/04/2003©PEPITe S.A.Page 6 Visualisation

7 28/04/2003©PEPITe S.A.Page 7 Apprentissage Automatique Extraction de la Connaissance Construction de modèles à partir dobservations (ou de simulations) dun système Dans le but de: Expliquer le comportement du système Prédire le comportement du système Pas dhypothèses sur les modèles de départ MAIS, nécessité dun minimum dobservations

8 28/04/2003©PEPITe S.A.Page 8 IA : Systèmes Experts Modélisation de la Connaissance La machine imite le comportement de lêtre humain Capacité dapprendre et de raisonner Capacité de proposer des solutions déduites de prédicats Introduction préable des règles (IF…THEN…) et de faits par lexpert Outils dinférence : PROLOG, CLIPS, JESS, LISP, OPENCYC,… Gestion dalarmes, jeux,…

9 28/04/2003©PEPITe S.A.Page 9 Apprentissage Automatique Supervisé Entrées X i : données du débiteur Sortie Y : solvabilité Construction du modèle Y = F(X 1,…X N ) Diviser la BD en un ensemble dapprentissage et un ensemble de test Apprendre avec EA Valider quantitativement le modèle avec ET Valider qualitativement le modèle avec expert Exploitation du modèle

10 28/04/2003©PEPITe S.A.Page 10 Supervisé Classement & Régression Sortie Y continue : régression Taux de rebuts Sortie Y discrète : classement Taux de rebuts acceptable/non acceptable

11 28/04/2003©PEPITe S.A.Page 11 Apprentissage Automatique Non-Supervisé Apprendre les relations entre variables Pas de distinction entre variables dentrées et de sorties Exemple : Retrouver des journées de productions similaires Retrouver des corrélations entre attributs (mesures similaires) Méthodes : Dendrogramme, K-MEANS

12 28/04/2003©PEPITe S.A.Page 12 Supervisé Arbres de Décision Apprentissage automatique supervisé pour le classement Construction A chaque noeud recherche de la meilleure entrée et de la bonne question Séparation du noeud en deux fils en fonction de la réponse à la question Arrêt du développement Utilisation Propagation dun nouvel objet dans larbre, le noeud terminal indique la classe de lobjet

13 28/04/2003©PEPITe S.A.Page 13 Arbre de Décision Construction T° > 54°C YNY N

14 28/04/2003©PEPITe S.A.Page 14 Atouts des Arbres Interprétable : Lecture facile des règles Plus facile pour la validation qualitative Sélection des paramètres relevants Construction très rapide Différentes variantes : Arbres de régression (sortie continue) Arbres flous (sortie continue et discrète) Ensemble darbres

15 28/04/2003©PEPITe S.A.Page 15 Problématique des Données Qualité: erreurs dencodage bruits valeurs manquantes Quantité: taille minimum requise de la BD imprévisible (dépend de la complexité du problème)

16 28/04/2003©PEPITe S.A.Page 16 Types de Données Images Sons Données symboliques (grand, petit, chaud, froid,…) Données numériques Données temporelles

17 28/04/2003©PEPITe S.A.Page 17 Méthodes Régression multivariée Arbres (régression, classif., flous,…) Réseaux de neurones Réseaux baysiens Analyse Composantes Principales (ACP – PCA) Machines à support vectoriel …

18 28/04/2003©PEPITe S.A.Page 18 La Meilleure Méthode ? Toutes et aucune Dépend du type de problème Dépend des besoins Précision : réseau de neurones Interprétabilité : arbres de décison Nécessité de disposer dune boîte à outils robuste, flexible et adaptable

19 28/04/2003©PEPITe S.A.Page 19 Manufacturing Industry ERP: planning, scheduling, supply and logistics MES: plant-wide optimization &management Automation, advanced process control, abnormality management Automation, advanced process control, abnormality management Basic control, rectification, statistical analysis Measurement and sensing, on-line monitoring

20 28/04/2003©PEPITe S.A.Page 20 PROCESS DATA EXPERT KNOWLEDGE

21 28/04/2003©PEPITe S.A.Page 21 Applications en Économie eCRM analytique : analyse du comportement des clients, des interactions & optimisation de métriques de satisfaction Détection de fraude Stratégies de trading Optimisation de portfolio Bâle II : mesure et analyse du risque dans le gestion des fonds propres des banques

22 28/04/2003©PEPITe S.A.Page 22 Links2go

23 28/04/2003©PEPITe S.A.Page 23 Slides et logiciel disponibles sur Login : EAA / Mot de passe AA_1000


Télécharger ppt "28/04/2003©PEPITe S.A.Page 1"

Présentations similaires


Annonces Google