Technologies de l’intelligence d’affaires Séance 14

Slides:



Advertisements
Présentations similaires
Rotation Pythagoricienne Les valeurs a 2 + b 2 = (b+1) 2 correspondent aux triplets Pythagoricien (2k+1, 2k(k+1), 2k(k+1)+1). Ces valeurs ne couvrent toutefois.
Advertisements

Sujet : Étude de Data Mining en utilisant SAS:EM
Using the Performance – Potential Assessment.
Présentation LabPlus v3. Solution novatrice en Technologies de l’information Solution novatrice en Technologies de l’information Application pour la Gestion.
Méthodes d’utilisabilité pour les nuls Alain Désilets National Research Council of Canada.
10/10/ Finite Difference Method Major: All Engineering Majors Authors: Autar Kaw, Charlie Barker
An Introduction To Two – Port Networks The University of Tennessee Electrical and Computer Engineering Knoxville, TN wlg.
IP Multicast Text available on
Template Provided By Genigraphics – Replace This Text With Your Title John Smith, MD 1 ; Jane Doe, PhD 2 ; Frederick Smith, MD, PhD 1,2 1.
Réalisé par : Fairouz ichou Imane Errajil.  Introduction  L’ISO en quelque mots  Définition de l’ISO 9001V2000  L’évolution de l’ISO 9001  Principes.
Exercice On considère un Système de contrôle de température composé de: Capteur, ordinateur Le capteur transmit à chaque heure de la journée la température.
Approches de modélisation pour la répartition des coûts
Portfolio électronique au BAA
Titre professionnel Assistant de vie par la VAE
N° /2015 Automotive spare parts Rechange automobile
[Insérez le nom du programme]
Présentation du cours Document No. 1.1
Contribution: Revue des études, enquêtes et systèmes d’informations disponibles au niveau de l’INS, pour alimenter la méthode d’analyse et la cartographie.
Les pronoms démonstratifs
La mise en oeuvre du Plan d’Investissement pour l’Europe
Technologies de l’intelligence d’affaires Séance 13
Plan de la séance 2.
1 Prévision d’une série chronologique par lissage exponentiel Michel Tenenhaus.
Technologies de l’intelligence d’affaires Séance 10
Relevés topographiques souterrains
Technologies d’intelligence d’affaires
1 S Transmission Methods in Telecommunication Systems (4 cr) Transmission Channels.
Technologies de l’intelligence d’affaires
Technologies de l’intelligence d’affaires Séance 11
Technologies de l’intelligence d’affaires Séance 12
Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics.
Conjugating regular –er verbs en français
CountrySTAT.
Apprentissage profond Q
Les gammes de valeurs des paramètres
© 2004 Prentice-Hall, Inc.Chap 4-1 Basic Business Statistics (9 th Edition) Chapter 4 Basic Probability.
Data Driven Decision Making Workshop Sept , Kigali, Rwanda
Evaluation par les options réelles
Programmation Orientée Objet
Réseaux de neurones appliqués à la reconnaissance de caractères
Préparation et suivi des achats Chapitre 21
Leadership Styles Mrs. Keith Main Types of Leadership Styles 1.The Autocratic or Authoritarian Leader 2.The Democratic or Participative Leader.
G. Peter Zhang Neurocomputing 50 (2003) 159–175 link Time series forecasting using a hybrid ARIMA and neural network model Presented by Trent Goughnour.
Author : Moustapha ALADJI PhD student in economics-University of Guyana Co-author : Paul ROSELE Chim HDR Paris 1-Pantheon Sorbonne Economics / Management.
Introduction to Computational Journalism: Thinking Computationally JOUR479V/779V – Computational Journalism University of Maryland, College Park Nick Diakopoulos,
High-Availability Linux Services And Newtork Administration Bourbita Mahdi 2016.
Des mathématiques derrière l’intelligence artificielle
évaluation permettant d’améliorer
Le soir Objectifs: Talking about what you do in the evening
Efficacité des algorithmes
SIMM : Réflexions sur les besoins en référentiels.
Connaissez-vous la France?
Forum national sur l’IMT de 2004.
Présentation 9 : Calcul de précision des estimateurs complexes
Le programme de gestion des actifs de la Nouvelle-Écosse
Roots of a Polynomial: Root of a polynomial is the value of the independent variable at which the polynomial intersects the horizontal axis (the function.
1-1 Introduction to ArcGIS Introductions Who are you? Any GIS background? What do you want to get out of the class?
EN PARLER AVEC LES AUTRES
Reconnaissance de formes: lettres/chiffres
1 Sensitivity Analysis Introduction to Sensitivity Analysis Introduction to Sensitivity Analysis Graphical Sensitivity Analysis Graphical Sensitivity Analysis.
ILB – 14/03/2019 Tom B.
Prepositions of location and disjunctive pronous
OFFRIR DES SOINS PALLIATIFS DANS LE MILIEU RURAL
Sigle optionnel en français FBD
Franck VIOLLET Direction des risques de marché et de modèle HSBC-CCF
Journée 2ème: introduction
Over Sampling methods IMBLEARN Package Realised by : Rida benbouziane.
IMPROVING PF’s M&E APPROACH AND LEARNING STRATEGY Sylvain N’CHO M&E Manager IPA-Cote d’Ivoire.
Transcription de la présentation:

Technologies de l’intelligence d’affaires Séance 14 Les réseaux de neurones avec SAS Entreprise Miner

Référence: « Help » de SAS EM Neural Network Node: Reference Neural Network Node: Usage Predictive Modeling Target Profiler Assessment Node

Partition des données: Apprentissage - Validation - Test Bishop (1995, p. 372): "Since our goal is to find the network having the best performance on new data, the simplest approach to the comparison of different networks is to evaluate the error function using data which is independent of that used for training. Various networks are trained by minimization of an appropriate error function defined with respect to a training data set. The performance of the networks is then compared by evaluating the error function using an independent validation set, and the network having the smallest error with respect to the validation set is selected. This approach is called the hold out method. Since this procedure can itself lead to some overfitting to the validation set, the performance of the selected network should be confirmed by measuring its performance on a third independent set of data called a test set."

Traitement des valeurs manquantes dans SAS EM Si la valeur de la variable cible ou d’une variable explicative (input) est manquante, l’observation est ignorée dans la modélisation des réseaux de neurones et la validation. Donc, pour comparer la performance des réseaux de neurones avec celle des arbres de décision, il faut remplacer les valeurs manquantes des variables explicatives par des valeurs imputées. Pour ce faire, utiliser le nœud « Replacement » dans SAS EM.

Transformations des données Transformations: la transformation des variables explicatives n’est pas aussi importante pour les réseaux de neurones que pour les modèles de régression linéaire ou logistique. Elles peuvent par contre aider à la généralisation et à la rapidité d’entraînement des réseaux. La transformation de la variable cible est aussi importante pour les réseaux de neurones que pour les modèles de régression (ex. changement de l’importance relative des erreurs).

Données aberrantes (outliers) Il faut porter une attention particulière aux données aberrantes car elles peuvent grandement influencer l’estimation des paramètres du modèles et donc les valeurs prédites.

Standardisation des variables La standardisation des variables explicatives continues est importante pour: améliorer la rapidité d’entraînement des réseaux; réduire le risque d’être pris dans le voisinage d’un minimum local. Par défaut SAS utilise la méthode « standard deviation » c-à-d soustrait la moyenne et divise par l’écart type.

Autres considérations pour le choix et l’évaluation des modèles « Prior Propabilities » « Target Profiler »

Exemple Une entreprise de services financiers offre à ses clients, qui ont un prêt hypothécaire avec elle, la possibilité d’avoir une marge de crédit. Dans le passé, plusieurs de ses clients ont obtenu et utilisé la marge de crédit et un bon pourcentage d’entre eux (environ 20%) ont eu des défauts de paiement. En utilisant des données géographiques, démographiques et financières, l’entreprise veut construire un modèle de prévision pour identifier les clients qui ont une forte probabilité d’être en défaut de paiement.

Exemple (voir fichier SAMPSIO.HEMQ)