Sujet : Étude de Data Mining en utilisant SAS:EM

Slides:



Advertisements
Présentations similaires
Le Conseil européen une arène «décisionnelle» des politiques publiques
Advertisements

Le score de propension (ou méthode de la probabilité prédite)
Tests et Validation du logiciel
Les politiques dalimentation et de développement des Archives Ouvertes Atelier Archives Ouvertes – Monastir – 15 mai 2012 Jean-François LUTZ Université
Évaluation de la qualité d'une clusterisation
1 Séminaire de travail « Indicateur de croissance en France et/ou en zone euro : méthodologie et évaluation » 14 juin 2006 Indicator Models of Real GDP.
La France Données sociales
Marie-Florence de Mascarel 22 Juin 2009
Présentation expérience de formation à distance Réunion IATICE Strasbourg 20 janvier 2010.
Audition CNRS pour le poste 44/04 au LOCEAN
La perception subjective de la corrélation dans les nuages de points
Séminaire thématique Systèmes d’Information & Décision
Scientifique à populaire…
THÈME APPLICATION OF THE ARTIFICIAL NEURAL NETWORK FOR MODELING THE THERMAL BEHAVIOR OF BUILDING IN HUMID REGION Léopold Mbaa, Pierre Meukamb, Alexis.
Data mining avec SQL Server 2005
Comment les services de promotion de la santé à l’école (PSE) peuvent-ils répondre aux besoins de santé spécifiques des adolescents primo-arrivants ? Une.
Applications du perceptron multicouche
Ecole des JDMACS Décision et incertitude en logistique.
06/12/2005 C. Massot À PROPOS DE LOGICIELS STATISTIQUES.
De lénergie verte, oui mais comment ? 04 octobre 2011 Brussel Environnement Raphaël Dugailliez Expert, consultant et formateur Senselia sprl Séance dinformation.
Pourquoi les statistiques ?
Insertion des diplômés des universités régionales Thomas Vannienwenhove.
28/04/2003 ©PEPITe S.A.
1 Comment rédiger une médiagraphie? Martine Mottet, Automne 2009.
Modèle dévaluation linguistique informatisée adaptable Séminaire national pratique de loral en langues vivantes : le rôle des Tice Paris, 24 et 25 novembre.
Population : 366 élèves de Cycle 3 (voir tableau ci-dessous) de l'école primaire ont participé à cette étude et ont été répartis en trois groupes : - le.
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
Modèles de décisions financières
Le forage de données ou data mining
Les Arbres de décision ou régression
Structure discriminante (analyse discriminante)
1 Réunion CESAME, Grenoble, mars 2007 Adaptation au contexte supportée par UsiXML Jean Vanderdonckt, Sophie Lepreux Belgian Lab. of Computer-Human.
Les réseaux de neurones artificiels (RNA)
Aide à la lecture critique d’une publication Malinovsky et coll. Ann Fr Anesth Réanim 2000;19:
Service Traitement de l’Information et Méthodologies.
Apprentissage Statistique et Techniques de Ré-échantillonnage
Outcome of older patients receiving mechanical ventilation Jérôme ALLARDET-SERVENT DESC Réanimation Médicale MARSEILLE - Décembre 2004.
Université de Genève | Service de coordination des bibliothèques Architecture des catalogues RERO : quel avenir ? Michèle Furer-Benedetti.
Apport du Data Mining pour prédire la facture de patients hospitalisés
Une méthode de prévision à un pas de temps Application à la prévision de la qualité de l’air S. Canu, Ph. Leray, A. Rakotomamonjy laboratoire PSI, équipe.
Françoise Soulié Fogelman
La Grille STARD à l’interface Anglais / LCA
Sériation et traitement de données archéologiques
L’étude : I) Présentation
Améliorer la performance des organisations en apportant à toutes les équipes la meilleure compréhension de leur activité pour des décisions plus rapides.
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
1 Connect-a-thon 2007 IHE France Eric Poiseau, INRIA IHE Europe Technical Project Manager.
LES SUPPORTS INDIVIDUELS D ’AIDE A LA DECISION UNE PRESENTATION DE : DIALLO, OUSMANE B UNE PRESENTATION DE : DIALLO, OUSMANE B.
Du discours aux modèles… Une tentative d’articulation
GREDOR - GREDOR - Gestion des Réseaux Electriques de Distribution Ouverts aux Renouvelables How to plan grid investments smartly? Moulin de Beez, Namur.
Knowledge discovery in Databases (KDD)
Brindeau Valentine de Fourmestraux Claire Hochart Maximilien
Test.
Le Data Mining: Méthodologie
Le Marketing Prédictif
Le Data Mining: Méthodologie
Université Laval Faculté d’aménagement, d’architecture et des arts visuels (FAAAV) École supérieure d’aménagement du territoire et de développement régional.
Yris et Quantesys Deux méthodes distinctes et testées Des horizons temps différents Deux approches complémentaires.
ETUDES PRONOSTIQUES Pr Ganry.
© Promaintech Novaxa – Tous droits d’utilisation réservés Corrélation et régression linéaire Introduction à la statistique industrielle.
Prédiction du niveau de certification des établissements de santé Soutenance de stage 12 septembre 2012 Benjamin Robillard.
Test.
Test.
test
Technologies de l’intelligence d’affaires Séance 14
Technologies de l’intelligence d’affaires Séance 12
TEST.

Test test.
Transcription de la présentation:

Sujet : Étude de Data Mining en utilisant SAS:EM UNIVERSITE CATHOLIQUE DE LOUVAIN   Année académique 2009 – 2010 STAT2350 : DATA-MINING Sujet : Étude de Data Mining en utilisant SAS:EM Spinel Jean-Denis Mitskos Christina

Plan Objectif et méthodologie Les différents nodes Les différends modèles Résultats obtenu

Objectif: Target Modèles prédictifs Variables Pertinentes

Méthodologie :

Node : Input Data !!: Surentrainement Entrainement, Validation, Test Note: Cross-Validation ?

Node : Transform Variable

Node : Replacement Si binaire 0 Si !Finance Moyenne Sinon Tree Inputation

Node: Variable Selection Sans: Avec:

Node : Filter Outlier Sans: Avec

ModèleS Arbres de Décisions Régressions Logistiques Réseau de Neurone

Exemple : le Neural Network

Comparaison des modèle Tree Régression NN

Variables Significatives

Oversampling Tree Régression NN

Conclusion Meilleur modèle = NN Oversampling < Donnée brute ? Doute

Bibliographie TUFFERY (S.), Data Mining et statistique décisionnel, Paris, Technip, 2007, 366 p. http://www.stat.ucl.ac.be/cours/stat2350/SAS_EM_4_3.pdf http://www.stat.ucl.ac.be/cours/stat2350/SAS_EM_case_study_approach.pdf http://eric.univ-lyon2.fr/publications/files/TheseSimonMarcellin.pdf