La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Françoise Soulié Fogelman

Présentations similaires


Présentation au sujet: "Françoise Soulié Fogelman"— Transcription de la présentation:

1 Françoise Soulié Fogelman francoise@kxen.com
Data Mining Projets Françoise Soulié Fogelman Master MI2 Pro EID - Université Paris 13 Data mining et Business Intelligence FDON

2 Projet Cross-Validation 8 Projet Binning/Banding 6
Liste des projets Groupe Projet Cross-Validation 8 Projet Binning/Banding 6 Projet Bootstrap & bagging Produits bancaires Projet TIS : série temporelle Projet Feature Selection Challenge 1 Projet Evaluating Predictive Uncertainty Challenge 7 classification Projet Evaluating Predictive Uncertainty Challenge 2 régression Projet Performance Prediction Challenge 9 Projet ré-équilibrage de classe 5

3 Projet Cross-Validation
Projets Projet Cross-Validation Fichier CocoaBank.txt Construire un score avec KXEN et écrire un rapport Sélectionner les 7 à 10 variables les plus significatives Cross-validation Réaliser un script KXEN pour mettre en œuvre la cross-validation Utiliser une k-fold cross-validation pour produire 5 modèles Md, utilisant des polynômes de degré d = 1 à 5. Choisir le meilleur modèle En utilisant la technique de cross-validation. En utilisant le KI / KR Écrire un rapport décrivant la méthode, les résultats obtenus et comparer ces résultats à ceux du modèle standard KXEN obtenu en 1/ Référence Utiliser l’article scientifique décrivant la cross-validation : Groupe 8

4 Projet Binning/Banding
Projets Projet Binning/Banding Fichier CocoaBank.txt Construire un score avec KXEN et écrire un rapport Binning et banding Rechercher des stratégies de binning et banding Réaliser un script KXEN pour mettre en œuvre binning et banding Écrire un rapport décrivant la méthode, les résultats obtenus et comparer ces résultats à ceux du modèle standard KXEN obtenu en 1/ Groupe 6

5 Projet Bootstrap & bagging
Projets Projet Bootstrap & bagging Fichiers ftp://ftp.ics.uci.edu/pub/machine-learning-databases/ heart-disease, breast-cancer-wisconsin, ionosphere, diabetes Construire un score avec KXEN et écrire un rapport Pour chacun des 4 ensembles de données Bagging Réaliser un script KXEN pour mettre en œuvre le bagging Pour chaque ensemble de données, appliquer le bagging sur un ensemble de k échantillons de boot-strap Mettre de côté un échantillon de test Tirer les échantillons de boot-strap sur les donénes restantes Écrire un rapport décrivant la méthode, les résultats obtenus et comparer ces résultats à ceux du modèle standard KXEN obtenu en 1/ Référence Utiliser l’article scientifique décrivant le bagging Groupe 10

6 Projets Produits bancaires Fichier Banking Products.csv
Construire un score d'appétence pour la détention de au moins 1, au moins 2 et au moins 3 produits et écrire un rapport Construire un score d'appétence produit et écrire un rapport 1 modèle par produit, Prévoir pour chaque individu le ou les produits qui doivent être proposés (calcul des probabilités d'appétence)  Fournir un fichier Excel contenant toutes les données et 2 colonnes supplémentaires Le produit à proposer (en dehors de celui qu'il possède) et sa probabilité. Utiliser les résultats de 1. pour affiner les propositions obtenues en 2. Faire une segmentation selon la valeur Client (par exemple en utilisant la variable : tot_amt_balance). Même question que 2. Comparer les résultats obtenus par les différentes méthodes Groupe 4

7 Projet TIS : série temporelle
Projets Projet TIS : série temporelle Fichier bicup2006english.xls Construire un modèle de prévisions temporelles avec KTS et écrire un rapport Comment enrichir ce modèle en utilisant des variables supplémentaires : Jour de la semaine, numéro de jour … ? Que se passe-t-il si on demande des prévisions à 1, 2 ou 3 jours (court terme) versus moyen terme (10, 11, 12 jours?) ou long terme (> 15 jours) Que se passe-t-il si au lieu de travailler au 1/4 d'heure, nous travaillons à la 1/2 heure ou à l'heure? Comparer les résultats obtenus par les différentes méthodes Groupe 3

8 Projet Feature Selection Challenge
Projets Projet Feature Selection Challenge Site du challenge Choisir un des problèmes proposés Construire un score avec KXEN et écrire un rapport Comparer les résultats obtenus à ceux des concurrents du challenge Groupe 1

9 Projet Evaluating Predictive Uncertainty Challenge
Projets Projet Evaluating Predictive Uncertainty Challenge Site du challenge Choisir un des problèmes proposés (classification) Construire un score avec KXEN et écrire un rapport Comparer les résultats obtenus à ceux des concurrents du challenge Groupe 7

10 Projet Evaluating Predictive Uncertainty Challenge
Projets Projet Evaluating Predictive Uncertainty Challenge Site du challenge Choisir un des problèmes proposés (régression) Construire un score avec KXEN et écrire un rapport Comparer les résultats obtenus à ceux des concurrents du challenge Groupe 2

11 Projet Performance Prediction Challenge
Projets Projet Performance Prediction Challenge Site du challenge Choisir un des problèmes proposés Construire un score avec KXEN et écrire un rapport Comparer les résultats obtenus à ceux des concurrents du challenge Groupe 9

12 Projet ré-équilibrage de classe
Projets Projet ré-équilibrage de classe Fichier CocoaBank.txt Construire un score avec KXEN et écrire un rapport Déterminer le nombre de cas positifs (1) et négatifs (0) Ré-équilibrage Construire un échantillon comprenant P cas positifs et N cas négatifs de la façon suivante On prend tous les cas positifs (p) et on pondère chaque cas par un poids w Ceci est équivalent à prendre P = pw Tirer N = P cas négatifs parmi les cas négatifs disponibles Réaliser un script KXEN pour mettre en œuvre cet échantillonnage (pour w = 1 à 30) Produire 30 modèles Mw, pour chaque w. Écrire un rapport décrivant la méthode, les résultats obtenus et comparer ces résultats à ceux du modèle standard KXEN obtenu en 1/ Groupe 5


Télécharger ppt "Françoise Soulié Fogelman"

Présentations similaires


Annonces Google