Introduction à Weka Enseignant : Christian Desrosiers DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Introduction à Weka Enseignant : Christian Desrosiers Chargée de laboratoire : Faten M’hiri
Classification ou clustering ? Problème Type d'apprentissage Algorithmes Classification Supervisé: On possède les attributs et l'étiquette (i.e., classe de sortie) des exemples d'entraînement SVM, k-NN, arbres de décisions, classification de Bayes naïve, etc. Groupement (Clustering) Non supervisé: On ne possède que les attributs des exemples d'entraînement k-moyennes, mélange de modèles gaussiens, etc.
Classification Collecter les données : Données d’apprentissage : pour entraîner le classifieur Données de tests : pour évaluer le classifieur Choisir l’ensemble de caractéristiques pour les décrire (descripteurs) Sélectionner d’un algorithme de classification supervisé Entraîner le classifieur (avec les données d’apprentissage) Évaluer la performance du classifieur (avec les données de test) Apprentissage: on connait la solution
Introduction à Weka Logiciel d’apprentissage machine : Traitement de données Forage de données Comparaison d’algorithmes Etc. Site web: http://www.cs.waikato.ac.nz/ml/weka/index.html Extraction de connaissances a partir de donnees
Introduction à Weka Lancer le logiciel Choisir mode « Explorer » GUI : Open File Sélectionner le fichier : « Weka/data/weather.arff »
Exemple : weather.arff ARFF (Attribute-Relation File Format) : Caractéristiques décrivant la météo: @relation weather @attribute outlook {sunny, overcast, rainy} @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no}
Exemple : weather.arff ARFF (Attribute-Relation File Format) (suite) : Ensemble de données : @data sunny,85,85,FALSE,no sunny,80,90,TRUE,no overcast,83,86,FALSE,yes rainy,70,96,FALSE,yes rainy,68,80,FALSE,yes rainy,65,70,TRUE,no overcast,64,65,TRUE,yes sunny,72,95,FALSE,no sunny,69,70,FALSE,yes rainy,75,80,FALSE,yes sunny,75,70,TRUE,yes overcast,72,90,TRUE,yes overcast,81,75,FALSE,yes rainy,71,91,TRUE,no
Utilisation du GUI : Exemple Sunny Overcast Rainy No Yes
Utilisation du GUI : Exemple choisir l’algorithme J48 dans la section Trees
Liens http://www.cs.waikato.ac.nz/ml/weka/index.html http://www.dataminingtools.net/browsetutorials.php?tag=weka http://aqualonne.free.fr/Teaching/csc/DM.pdf