Royaume de Maroc Université Hassan Premier Settat Faculté des Sciences et Techniques de Settat LA CLASSIFICATION K-MEANS SOUS R /MATLAB Master :Automatique Traitement de Signal Informatique Industriel Module : Analyse de données A.U:2017/2018
Introduction La Classification K-means Application de K-means sur une image sous Matlab Applications de K-means sous R Plan de la présentation Conclusion 5
3 Introduction Définition: La classification Maximiser la similarité intra-classe Minimiser la similarité inter-classe Objectif: facilite l’étude et interprétation d’une phénomène Introduction | La Classification K-means| Application de K-means sous Matlab | Applications de K-mens sous R | Conclusion
4 Les types de la classification : classification Non Hiérarchique K-meansHiérarchique Introduction | La Classification K-means| Application de K-means sous Matlab | Applications de K-mens sous R | Conclusion
5 La Classification K-means Le k-means est un algorithme itératif qui minimise la somme des distances entre chaque objet et le centre de son classe: Choix aléatoire du nombre K des classes Choix K individus qui vont représenter les centres des K classes Calculer la distance entre chaque individus dans le nuage des points et les centres des classes choisies, Attribuer chaque individu au centre le plus proche pour construire les K classes Une fois tous les individus sont placés, recalculer les K centres, Répéter les étapes jusqu’à ce qu’on arrive à des classes stables, Introduction | La Classification K-means| Application de K-means sous Matlab | Applications de K-mens sous R | Conclusion
6 Exemple Introduction | La Classification K-means| Application de K-means sous Matlab | Applications de K-mens sous R | Conclusion
7 Application de K-means sur une image sous matlab Distinguer automatiquement les cas sains des cas pathologiques Caractériser de façon pertinente les images médicales Fournir au praticien des données liées à la décision Introduction | La Classification K-means| Application de K-means sous Matlab | Applications de K-mens sous R | Conclusion Image IRM
8 Programme sous Matlab Introduction | La Classification K-means| Application de K-means sous Matlab | Applications de K-mens sous R | Conclusion
9 Résultats de la classification k-means Introduction | La Classification K-means| Application de K-means sous Matlab | Applications de K-mens sous R | Conclusion
10 Résultats de la classification k-means Introduction | La Classification K-means| Application de K-means sous Matlab | Applications de K-mens sous R | Conclusion
11 Application sur une image Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
12 Application sur une image Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
13 Application sur une image Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion Lire l’image. Obtenir les dimension de l’image. Imposer l’image dans un format de trame de données. Reprendre l’image originale. Lancer le nombre de clusters souhaités. Tracer l’image avec cinq couleurs.
14 Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion Application sur une image
15 Application sur une image Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
16 Application de K-Means sous R Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
17 Les déférents instruction à faire Le chargement des packages # data manipulation > library(tidyverse) # clustering algorithms > library(cluster) # clustering algorithms & visualization > library(factoextra) lire (importe) les données : > data=read.csv2("note.csv",row.names=1) normaliser les données en utilisant fonction scale: > data=scale(data) Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
18 Distance entre les individus et lui même get_dist : pour calculer une matrice de distance entre les lignes d'une matrice de données. La distance par défaut calculée est l’Euclidien. fviz_dist : pour visualiser une matrice de distance. > distance = get_dist ( data ) > fviz_dist (distance, gradient = list ( low = "#00AFBB“, mid ="white", high ="#FC4E07" )) Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
19 Interprétation Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
Cas 1 : nombre de classe égale à 2 : > k2 str ( k2 ) Résultat application k=2: formule de décomposition de huygens: I_totale =I_intra+I_inter Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
21 Visualisation des résultats de K-Means fviz_cluster (k2, data ) Cette fonction fournit une belle illustration des classes. S'il y a plus de deux dimensions (variables), fviz_cluster effectuera une analyse en composantes principales (ACP) et tracera les points de données selon les deux premiers composants principaux. Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
Interprétation des résultats avec k=2 Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion fviz_cluster (k2, data )
Cas 2 : nombre de classe égale à 3 : > k3 str ( k3 ) Résultat application k=3: formule de décomposition de huygens: I_totale =I_intra+I_inter Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
24 Interprétation des résultats avec k=3 Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion fviz_cluster (k3, data )
25 tableau des villes à classifier Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
26 Code > library(tidyverse) > library(cluster) > library(factoextra) > data=read.csv2("temp.csv",row.names=1) > data=scale(data) > distance <- get_dist(data) > fviz_dist ( distance,gradient = list (low = "#00AFBB",mid= "white",high="#FC4E07" )) > k3<-kmeans ( data, centers =3 ) > fviz_cluster ( k3, data ) Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion
27 des résultats après l’exécution de k-means Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion fviz_cluster (k3, data )
28 Conclusion Introduction | La Classification | La Classification K-means | Applications sous R | Conclusion Avantages : Applicable à des données de grandes tailles La convergence est parfois possible en une seule itération Inconvénients : On ne connait pas le nombre K optimal de classes La partition finale dépend du choix initial des centres de classes
Merci de votre attention