Similarité Belkhir Abdelkader Laboratoire LSI USTHB belkhir@lsi-usthb.dz 09/04/2017 BELKHIR ABDELKADER
Problématique Input: Ensemble d’objets Tâche: traitement Le plus similaire Requête: Nouveau objet Tâche: trouver l’objet (le plus) similaire parmi l’ensemble des objets 09/04/2017 BELKHIR ABDELKADER
1 Similarity 3 Revising 4 New 2 Similarity Search in Web the Problem Algorithms 2 Similarity Search in Theory 09/04/2017 BELKHIR ABDELKADER
Mesure de similarité Soit N un ensemble d’objets (individus, documents, sites web, …) Une mesure de similarité, notée s, s: NxN R x, y N : s(x,y) ≥ 0 x, y N : s(x,x) = s(y,y) ≥ s(x,y) x, y N : s(x,y) = s(y,x) 09/04/2017 BELKHIR ABDELKADER
Mesure de dissimilarité Une mesure de dissimilarité, notée d, d: NxN R. x, y N : d(x,y) ≥ 0 x, y N : d(x,x) = 0 x, y N : d(x,y) = d(y,x) 09/04/2017 BELKHIR ABDELKADER
similarité s dissimilarité d x, y N : d(x,y) = smax - s(y,x) smax est la valeur de similarité maximale atteinte par les éléments de NxN. 09/04/2017 BELKHIR ABDELKADER
Profil? Profil = {X1, X2, …, Xn} Xi: variable (characteristique) 09/04/2017
Profil : valeur binaire système binaire: 1: characteristique est présente 0: sinon (1 , 0 , 1 , 1, 0 , 0 , 1) (1 , 1 , 1 , 0, 0 , 0 , 1) 09/04/2017
Profil : valeur binaire (X1 , X2 , … , Xm) : X (Y1 , Y2 , … , Ym) : Y X est-il similaire à Y? 09/04/2017
Profile : similarité profil {caracteristiques} Graphe bi-parti 09/04/2017
Graphe bi-parti G(N M, E) 09/04/2017
Graphe bi-parti 09/04/2017
Graphe bi-parti 09/04/2017
Measure de Similarité (X1 , X2 , … , Xm) : X (Y1 , Y2 , … , Ym) : Y X est-il similaire à Y? proportionelle aux arcs communs s: NxN → R. x, y N : s(x,y) ≥ 0 x, y N : s(x,x) = s(y,y) ≥ s(x,y) x, y N : s(x,y) = s(y,x) 09/04/2017
measure dissimilarité d: NxN → R. x, y N : d(x,y) ≥ 0 x, y N : d(x,x) = 0 x, y N : d(x,y) = d(y,x) 09/04/2017
Similarité vers Dissimilarité x, y N : d(x,y) = smax - s(y,x) 09/04/2017
measure similarité 09/04/2017
measure similarité/dissimilarité x, y N : s(x,y) = (1) x, y N : d( x, y) = smax - s( y, x) smax is equal to 1. d is equal to : x, y N : d( x, y) = 1 -(2*a + b + c)/2*(a + b + c) = (2) Il est facile de vérifier que d( x, y) = 0 x = y 09/04/2017
la mesure de Jaccard a s’ = (a + b + c) mesure la métaphore. aucune caractéristique commune d’où a = 0. Dans ce cas, s’=0 ; rejet. s’il y a concordance totale (a ≠ 0 et b=c=0). Dans ce cas, s’= a/a = 1 ; acceptation absolue. 09/04/2017
métaphore color = RGB(r,g,b) ; Dans notre cas, le troisième paramètre est ignoré. Le rejet de la négociation rouge ; la mesure s’ = 0. La couleur est obtenue par RGB(255,0,0). L’acceptation absolue vert ; la mesure s’ = 1. La couleur est obtenue par RGB(0,255,0). 09/04/2017
métaphore Le cas intermédiaire correspond à la valeur k de s’ (0≤k≤1) la couleur la formule suivante : RGB((1-k)*255, k*255, 0). 09/04/2017
Mesure de similarité valeur binaire : abstraction de haut niveau Perte d’information! cpu use : 10u ≠ 55u 09/04/2017
Graphe bi-parti valué nouvelle mesure de similarité!
Mesure de similarité valuée 09/04/2017
09/04/2017
09/04/2017
Représentation du profil par une structure plate (vecteur) Critiques: Représentation du profil par une structure plate (vecteur) Profil totalement défini Vers une nouvelle mesure….. 09/04/2017
09/04/2017
09/04/2017
Quantitative similarity 09/04/2017
Distance= 1-Simmax - 09/04/2017
09/04/2017
Properties neighborhood of the profile 09/04/2017
Properties 09/04/2017
Properties Partially defined profile 09/04/2017
Applications multiples pour la gestion des profils….. Conclusion Applications multiples pour la gestion des profils….. Ahmed Belkhirat, Abdelkader Belkhir, A New Similarity Measure for the Profiles Management, UKSIM '11: Proceedings of the Tenth International Conference on Computer Modeling and Simulation, Cambridge England, 2011. Belkhirat Ahmed, Bouras Abdelghani, Belkhir Abdelkader , A new similarity measure for the anomaly intrusion detection , NSS '09: Proceedings of the 2009 Third International Conference on Network and System Security, October, 2009 , Gold Coast, Australia 09/04/2017