Sélection et classification : avancement Marine Campedel 22 mars 2005
Présentation Résumé du travail précédent et correction de la méthode ; Résultats obtenus avec les GMRF ; Stabilité des méthodes non supervisées ; Travaux en cours et à venir.
Description de la plate-forme Modèles étiquetés Caract.+ étiquettes Images Extraction de caractéristiques Caractéristiques Requêtes utilisateur Apprentissage Non supervisé Apprentissage supervisé Modèles Sélection de caractéristiques
Algorithmes de sélection TypeDescription ReliefF Filter Score dautant plus élevé que la caractéristique permet de discriminer les données de classes différentes. Fisher WrapperAnalyse discriminante de Fisher. RFE Wrapper Élimination récursive des caractéristiques de poids faible, à laide dune SVM. AROM Wrapper Approximation de la norme l0 des poids associés à chaque caractéristique, par une procédure récursive faisant intervenir une L2- SVM ou une L1-SVM. MIC Filter Utilisation dune clusterisation K-PPV des caractéristiques + choix dun représentant par cluster. kMeans-FS Filter Utilisation dune clusterisation K-Moyennes. Initialisation par points extrêmes SVC-FS FilterUtilisation des vecteurs de support issus dune classification 1-classe.
Évaluation des sélections Attributs (+étiquettes de classe) Sélection de caractéristiques Apprentissage dun classificateur Calcul dheuristiques Apprentissage/Test Classification Boucle de validation croisée Mesure de redondance Moyenne et écart-type du taux derreurs de classification Sélection de caractéristiques Sélection de caractéristiques
Base de travail Base de données Nombre de classes Nombre de données Origine des images « Satellite »6600 SPOT 5m/pixel Imagettes 64x64 Base dapprentissage similaire à létiquetage manuel produit par un utilisateur
Résultats passés Classificateur SVM (linéaire) plus performant que KPPV ou Fisher sur la base étudiée ; Sélection effectuée sur des caractéristiques de textures : Réduction de à 20 (voire 10) coefficients sans perte de performance de classification ; Algorithmes non supervisés aussi puissants que les algorithmes supervisés.
GMRF (classification) satelliteNbkppvfishersvmSvm -gauss Hara+Gabor+ qmf+GMRF ± ±5.58.3± ±4.2 Haralick ± ±4.37.7± ±1.8 Gabor ± ± ± ±2.6 Qmf ± ± ± ±2.2 GMRF w= ± ± ±2.4 GMRF w= ± ± ±1.4
GMRF (sélection) 1/2 satelliteNbkppvfishersvm Hara+Gabor+Qmf+ Geo+GMRF ± ±4.97.8±2.3 Fisher10 6.5± ±3.05.3±3.2 L2-AROM ± ±4.28.2±2.2 kMeans-FS ± ± ±2.3 SVC-FS ± ± ±6.6 Fisher20 8.7± ±3.75.3±2.6 L2-AROM ± ±4.56.5±3.1 kMeans-FS ± ±4.88.5±2.3 SVC-FS2015.5± ±3.89.3±1.7
GMRF (sélection) 2/2 Sélection FisherNbkppvfishersvm Hara+Gabor+ Qmf+Geo+GMRF GMRF4 Hara6 Gabor6 Geo1 Geo5 GMRF3 Hara19(ou Hara58) Hara71(ou Hara74) Geo13 QMF5 (ou QMF1) Fisher10 6.5± ±3.05.3±3.2 Fisher66.3± ±2.85.3±1.5 6 attributs sélectionnés à chaque boucle de validation croisée ; GMRF et attributs géométriques présents.
Stabilité (non supervisé) 1/2 Comparaison de deux expériences : Sélection et classification sur la même base ; Sélection et classification sur des bases différentes (base aléatoire pour la sélection, 2000 vignettes 64x64, pas détiquette de classe). Si les sélections sont stables, les performances de reconnaissance doivent être similaires.
Stabilité (non supervisé) 2/2 Même baseBases différentes Satellite (Haralick) Nbkppvfishersvmkppvfishersvm kMeans-FS ± ±5.89.8± ± ±4.39.0±2.2 SVC-FS ± ± ± ± ± ±1.7 kMeans-FS ± ±5.26.7± ± ±3.68.3±1.0 SVC-FS ± ± ± ± ± ±2.1 kMeans-FS ± ±3.78.5± ± ±4.68.0±0.7 SVC-FS3913.7± ±4.98.5± ± ±5.38.7±1.7
Travaux en attente Estimation du nombre minimal dattributs Chaîne entièrement non supervisée Kernel kMeans + indexes simples de la littérature Étude de méthodes hiérarchiques (Ivan) Stagiaire de mastère (M. Ould : avril-septembre) Base de données Constitution dune base étiquetée manuellement Système de gestion de BD : stagiaire de fin détudes (J. Siyar : février – juillet)
Suite à la prochaine réunion … satelliteNbkppvfishersvmSvm - gauss Hara+Gabor+ qmf+GMRF ± ±5.58.3± ±4.2 Haralick ± ±4.37.7± ±1.8 Sélection6 6.3± ±2.85.3±1.5 - GMRF w= ± ± ±2.4 Gemma1285.3±1.89.2± ±0.9