La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Sélection et classification : avancement Marine Campedel www.tsi.enst.fr/~campedel 22 mars 2005.

Présentations similaires


Présentation au sujet: "Sélection et classification : avancement Marine Campedel www.tsi.enst.fr/~campedel 22 mars 2005."— Transcription de la présentation:

1 Sélection et classification : avancement Marine Campedel www.tsi.enst.fr/~campedel 22 mars 2005

2 Présentation Résumé du travail précédent et correction de la méthode ; Résultats obtenus avec les GMRF ; Stabilité des méthodes non supervisées ; Travaux en cours et à venir.

3 Description de la plate-forme Modèles étiquetés Caract.+ étiquettes Images Extraction de caractéristiques Caractéristiques Requêtes utilisateur Apprentissage Non supervisé Apprentissage supervisé Modèles Sélection de caractéristiques

4 Algorithmes de sélection TypeDescription ReliefF Filter Score dautant plus élevé que la caractéristique permet de discriminer les données de classes différentes. Fisher WrapperAnalyse discriminante de Fisher. RFE Wrapper Élimination récursive des caractéristiques de poids faible, à laide dune SVM. AROM Wrapper Approximation de la norme l0 des poids associés à chaque caractéristique, par une procédure récursive faisant intervenir une L2- SVM ou une L1-SVM. MIC Filter Utilisation dune clusterisation K-PPV des caractéristiques + choix dun représentant par cluster. kMeans-FS Filter Utilisation dune clusterisation K-Moyennes. Initialisation par points extrêmes SVC-FS FilterUtilisation des vecteurs de support issus dune classification 1-classe.

5 Évaluation des sélections Attributs (+étiquettes de classe) Sélection de caractéristiques Apprentissage dun classificateur Calcul dheuristiques Apprentissage/Test Classification Boucle de validation croisée Mesure de redondance Moyenne et écart-type du taux derreurs de classification Sélection de caractéristiques Sélection de caractéristiques

6 Base de travail Base de données Nombre de classes Nombre de données Origine des images « Satellite »6600 SPOT 5m/pixel Imagettes 64x64 Base dapprentissage similaire à létiquetage manuel produit par un utilisateur

7 Résultats passés Classificateur SVM (linéaire) plus performant que KPPV ou Fisher sur la base étudiée ; Sélection effectuée sur des caractéristiques de textures : Réduction de 78+24+18 à 20 (voire 10) coefficients sans perte de performance de classification ; Algorithmes non supervisés aussi puissants que les algorithmes supervisés.

8 GMRF (classification) satelliteNbkppvfishersvmSvm -gauss Hara+Gabor+ qmf+GMRF 124 15.3±1.924.2±5.58.3±3.028.5±4.2 Haralick78 13.8±2.230.8±4.37.7±2.012.7±1.8 Gabor24 22.2±2.540.7±3.816.2±5.320.5±2.6 Qmf18 24.8±1.938.5±4.021.2 ±5.419.3±2.2 GMRF w=644 9.7±4.516.8±3.3 - 8.8±2.4 GMRF w=34413.3±2.118.2±2.7-12.8±1.4

9 GMRF (sélection) 1/2 satelliteNbkppvfishersvm Hara+Gabor+Qmf+ Geo+GMRF 139 12.7±1.518.5±4.97.8±2.3 Fisher10 6.5±2.216.0±3.05.3±3.2 L2-AROM10 10.2±2.319.7±4.28.2±2.2 kMeans-FS10 21.8±4.134.3±5.412.2±2.3 SVC-FS10 21.2±5.029.8±5.214.7±6.6 Fisher20 8.7±1.818.3±3.75.3±2.6 L2-AROM20 11.2±2.316.7±4.56.5±3.1 kMeans-FS20 19.3±3.526.0±4.88.5±2.3 SVC-FS2015.5±3.423.5±3.89.3±1.7

10 GMRF (sélection) 2/2 Sélection FisherNbkppvfishersvm Hara+Gabor+ Qmf+Geo+GMRF GMRF4 Hara6 Gabor6 Geo1 Geo5 GMRF3 Hara19(ou Hara58) Hara71(ou Hara74) Geo13 QMF5 (ou QMF1) Fisher10 6.5±2.216.0±3.05.3±3.2 Fisher66.3±2.417.5±2.85.3±1.5 6 attributs sélectionnés à chaque boucle de validation croisée ; GMRF et attributs géométriques présents.

11 Stabilité (non supervisé) 1/2 Comparaison de deux expériences : Sélection et classification sur la même base ; Sélection et classification sur des bases différentes (base aléatoire pour la sélection, 2000 vignettes 64x64, pas détiquette de classe). Si les sélections sont stables, les performances de reconnaissance doivent être similaires.

12 Stabilité (non supervisé) 2/2 Même baseBases différentes Satellite (Haralick) Nbkppvfishersvmkppvfishersvm kMeans-FS10 12.8±2.328.7±5.89.8±2.513.2±2.229.7±4.39.0±2.2 SVC-FS10 14.7±2.331.0±3.411.7±1.314.7±2.732.0±2.710.8±1.7 kMeans-FS20 13.5±2.830.3±5.26.7±1.013.8±2.931.3±3.68.3±1.0 SVC-FS20 14.8±2.631.7±4.211.0±2.315.2±3.630.8±5.010.0±2.1 kMeans-FS39 13.5±2.231.0±3.78.5±1.614.2±2.831.2±4.68.0±0.7 SVC-FS3913.7±2.729.2±4.98.5±1.513.8±2.929.8±5.38.7±1.7

13 Travaux en attente Estimation du nombre minimal dattributs Chaîne entièrement non supervisée Kernel kMeans + indexes simples de la littérature Étude de méthodes hiérarchiques (Ivan) Stagiaire de mastère (M. Ould : avril-septembre) Base de données Constitution dune base étiquetée manuellement Système de gestion de BD : stagiaire de fin détudes (J. Siyar : février – juillet)

14 Suite à la prochaine réunion … satelliteNbkppvfishersvmSvm - gauss Hara+Gabor+ qmf+GMRF 124 15.3±1.924.2±5.58.3±3.028.5±4.2 Haralick78 13.8±2.230.8±4.37.7±2.012.7±1.8 Sélection6 6.3±2.417.5±2.85.3±1.5 - GMRF w=644 9.7±4.516.8±3.3 - 8.8±2.4 Gemma1285.3±1.89.2±2.6-4.0±0.9


Télécharger ppt "Sélection et classification : avancement Marine Campedel www.tsi.enst.fr/~campedel 22 mars 2005."

Présentations similaires


Annonces Google