Image et apprentissage Marine Campedel Ingénieur d'étude www.tsi.enst.fr/~campedel
Contextes Centre de Compétence (CoC) ACI Masse de données : EFIGI et QUERYSAT Réseaux européens : MUSCLE et KSPACE (janvier 2006) Pôle de compétitivité : IMVN (Infom@gic) => Point commun : fouille, extraction de connaissance dans les images
Axes de recherche Choix des attributs représentant le contenu des images en vue d'une indexation ; Apprentissage à base d'exemples Classification supervisée et non supervisée (structuration de la connaissance) ; Interaction avec l'utilisateur d'un système de fouille d'images (satellitaires). Apprentissage à base d'exemples et du comportement de l'utilisateur
Les axes de recherche (1/4) Quelles caractéristiques pour indexer ? EFIGI : volonté d'indexer sur des paramètres morphologiques des galaxies. Comment les mesurer ? QUERYSAT : détection, représentation des objets distribués sur les images satellitaires (ex: réseau routier) ? CoC : choix et représentation des meilleures caractéristiques pour l'indexation des images satellitaires ? Notre approche : sélection automatique de caractéristiques
Les axes de recherche (2/4) Sélection : concaténation de toutes les caractéristiques possiblement extraites (cf littérature) puis application d'algorithmes (supervisés ou non) de sélection automatique. Nos résultats : Une méthodologie d'évaluation des résultats de sélection ; La sélection améliore les performances de classification ; Démonstration de la complémentarité des différents types de caractéristiques ; Nos méthodes de sélection non supervisées peuvent être plus performantes que les méthodes supervisées.
Les axes de recherche (3/4) Organisation des informations extraites des images (caractéristiques et éventuellement étiquettes sémantiques) Classification supervisée (SVM, KKPPV); Classification non supervisée : combinaison des résultats de différents algorithmes ; Vers la création d'une ontologie de l'imagerie satellitaire. Thèse de Ivan Kyrgyzov
Axes de recherche (4/4) Interaction avec l'utilisateur d'une base d'images satellitaires indexée Apprentissage des concepts "utilisateur" (requête à partir d'exemples) Relevance feedback : le système s'adapte à l'utilisateur et affine ses requêtes à force d'exemples Pb satellitaire : il existe des informations non visibles (bandes spectrales) Thèse de Mihai Costache
Conclusion Activité ambitieuse et récente à Telecom Paris Fouille et indexation Exploitation d'outils d'apprentissage à base d'exemples (classification, sélection ; usage intensif des méthodes à noyaux) Interaction avec l'utilisateur : notion d'évolutivité du système ; apprentissage permanent et adapté à chaque utilisateur.