Sélection des dimensions

Slides:



Advertisements
Présentations similaires
RAS 3,1 Modéliser des situations à l’aide de relations et les utiliser afin de résoudre des problèmes avec et sans l’aide de technologie.
Advertisements

INSEE FASILD Atlas des populations immigrées en Midi-Pyrénées.
Le moteur
La Méthode de Simplexe Standardisation
Produit Gammes Nomenclatures Modules Techniques Prix de Revient Prix de Vente Modules Techniques Client Marges Mise en route Temps Unitaire Prix (Ex:
Faculté des Sciences de la Santé
Distance inter-locuteur
Mon carnet De comportement
Regroupement (clustering)
LIRMM 1 Journée Deuxièmes années Département Microélectronique LIRMM.
Classe : …………… Nom : …………………………………… Date : ………………..
Une approche informationnelle de la restauration d’images
ACTIVITES Le calcul littéral (3).
Les Prepositions.
1. Les caractéristiques de dispersion. 11. Utilité.
1 Vers la découverte de nouvelles modalités sensori-motrices. Encadrants : Pierre Bessière Anne Spalanzani Pierre Dangauthier DEA I.V.R. 24 Juin 2003 Sélection.
Page : 1 / 6 Conduite de projet Examen du 6 mai 1999 Durée : 4 heures Le support de cours est toléré La notation tiendra compte très significativement.
Page : 1 / 6 INSA Rouen département ASI UV MGPI Examen du 25 juin 2003 Durée : 120 mn Le support de cours est toléré La notation tiendra compte très significativement.
Nicolas Zlatoff - Stage de DEA Sous la direction de Bruno Tellez
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
Indicateurs de position
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Safae LAQRICHI, Didier Gourc, François Marmier {safae
variable aléatoire Discrète
07/24/09 1.
Améliorer les performances du chiffrage à flot SYND
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
1 Comment utiliser votre Extranet Se connecter 2.My Site 3.Documentation 3.1 Documents dintégration 3.2 Documents types 4.Vos informations privées.
Application des algorithmes génétiques
le profil UML en temps réel MARTE
SUJET D’ENTRAINEMENT n°3
Classification Multi Source En Intégrant La Texture
Applications du perceptron multicouche
1.2 COMPOSANTES DES VECTEURS
Guide pour construire une présentation de qualité
Méthode des k plus proches voisins
Construction de modèles visuels
Traitements à base d’histogrammes Cours 6
Réseaux de neurones.
Interprétation de séquences dimages pour des applications MédiaSpace Alberto AVANZI François BREMOND Monique THONNAT Projet ORION INRIA de Sophia Antipolis.
Projet Génie Logiciel & UML, Bases de Données & Interfaces
PLD GHome H4214 Piccolo Thomas Gu Lei Deville Romain Huang Yachen
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
Courbes de Bézier.
Les modèles linéaires (Generalized Linear Models, GLM)
3.1 DÉTERMINANTS (SUITE) Cours 6.
3.2 PRODUIT VECTORIEL Cours 7.
Notre calendrier français MARS 2014
Design dun système de vision embarqué. Application:
Annexe 1 VISITE SUR
Sabrina TOLLARI Paris, le 4 octobre 2007
C'est pour bientôt.....
Veuillez trouver ci-joint
2.2 PRODUIT SCALAIRE ET CALCUL D’ANGLES
Page 1 © Jean Elias Gagner en agilité numérique. Page 2 © Jean Elias Les fournisseurs.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Page 1 © Jean Elias Recherche et veille. Page 2 © Jean Elias Les fournisseurs.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
CALENDRIER-PLAYBOY 2020.
1. Présentation générale du système
Caractérisation texturale des surfaces boisées dans une image Ikonos de la région de Montréal Pierre Bugnet Langis.
1 Sélection adaptative des descripteurs visuels et dérivation de métadescripteurs contextuels dépendant du mot-clé pour l'indexation automatique d'images.
Sabrina Tollari, Hervé Glotin, Jacques Le Maitre
1 Sélection adaptative des descripteurs visuels et dérivation de métadescripteurs contextuels dépendant du mot-clé pour l'indexation automatique d'images.
Sélection adaptative des descripteurs visuels dépendant du mot-clé pour un moteur de recherche d’images Sabrina Tollari, Hervé Glotin Laboratoire LSIS.
Transcription de la présentation:

Sélection des traits visuels en fonction du concept recherché à partir d’images mal annotées

Sélection des dimensions Problématique Quels traits visuels doit-on utiliser pour bien discriminer un certain concept (mot) ? Etant donnés : le problème de la malédiction de la dimension et l’existence de traits visuels non-informatifs La couleur rouge est discriminante pour une tomate mûre, mais pas pour une fleur.

La malédiction de la dimension Sélection des dimensions La malédiction de la dimension Les espaces de grande dimension possèdent des propriétés particulières qui font que les intuitions géométriques peuvent se révéler fausses Plus la dimension de l’espace est grande (Beyer et al., 1999) (Weber et al., 1998) : Plus les vecteurs sont équidistants entre eux Plus le partitionnement de l’espace devient exponentiel Plus l’espace est creux Plus la taille des bases de données augmente de façon exponentielle… L’apprentissage et la recherche par similarité sont donc plus difficiles sur des espaces de grande dimension

? Proposition Proposition : Approximer la LDA (ALDA) Sélection des dimensions Proposition Utiliser la méthode classique de l’Analyse Linéaire Discriminante (LDA) ? Difficulté : Les bases d’images réelles (ex : Web, COREL) ne sont pas étiquetées par régions d’image Proposition : Approximer la LDA (ALDA) water boat harbor building ? Par contre, les régions autour du « building » seront très changeantes…

Sélection des dimensions Rappel : LDA versus ACP L’ACP recherche l’axe qui représente le mieux les données La LDA recherche l’axe qui sépare le mieux les classes

Sélection des dimensions Approximation des variances inter-/intra- classes pour estimer le pouvoir discriminant (LDA) Pour déterminer les traits visuels les plus discriminants en fonction du mot wi considéré à partir de la base d’apprentissage Séparation des images (et pas des régions) en 2 classes : Celles qui sont annotées par ce mot Celles qui ne sont pas annotées par ce mot Calcul des variances interclasse (B) et intraclasse (W) Pour chaque trait visuel vj et pour chaque mot wi, on calcule le pouvoir discriminant F: Nous montrons théoriquement que l’ordre des meilleurs F estimés par ALDA est le même que par LDA.

Principe de démonstration de l’ALDA Sélection des dimensions Principe de démonstration de l’ALDA Proposition : Le pouvoir discriminant sur les ensembles T et G peut être exprimé linéairement en fonction du pouvoir discriminant sur les ensembles S et G avec nG >> nT Images annotées par le mot « horse » Images non annotées par le mot « horse »

Exemple : approximation de la LDA (ALDA) Sélection des dimensions Exemple : approximation de la LDA (ALDA) Pour le mot SNOW B de RGB B de LAB stdA de LAB stdG de RGS Texture 15

Exemple : approximation de la LDA (ALDA) Sélection des dimensions Exemple : approximation de la LDA (ALDA) Pour le mot SNOW B de RGB B de LAB stdA de LAB stdG de RGS Texture 15

Sélection des dimensions Détermination du nombre de traits visuels à prendre en compte pour bien discriminer un mot Nous proposons de prendre les N dimensions visuelles qui cumulent t% de la somme des pouvoirs discriminants de tous les traits. Soient les traits visuels vj ordonnés dans l’ordre décroissant des pouvoirs discriminants, nous choisissons N tel que : =1 t

Sélection des dimensions Exemples de clusters visuels dans l’espace usuel à 40 dimensions avec ou sans sélection par ALDA Sans sélection Avec sélection Écarts-types rouge de RVB, vert de rvS et a de Lab Rouge de RVb, rouge de rvS et a de Lab

Sélection des dimensions Scores moyens des classifications de 52 mots en fonction du nombre moyen de dimensions Expériences avec les traits visuels usuels (U)

Sélection des dimensions Scores moyens des classifications de 52 mots en fonction du nombre moyen de dimensions Expériences avec les traits visuels usuels (U)

Sélection des dimensions Scores de classification de chaque mot sans/avec sélection de traits visuels

Nombre moyen de dimensions Sélection des dimensions Résumé des résultats 40DIMU Lab U avec sélection ACP U t 1.0 _ 0.3 0.7 Nombre moyen de dimensions 40 - 6 (-85%) 3.1 (-92%) 8 (-80%) NS Moyen Classification 0.192 0.248 (+29%) 0.275 (+43%) 0.214 (+11%) Nous montrons expérimentalement que d’autres descripteurs visuels, appelé hétérogénéité (Martinet et al., 2005) dérivés très rapidement des traits visuels U, apportent une information complémentaire que l’on peut utiliser pour améliorer les scores (fusion tardive jusqu’à +69%). Nous obtenons expérimentalement des résultats similaires avec un autre critère de sélection : l’Approximation de la Diversité Marginale Maximale (AMMD).

Perspectives Vers un moteur de recherche d’images sur le Web Les deux grands défis du multimédia sur le Web : Permettre le passage à l’échelle utiliser des techniques qui savent gérer un grand nombre de données et les adapter au multimédia Réduire le fossé sémantique Combiner plusieurs sources d’informations (texte, audio, visuel, structure des documents…)

Applications et perspectives Vers un moteur de recherche d’images sur le Web Requête textuelle et/ou visuelle Images mal annotées traitement traitement représentation de la requête représentation des images similarité images résultats

Applications et perspectives Vers un moteur de recherche d’images sur le Web Requête textuelle et/ou visuelle Images mal annotées traitement apprentissage sélection des dimensions visuelles en fonction du mot de la requête auto-annotation, filtrage… représentation de la requête représentation des images mieux annotées similarité images résultats

Résumé de la tâche 2 de la campagne d’évaluation ImagEVAL

Description de la tâche 2 d’ImagEVAL Corpus : 700 urls 700 pages Web 10 000 images Web 25 requêtes : chaque requête est composée de mots-clés et d’images But : trouver parmi les 10 000 images celles qui sont pertinentes pour chaque requête Pour le test officiel : 300 images doivent être rendus Les MAP (Mean Average Precision) sont calculés par le logiciel standard treceval Les images pertinentes sont inconnues (entre 10 et 100 par requête)

Exemples de requêtes « Poplar tree » « Picasso Guernica » + +

D(Q,I,t) = t x DT(Q,I) + (1 – t) x DV (Q,I) Notre proposition Extraction de descripteurs visuels et calcul de la distance Dv entre les images de la base et les images requêtes Utilisation de tfidf pour le texte et normalisation Modèle « naif » de fusion du texte et de l’image D(Q,I,t) = t x DT(Q,I) + (1 – t) x DV (Q,I) Utilisation de l’Analyse Linéaire Discriminante (LDA) pour déterminer les dimensions visuelles les plus discriminantes Pour chaque requête, les mots clés sont utilisés sur un moteur de recherche Web pour retrouver des images pertinentes par rapport au texte Ces images « mal annotées » servent de base d’apprentissage pour la LDA

Scores MAP en fonction du taux t de texte dans la fusion

Scores MAP en fonction du nombre de dimensions sélectionnées et de l’ensemble d’apprentissage choisi

Temps de calcul de la distance en fonction du nombre de dimensions de l’espace

Merci de votre attention

Extension des traits visuels : l’hétérogénéité (H) Caractéristiques visuelles d’un mot Extension des traits visuels : l’hétérogénéité (H) Inspiré des travaux en psychovision Le cerveau humain interprète en contexte La valeur de l’hétérogénéité pour le trait visuel p de l’image d est l’entropie : J. Martinet, Y. Chiramella, P. Mulhem, « A model for weighting image objects in home photographes », ACM CIKM, pages 760-767, 2005 J. Martinet, « Un modèle vectoriel relationnel de recherche d’informations adapté aux images », Thèse de doctorat, Université Joseph Fourier, Grenoble, 2004

Caractéristiques visuelles d’un mot 40DIMU versus 40DIMH

Scores moyens des classifications de 52 mots en fonction du nombre moyen de dimensions Expériences avec les traits d’hétérogénéité (H)

Scores moyens des classifications de 52 mots en fonction du nombre moyen de dimensions Expériences fusions tardives de U et de H