Marine Campedel www.tsi.enst.fr/~campedel mars 2005 INDEXATION des IMAGES Marine Campedel www.tsi.enst.fr/~campedel mars 2005.

Slides:



Advertisements
Présentations similaires
RAPPORT DAVANCEMENT Par Narcisse Talla Tankam CURAT-LETSfévrier-mars 2004.
Advertisements

Description et utilisation de l’information musicale
Définitions Analyse documentaire
Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
AS Données multimédia : interrogation et stockage
Rosa María Gómez de Regil Educatice, 25 novembre 2010
Intégration fine de médias dans les présentations multimédias
Projet ORI-OAI Réseau de portails OAI Printemps dUNIT 24 mai 2007.
Projet ORI-OAI Réseau de portails OAI 27/03/2007.
1 ICSI Ingénierie des Connaissances et des Supports dInformation Organiser et exploiter le capital de connaissances des entreprises et des organisations.
Évaluation de la qualité d'une clusterisation
Image et apprentissage
De la mise en page à la mise en écran : le cas des colonnes
19 septembre 2006 Tendances Logicielles IBM Rational Data Architect Un outil complet de modélisation et de conception pour SGBD Isabelle Claverie-Berge.
XML - Henry Boccon-Gibod 1 XML, Langage de description La question du choix de formalismes Les entités et leur représentations modalités de modèles et.
Urbanisation de Systèmes d'Information
Indexation vidéo Indexation multimédia
Documentation numérique sur l’Internet
D5 : Maitrise de l’Information
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
Ontologie, Méta-données, Sémiotiques
Les méthodes formelles en ingénierie des connaissances Damien Lhomme-Desages Jérémie Barlet.
Indexation textuelle : Systèmes de recherche d’informations
Journée détudes Observatoires Locaux de lInnovation 21 avril 2005 – Saint-Etienne CREUSET – BETA – OST - INIST Journée Observatoires Locaux de lInnovation.
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Quelques règles à respecter pour concevoir une présentation dynamique et sobre Dans un cadre scolaire D. G. Formation APEP
Laboratoire Sciences Pour l’Environnement
Christian Ollivier IUFM / Université de La Réunion
INFO-MED Réseau d information méditerranéen Problématique La production et la maîtrise des savoirs contribuent aujourdhui à laccroissement des valeurs.
XML-Family Web Services Description Language W.S.D.L.
Classification Multi Source En Intégrant La Texture
Recherche d’un même objet / scène
B2i Lycée Circulaire BO n°31 du 29/08/2013.
Annotations sémantiques pour le domaine des biopuces
Mise en correspondance et Reconnaissance
Construction de modèles visuels
Assises du GDR- I3 Présentation du GRCE Groupe de Recherche en communication Ecrite.
Définir des caractéristiques chercher de linformation? sur un support électronique? Élaborer un cadre théorique pour comprendre les enjeux et proposer.
Projet région Thématique prioritaire n°10 Calculs Scientifiques Logiciels Rhône-Alpes : Grille pour le Traitement dInformations Médicales (RAGTIME ?)
École de bibliothéconomie et des sciences de linformation 1 Gestion de linformation électronique (GIE) Maîtrise en sciences de linformation EBSI Université.
Base de données multimédia Cordelia Schmid
Sensibilisation a la modelisation
UN THESAURUS Pourquoi ? Pour qui ? Comment ?
Segmentation (1ère partie)
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
Université Numérique de la Nièvre
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
1 : Le nom du fichier contenant les métadonnées. 2 : Affichage des données du programme (Varie selon le mode – lecture/saisie). 3 : Application de filtres.
Web sémantique est pratique documentaire
Initiation à la conception des systèmes d'informations
Recherche d’information
Rétro-ingénierie d’un système existant
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
SYSTEMES d’INFORMATION séance 1 : Introduction et définitions
Knowledge discovery in Databases (KDD)
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
Sabrina Tollari, Hervé Glotin, Jacques Le Maitre
Karine Vallin - Dorian Baysset
Problématique de SIG/D2S2 dans les SSTA Le(s) système(s) d’information dans les SSTA Omniprésent(s) Transparent(s) pour l’utilisateur Multi-utilisateurs.
APPLICATION : Un diagnostic précoce et automatique des pathologies végétales LA VISION COGNITIVE De la science de la reconstruction visuelle à la science.
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
A L I M E N T A T I O N A G R I C U L T U R E E N V I R O N N E M E N T ProdInra en Web sémantique Esther Dzalé Y. Kaboré Sophie Aubin Hugues Leiser.
R ETOURS SUR LE PROJET DISTIL ET PERSPECTIVES 2011 Sylvie Ranwez Gérard Dray.
14/10/2004 Parcours et unités d’enseignement du domaine : Signal et Images Isabelle Bloch, Bertrand David, Yves Grenier.
Reconnaissance d’objets 3D –point de vue complètement différent –pas d’invariant 3D Difficultés :
1 Point Modélisation – ZHI 2.0 – MDO 2.0. Groupes ADD-GIGE 24/09/ ZHI 2.0.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
Transcription de la présentation:

Marine Campedel www.tsi.enst.fr/~campedel mars 2005 INDEXATION des IMAGES Marine Campedel www.tsi.enst.fr/~campedel mars 2005

Plan du cours Introduction Indexation par le texte Indexation par le contenu Extraction des caractéristiques Organisation des caractéristiques Comparaison des caractéristiques Interaction avec l’utilisateur Évaluation des systèmes d’indexation Conclusion

Introduction Quelques chiffres : INA : 500 000 h video + 600 000 h audio + 2 000 000 de photos 82 Milliards de photos par an dans le monde 390 Millions d’images indexées par Google 4250 films commerciaux par an (UNESCO) Motivations : Conservation d’un patrimoine (culturel, scientifique,…) Valorisation en facilitant l’accès et l’exploration Exploitation commerciale (photos numériques, TV numérique, …)

Introduction : quelles images ? biomédical, satellitaires, photos, 2D ou 3D,… 3 catégories générales Images d’art (auteur, titre,…) Images documentaires (reliées à un texte) Images ordinaires Centres d’intérêts actuels : Audio-vidéo, multimédia, 3D

Introduction Acteurs industriels Acteurs académiques QBIC (IBM), Virage, Netra NewPhenix (CEA) Acteurs académiques VisualSeek (Columbia), … IMEDIA (INRIA, Rocquencourt), RETIN (ETIS, Cergy), KIWI (Insa, Lyon),… Nombreux projets européens et nationaux

Introduction Objectif de l’indexation : faciliter l’accès à des bases de données en extrayant une information synthétique. Fouille de données (Data Mining), Extraction de connaissances, Vision artificielle Catalogue, classification et indexation : quelles différences ? Indexation textuelle ou par le contenu ?

Introduction 1980 : Annotation textuelle des images 1990 : Indexation par la couleur, la forme et la texture 1993 : Requête en utilisant la similarité des images 1997 : Requête par images exemplaires et mesure de la pertinence (relevance feedback) 2000 : apprentissage sémantique et adaptation à l’utilisateur Enjeux actuels : annotation interactive, formalisation de la connaissance (ontologies), grosses bases de données (problèmes de stockage, de vitesse d’accès,…), données hétérogènes, …

Indexation d’images à partir du texte meta-données : type d’image, titre, auteur, conditions de prises de vue,… Annotations humaines Avantages : exploite les outils d’indexation textuelle, prise en compte plus aisée des aspects sémantiques. Inconvénients : vocabulaire limité difficultés de l’annotation : définition du vocabulaire, temps d’annotation >> temps réel, subjectivité, etc.

Indexation d’images à partir du texte

Ontologies Nécessité de définir un langage de description Limité par le contexte de production Limite l’utilisation Définition d’ontologies : modélisation du contexte (objets/concepts et relations entre eux) de façon à lever toute ambiguïté d’interprétation « Le problème fondamental est de respecter la diversité des langages et des représentations du monde, tout en permettant l'échange d'information.[…] Identifier, modéliser les concepts d'un domaine, pertinents pour une/des applications, Se mettre d'accord, au sein d'une communauté, sur les termes employés pour se référer à ces concepts. »

Taxonomie / Nomenclature Réduction couramment utilisée : Classification Exemple : Corine Land cover Surfaces artificielles Surfaces cultivées Forêts et espaces semi naturels Surfaces humides eau Usine urbaine Transports … … Réseaux routiers Ports Aéroports

Indexation par le contenu : principe (1/2) Images Requêtes utilisateur Extraction de caractéristiques Sélection de caractéristiques Caractéristiques Apprentissage Non supervisé Modèles Modèles étiquetés Apprentissage supervisé Caract.+ étiquettes

Principe (2/2) Off-line : production d’indexes issus de l’analyse du contenu des images Extraction de caractéristiques pertinentes Réduction de la dimensionnalité Organisation par classification On-line : gestion des requêtes d’un utilisateur « Gap sémantique » Relevance feedback

Extraction de caractéristiques (1/2) Spécifiques : points saillants, minuties,… Générales : couleur, texture, forme Globale ou locale : Blocs arbitraires, segmentation, information topologique

Extraction de caractéristiques (2/2) Problème de représentation Caractéristiques numériques, symboliques, graphes,… Invariances Translation, rotation, homothétie, non-linéaires ?

Similarité de l’information (1/5) Visuellement similaires ?

Similarité de l’information (2/5)

Similarité de l’information (3/5) Deux images seront comparées par l’intermédiaire des caractéristiques extraites Sim( Im1, Im2 ) = Sim( f(Im1), f(Im2) ), avec f la fonction d’extraction des caractéristiques Mesures de similarités, distances (A) s( x, x ) = s( y, y ) > s( x, y ) (B) s( x, y ) = s( y, x ) (C) d( x, x) = 0 (D) d(x,y) = 0  x = y (E) d(x, y) <= d(x,z) + d(z,y) (F) d(x,y) <= max( d(x,z), d(z,y) ) similarité dissimilarité distance Ultra-métrique

Similarité de l’information (4/5) Distance euclidienne Distance euclidienne généralisée Malahanobis Chi2 Similarité en cosinus Combinaisons linéaires de similarités (ou distances)

Similarité de l’information (5/5) Comparaison des caractéristiques après une transformation Φ « Truc du noyau » K(x,y) = < Φ(x), Φ(y)>, K semi-defini positif D(x,y) = <x,x> + <y,y> -2<x,y> devient D(Φ(x), Φ(y) ) = K(x,x) + K(y,y) -2K(x,y) Intérêt : la spécification de K définit implicitement Φ Intensivement utilisé pour ACP, la discrimination de Fisher, la classification SVM,…

Réduction d’information (1/2) Réduction de la dimensionnalité ACP Algorithmes de sélection Quantification (forme de clusterisation)

Réduction d’information (2/2) Sélection : filter/wrapper/embedded Supervisé, non supervisé Supervisé, wrapper : SVM-RFE, Fisher,… Non supervisé, filter : clusterisation des caractéristiques

Organisation de l’information (1/2) Classification : données X (caractéristiques) et label Y Exemples : kPPV, SVM, Bayes, arbres de décision (C45.1) Évaluation d’une classification : Décompte des erreurs Validation croisée

Organisation de l’information (2/2) Clusterisation : données X Partitionnement : kMeans Hiérarchique : arbres Minimiser la distance intra-classes et maximiser la distance inter-classes Évaluation : pas évidente Estimation du nombre de clusters : indexes de Calinsky, Davies Bouldin, Dunn,… Mesure de la qualité ?

Gestion de l’information SGBD Systèmes de Gestion de Bases de données Gestion informatique : interaction avec les requêtes utilisateur, temps d’accès, place mémoire, … Relationnel : SQL, mySQL Objet Relationnel-objet : Oracle, PostGreSQL

Requêtes Grande diversité Les systèmes imposent des types de requête : Recherche d’une image dans une base Recherche d’images similaires à une image exemplaire Recherche d’images similaires à des images exemples et dissimilaires à d’autres Recherche d’images contenant une région de l’image exemplaire …

Feedback utilisateur (1/2) Défaut majeur des systèmes standards : l’utilisateur doit s’adapter au système Caractéristiques extraites automatiquement non intuitives Fossé entre la formulation des requêtes et le codage de l’information Nécessité d’adapter le système à l’utilisateur Apprentissage : requêtes, mesures de similarités

Feedback utilisateur (2/2) Requêtes utilisateur Images Extraction de caractéristiques Sélection de caractéristiques Caractéristiques Apprentissage Non supervisé Modèles Modèles étiquetés Apprentissage supervisé Caract.+ étiquettes

Évaluation (1/2) Graphe de rappel-précision calculé en faisant varier le nombre de documents sélectionnés   Documents pertinents Documents non pertinents Documents sélectionnés Documents trouvés Documents hors contexte : bruit Documents non sélectionnés Documents oubliés : silence  et

Évaluation (2/2) : autres critères Exploitation du rang de récupération Critère de validation de MPEG7 Rank*(k) = rang(k) si < K(q), 1.25K sinon AVR(q) : moyenne des rangs MRR(q) = AVR(q) – 0.5( 1 + NG(q) ) NMRR(q) = MRR(q) / ( 1.25K – 0.5(1+NG(q)) ) Critère final : moyenne des NMRR Notations : q = 1 requête ; k = une image pertinente pour la requête ; NG(q) nombre d’images pertinentes pour la requête ; K limite de rang acceptable

Normalisation : MPEG 7 (1/2) MPEG : Motion Picture Expert group MPEG7 : A Multimedia Content Description Interface, normalisé en 2001 Standard de description du contenu de données multimédia + interprétation du sens de l’information S’appuie sur XML (langage à balises) Un éditeur gratuit d’IBM (pour indexer des videos) www.alphaworks.ibm.com/tech/videoannex

Normalisation : MPEG 7 (2/2) Définitions de caractéristiques bas niveau : //www-iplab.ece.ucsb.edu/publications/01IEEEManjunath.htm Évaluation des caractéristiques sur des bases étiquetées manuellement

Démonstrations Images 3D : http://3d.csie.ntu.edu.tw/

Démonstrations

Démonstrations Ding-Yun Chen, Xiao-Pei Tian, Yu-Te Shen and Ming Ouhyoung, "On Visual Similarity Based 3D Model Retrieval", Computer Graphics Forum (EUROGRAPHICS'03), Vol. 22, No. 3, pp. 223-232, Sept. 2003

Démonstrations www-rocq.inria.fr/imedia/ikona Feedback utilisateur

Conclusion Indexation des images : problème non résolu Experts issus de domaines variés (informatique, traitement de l’image, psycho visuel, apprentissage machine, …) Deux axes à étudier simultanément : Techniques d’analyse d’image donc d’extraction et de comparaison de l’information Pertinence de l’information pour un utilisateur Produits commerciaux encore basiques … quoique