AnaLyse diachronique de l’espace urbain PArisien : approche GEomatique LAMOP OTELO ArScAn L3i Projet ALPAGE AnaLyse diachronique de l’espace urbain PArisien : approche GEomatique Romain Raveaux
Sommaire 1°) Description du projet 2°) Analyse automatique du document graphique Extraction d’information 3°) Prétraitements 4°) Les espaces couleurs 5°) La segmentation couleur 6°) Conclusion et prospection
Description du projet Objectif : Développer les recherches concernant l’espace urbain parisien. Des logiciels de reconnaissance des formes adaptés aux plans cadastraux anciens Un SIG (Système d’Information Géographique) L’espace urbain parisien du XIVème et du siècle XIXème. Interprétation sémantique des plans cadastraux de l’Atlas Vasserot. Projet pluridisciplinaires : Des Historiens médiévistes. Des géographes spécialisés en géomatique. Des historiens d’art spécialistes de Paris. Des informaticiens spécialisés en reconnaissance des formes et vectorisation.
Sommaire 1°) Description du projet 2°) Analyse automatique du document graphique Extraction d’information 3°) Prétraitements 4°) Les espaces couleurs 5°) La segmentation couleur 6°) Conclusion et prospection
Analyse automatique du document graphique « Quand l’information fait sens. »1 Apporter une information de sens à des amas de données inertes. La rétro conversion : Passer d’un document numérisé, sous forme de pixels bruts, à son interprétation sémantique. 1Francisco Varela, « Autonomie et Connaissance »
Extraction d’information Les parcelles en reprenant l’unité de couleur. La présence d’un numéro de rue (et éventuellement la reconnaissance du numéro) Le filaire des rues 19e Le filaire des rues 14e
Extraction du filaire des rues Extraction du parcellaire Localisation des numéros des rues
Analyse automatique du document graphique Prétraitements Extraction de sens Formalisme de l’information
Sommaire 1°) Description du projet 2°) Analyse automatique du document graphique Extraction d’information 3°) Prétraitements 4°) Les espaces couleurs 5°) La segmentation couleur 6°) Conclusion et prospection
Prétraitements Améliorer la qualité de l’image : Rehausser les couleurs. Lutter contre l’affadissement des pigments couleurs. Diminuer les bruits.
Restauration d’image Théorie du monde blanc Avant Après
Restauration d’image Extension dynamique Avant Après
Restauration d’image Anti-affadissement Avant Après
Filtrage Filtre Médian Avant Après
Sommaire 1°) Description du projet 2°) Analyse automatique du document graphique Extraction d’information 3°) Prétraitements 4°) Les espaces couleurs 5°) La segmentation couleur 6°) Conclusion et prospection
Sommaire : Les espaces couleurs Introduction Les espaces couleurs. RGB,La*b*,I1I2I3… Les espaces couleurs « entraînés » Les systèmes d’axes indépendants Les espaces hybrides Les espaces « artificiels » Conclusion
Introduction Cette présentation a pour but de déterminer quel espace couleur serait le plus adapté à la vectorisation des plans cadastraux du projet ALPAGE. Nous assumons l’hypothèse qu’un espace couleur est « bon » s’il permet une bonne séparabilité des ensembles chromatiques.
Caractéristiques des images Image couleur : R G B, 3 canaux, chaque canal est codé sur 8 bits. Résolution : 200 points par pouce. Illuminant : D65. Taille moyenne : 70 MO
Analyse d’image Distribution des pixels dans l’espace RGB :
Analyse d’image Histogramme 3D des couleurs RGB :
Etude des descripteurs Nous établissons la vérité terrain. 9 classes (9 couleurs) 246 pixels Distance entre pixels Soit p1, p2 deux pixels:
Etude des descripteurs
Etude des descripteurs Figure 1 : RGB Colors using Euclidean distance Figure 1 : Représentation des couleurs RGB en utilisant une métrique euclidienne.
Etude des descripteurs Figure 2 : RGB Clustering analysis Figure 2 : Analyse des clusters dans RGB. These results show some confusion within the class 5. The missclassified class5 elements are confused with the class 8. Confusion à l’intérieur de la classe 5. Les éléments mal classifiés sont mélangés avec la classe 8.
Analyse des espaces couleurs
Espaces couleurs traditionnels Nous constatons qu’il n’y a pas d’espaces couleurs qui se détachent particulièrement. Ces espaces couleurs sont adaptés aux scènes naturelles. Ils ont été établies par la CIE(Commission Internationale de l’Éclairage). Les plans cadastraux anciens sont des documents très particuliers qui nécessitent des espaces dédiés.
Espaces couleurs : « entraînés » Les espaces hybrides L’espace des systèmes d’axes indépendants(ACP) Espaces « Artificiels » apprentissage par algorithme génétique.
L’espace des systèmes d’axes indépendants Vecteurs Propres de l’ACP sur une image: PC1 = Représente la luminance. PC2 = Quant à l’axe PC2, il sépare la couleur bleue de la couleur rouge, en d’autres termes, il représente l’axe Bleu–Rouge, le coefficient vert étant négligeable. Otha et al : Approximation de la transformée de Karhunen-Loeve : Analyse en Composantes Principales : PC1 : 95,26% PC2 : 04,16% PC3 : 00,57% Doit on travailler en une dimension ? PC1.
Les espaces hybrides Les espaces hybrides décorrélés. 1. Matrice de covariance de l’ensemble des composantes disponibles (R,G,B,L,a*,b*,I1…) 2. ACP de la matrice de covariance 3. On ne garde que les 3 composantes les plus significatives. J. D. Rugna, P. Colantoni, and N. Boukala, “Hybrid color spaces appliedto image database”
Les espaces hybrides Nombre de combinaisons : Notre critère de « bon » espace hybride: Espace qui maximise un taux de reconnaissance. La méthode Faire les 13800 possibilités. Utiliser un algorithme génétique. S’affranchir des combinaisons absurdes. p = 3, le nombre d’expériences, nombre de composantes de notre espace. n = 25, le nombre de composantes disponibles.
Algorithme génétique Appliqué aux espaces hybrides
Population Une population : Un ensemble d’espaces hybrides. Un individu : Un espace hybride. Un gène : Une composante.
Initialisation Première population initialisée aléatoirement. Tirage aléatoire dans l’ensemble des composantes disponibles. Soit C l’ensemble des composantes. C = {R,G,B,L,a*,b*,u’,v’,….} Card(C) = 25.
Cross Over Soit 2 individus h1 et h2 : Génération parent Génération enfant
Mutation Soit un individu h1 Génération parent Génération enfant Tiré aléatoirement
Fitness Taux de reconnaissance Classification K-PPV Supervisé
Selection Maximiser le taux de reconnaissance. Algorithme élitiste.
Application L’AG est utilisé ici comme un outil de sélection de caractéristiques. Nous appliquons cet algorithme à une image dont nous connaissons la vérité terrain.(Apprentissage) Puis nous appliquons l’espace trouvé sur une autre image(validation).
Espaces « Artificiels » apprentissage par algorithme génétique.
Principe et Objectif Nous cherchons donc les coefficients de la matrice W qui maximisent le taux de reconnaissance obtenu par un classifieur KPPV. Apprentissage des coefficients de matrice W. Rs = a11*R+a12*G+a13*B
Problèmatique La question tourne donc en un problème d’optimisation. Le critère (taux de reconnaissance) n’est pas analytiquement calculable et n’est pas continûment dérivable. Nous optons pour une optimisation utilisant les algorithmes génétiques
Algorithme génétique Appliqué aux espaces couleurs
Population Une population : Un ensemble de matrices. Un individu : Une matrice. Un gène : une ligne(vecteur) d’une matrice.
Initialisation Première population initialisée aléatoirement. Chaque coefficient se voit attribué une valeur aléatoire compris dans l’intervalle [-1 ; 1].
Cross Over Soit 2 individus w1 et w2 : Génération parent Génération enfant Où e1 est le vecteur ligne [a1i]
Mutation Soit un individu W1 Génération parent Génération enfant aléatoirement
Fitness Taux de reconnaissance Classification K-PPV Supervisé
Selection Maximiser le taux de reconnaissance. Algorithme élitiste.
Etude des clusters L’indice silhouette moyen est augmenté. Il passe de 0.60 en RGB à 0.64 dans ce nouvel espace.
Application Nous appliquons cet algorithme à une image dont nous connaissons la vérité terrain.(Apprentissage des coefficients) Puis nous appliquons la matrice obtenue(meilleur individu) sur une autre image(validation).
Résultats des espaces avec apprentissage Apprentissage sur une base d’apprentissage. Puis test sur les éléments qui ont servi à évalué les espaces couleurs traditionnels.
Résultats des espaces avec apprentissage
Conclusions et prospections: Les espaces couleurs Les plans du projet ALPAGE sont des images très spécifiques qui nécessite un espace adapté. Au vue des résultats l’ espace entraîné avec algorithme génétique semble le plus pertinent en terme de séparabilité des données. Recul sur les résultats : les expériences ont été réalisés sur une seule image. (Apprentissage + Tests). Question: Est-ce qu’un espace entraîné sur une image sera pertinent sur l’ensemble des images. Variabilité des images. Inclure dans la vérité terrain des couleurs d’autres images. Faire l’ACP sur collection d’images, établir la matrice de covariance sur plusieurs images.
Sommaire 1°) Description du projet 2°) Analyse automatique du document graphique Extraction d’information 3°) Prétraitements 4°) Les espaces couleurs 5°) La segmentation couleur 6°) Conclusion et prospection
Segmentation d’image couleur La segmentation d'images consiste à découper une image en régions ou à extraire les contours de ces régions. Une région est une zone homogène de l'image. un ensemble de pixels possédant des propriétés communes. Pour rechercher les zones homogènes, les techniques de segmentation se basent sur la couleur et/ou la texture de l'image. Nous étudions une démarche de segmentation couleur adaptée aux plans cadastraux couleurs.
Les Algorithmes Meanshift J Segmentation (JSEG) Efficient Graph-Based Image Segmentation (EGBIS) Color Structure Code (CSC) Region Growing …
Plans cadastraux : une image couleurs pas comme les autres Les plans cadastraux ne sont pas des scènes naturelles !!!! Les plans cadastraux sont des documents graphiques structurés. Ils sont construits de manière intelligente.
Segmentation adaptée aux documents graphiques couleurs La segmentation doit tenir compte des propriétés graphiques des plans : Par exemple : Prendre en compte la logique de construction du plan. Nous introduisons ainsi de la connaissance a priori, l’approche ne sera pas générique.
Ce qu’il faut privilégier Une segmentation couleur qui tient compte de la connexité des pixels(voisinage spatial). Une approche hiérarchique : Reconstruire les régions par croissance de région en respectant la logique de construction du document. Les plans cadastraux couleurs sont des document graphiques structurés. Càd : une image couleur où la structure, la construction spatiale du document a un sens.
SMR Segmentation R. Nock, F. Nielsen: Statistical Region Merging. IEEE Trans. Pattern Anal. Mach. Intell. 26(11): 1452-1458 (2004) (Extend F. Nielsen, R. Nock: On Region Merging: The Statistical Soundness of Fast Sorting, with Applications. CVPR (2) 2003: 19-26)
Analyse d’ensembles connexes et des propriétés d’homogénéités des couleurs « Color image segmentation by analysis of subset connectedness and color homogeneity properties » L. Macaire « Evidence-based pixel labeling for color image segmentation » Patrick Vannoorenberghe
Sommaire 1°) Description du projet 2°) Analyse automatique du document graphique Extraction d’information 3°) Prétraitements 4°) Les espaces couleurs 5°) La segmentation couleur Formaliser l’information 6°) Conclusion et prospection
Formalisme de l’information Comment structurer l’information obtenue ? Sous forme vectorielle : SVG Sous forme structurelle : Graphe
Vectorisation Approximation de courbe numérique. Polygonisation Wall et Danielson. Vectorisation LOCTEAU H., RAVEAUX R., ADAM S., « Approximation of Digital Curves Using a Multi-Objective Algorithm »; Lecture Notes in Computer Science 3926, 2006.
Information Vectorielle
Information structurelle Graphe : Un Nœud est une région (Une parcelle). Deux noeuds sont reliés par un arc si l’un des deux appartient aux h proches voisins de l’autre.
Mise en correspondance d’Îlots [Îlot Matching] Îlot du 19ème siècle Îlot du 21ème siècle
Sommaire 1°) Description du projet 2°) Analyse automatique du document graphique Extraction d’information 3°) Prétraitements 4°) Les espaces couleurs 5°) La segmentation couleur 6°) Conclusion et prospection
Conclusion Travailler sur les espaces couleurs dédiés : avec « apprentissage » Prendre en compte la variabilité d’une collection d’images. Travailler sur la segmentation. Une segmentation qui tient compte des propriétés graphiques des plans : Prendre en compte la logique de construction du plan. Mettre en place une procédure (méthode & process) d’évaluation des méthodes de segmentation. Le passage à l’échelle (scalability).
Une Super Année 2007 à vous tous…