Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes.

Slides:



Advertisements
Présentations similaires
Traitement d’images : concepts avancés
Advertisements

Regroupement (clustering)
Champs de Markov en Vision par Ordinateur
Regroupement (clustering)
RECONNAISSANCE DE FORMES
Soizic Geslin Samy Fouilleux Minh Le Hoai Maxime Chambreuil
Collecte de données F. Kohler.
C1 Bio-statistiques F. KOHLER
Comparaison de deux moyennes observées
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Les TESTS STATISTIQUES
Modèle Entités-Associations
Photographie aérienne
Les TESTS STATISTIQUES
3. Analyse et estimation du mouvement dans la vidéo
Didactique des Sciences de l'Ingénieur
M. EL Adel & M. Ouladsine LSIS – UMR-CNRS 6168 Marseille - France
Maria-João Rendas CNRS – I3S Novembre 2006
Master Informatique 2ème année
Module SIG-Santé 15. Modélisation Marc SOURIS
Traitement de données socio-économiques et techniques d’analyse :
Support Vector Machine
Initiation à la conception de systèmes d'information
Concepts avancés en mathématiques et informatique appliquées
Les structures de marché
Groupe 1: Classes de même intervalle
Construction de modèles visuels
La segmentation
Rappel... Solution itérative de systèmes linéaires (suite et fin).
DEA Perception et Traitement de l’Information
RECONNAISSANCE DE FORMES
Comprendre la variation dans les données: Notions de base
Mesures de répartition de la population Claude Marois 2012.
Design dun système de vision embarqué. Application:
RECONNAISSANCE DE FORMES
Structure discriminante (analyse discriminante)
RECONNAISSANCE DE FORMES
Classification: signatures spectrales
Le filtrage d’images.
Interprétation automatique
La régression multiple
Classification d’images
Mise-à-jour de données de haute incertitude spatiale Présentation dans le cadre du groupe de discussion sur la fusion de données géospatiales – 22 nov.
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Classification : objectifs
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Extraction de segments pour la reconnaissance de symboles : Une approche robuste par Transformée de Hough Présenté par : Simon BERNARD Encadré par : Jean-Marc.
Étude de l’écoulement moyen
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
L’erreur standard et les principes fondamentaux du test de t
Méthode des moindres carrés (1)
systèmes d’information géographique
Chapitre 4 Variables aléatoires discrètes
Rappel de statistiques
Post-optimisation, analyse de sensibilité et paramétrage
Traitement d’images 420-D78-SW A15 Semaine 02.
Analyse des semis de point
Modélisation du signal de télédétection
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
Probabilités et statistique MQT-1102
Validation d’une méthode d’analyse
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
ECHANTILLONAGE ET ESTIMATION
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Conversion des luminances en températures dans le cas des images du rayonnement émis par les objets.
Comparaison post-classification. Le problème du projet 3 Les changements du couvert arborescent dans le territoire urbain (zone blanche) de la Communauté.
Transcription de la présentation:

Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes de classification dirigée pixel par pixel

Qu’est-ce qu’on cherche sur les images? Entités spatiales : localisation + attributs Points (spots) Lignes Polygones Abstraction cartographique Ce qu’est un point, ligne, polygone : fonction de l’échelle cartographique 1/1 000 000 1/500 000 1/250 000 1/50 000

Inventaire des ressources par classification d’images Une ressource est considérée comme une variable géographique nominale dont on cherche les catégories dans un territoire donné: Forêt/Agriculture/Sols/Roches… On adopte un système de taxinomie Dépendant du niveau du système  sous-catégories demandant souvent un ordonnancement (ex. résidentiel faible – moyenne –forte densité) On cherche les images qui, en principe, permettent de différencier les catégories de la variable selon le niveau du système de taxinomie On applique une technique d’analyse classificatoire

Inventaire des occupations du sol, des infrastructures, ressources naturelles : l’approche analogique (photo-interprétation) Carte issue de la photo-interprétation par un expert du milieu rural. Est-ce possible de réaliser une telle carte par un robot?

L’approche numérique: trois questions fondamentales En supposant que l’on possède une image dont les caractéristiques permettent a priori d’extraire l’information recherchée Comment procéder pour localiser dans l’espace image les points, lignes, polygones? Comment procéder pour identifier la nature ou la classe d’appartenance d’un élément détecté? Est-ce que la détection/identification des éléments recherchées est exacte et exhaustive (commission / omission)?

Exemple avec les occupations du sol On cherche: Entités spatiales : localisation + attributs Points (spots) Lignes Polygones Notre intérêt dans le projet 1

Les systèmes de taxinomie Chaque niveau correspond à une gamme d’échelles cartographiques en commençant par les petites échelles

Choix du niveau du système de taxinomie et des images disponibles Images utilisées projet 1 National Image Interpretability Rating Scales http://fas.org/irp/imint/niirs.htm Résolution spatiale

Exemple : Carte d’occupation du sol – Niveau II/1:50 000 Centres commerciaux Édifices à bureaux Commerces de détail Habitation haute densité Habitation moyenne densité Habitation faible densité Équipements collectifs Industrie légère Industrie lourde Zones récréatives

La notion centrale d’une approche numérique: l’attribut numérique l’équivalent du stimuli visuel en photo-interprétation Stimuli   Image analogique Image numérique Éléments fondamentaux Teinte Niveaux de gris Couleur « Hyper-couleur »  plus de trois composantes images Arrangement spatiale des teintes/couleur Texture Différentes façons de « mesurer» la texture Dimensions (longueurs, aires) Utilisation possible seulement si des objets ont été formés après traitement Forme (incluant les objets 1-D ou 2-D) Patron (Motif) Reconnaissance complexe Éléments particuliers Ombres Différentes techniques de détection Hauteur (stéréo) Introduction de données exogènes (ex. MNA) Éléments contextuels Site Certaines possibilités par introduction d’informations exogènes Association Notre intérêt dans le projet 1

Les attributs numériques facilement extractibles des images Teinte de gris  la valeur d’un pixel d’une bande spectrale quelconque Couleur (normale/fausse)  les valeurs d’un pixel dans trois bandes spectrales Signature spectrale  variation de la valeur numérique d’un pixel dans le spectre (généralisation de la notion de la couleur) [notre intérêt dans le projet 1] Signature spatiale  variation des caractéristiques de la texture autour d’un pixel (une ou plusieurs bandes spectrales) Signature temporelle  variation de la valeur du pixel dans le temps (une ou plusieurs bandes spectrales de deux ou plus images du même territoire) Signature polarimétrique  variation de la valeur d’un pixel selon la configuration de la polarisation (applicable seulement avec des images radar; une ou plusieurs fréquences).

Approche classificatoire: plusieurs méthodes, le pus souvent reconnaissance des formes Reconnaissance des formes (pattern recognition): branche des sciences informatiques  appliquées aux images : identifier des objets sur des images via l’extraction des trais caractéristiques (teinte/couleur, texture, etc.) d’une quantité importante des données bruitées (définition adaptée de Gonzalez, 1978) Espace d’attributs

Notre cas: la classification d’images à plusieurs canaux pixel par pixel Chaque pixel constitue une unité géographique dont la classe est d’appartenance est recherchée Chaque pixel est caractérisé par son vecteur de mesures (pattern)

L’espace d’attributs (ou de représentation), les signatures spectrales et la classification Ce « pattern » contient les coordonnées du pixel dans un espace de représentation ou d’attributs Dans une situation idéale, chaque classe d’objets est représentée par un point unique dans cet espace À cause des variations des conditions d'illumination ainsi que les variations des propriétés des objets, les valeurs numériques des pixels appartenant à une classe d'objets sont représentés par une série de points plus ou moins dispersés dans cet espace. Nous cherchons alors de diviser cet espace en des domaines exclusifs de chaque classe Tout pixel selon sa localisation dans l’un ou l’autre des domaines est assigné à la classe appropriée

Un exemple: quatre domaines ont été identifiés, le pixel X dont la classe est recherchée, est représenté dans l’espace d’attributs. Il tombe dans le domaine de feuillus…la classe feuillus lui est alors assignée F C B Bande 1 Bande 2 S x F : feuillus C : conifères B : béton S : sol à nu

Le problème de classification COMMENT DÉFINIR LE DOMAINE DE CHAQUE CLASSE? DEUX APPROCHES: DIRIGÉE: un échantillon de pixels dont la classe est connue est analysé afin de définir les domaines des classes NON-DIRIGÉE: un échantillon de pixels est analysé afin de définir des groupements de pixels dans l’espace d’attributs. Chaque groupement (cluster) définit un domaine dont la signification géographique reste à établir NOTA: Dans la littérature française une classification dirigée est appelée classement tandis que le terme classification est réservé à la classification non dirigée.

Notre cas: la classification dirigée La plupart des classificateurs dirigées adoptent une vision probabiliste de ce qu’une classe et se fondent sur une règle d’attribution d’un vecteur de mesures (pattern) à une classe: la règle de Bayes Probabilité a posteriori = (vraisemblance x probabilité a priori)/évidence

La règle de BAYES: un exemple Estimation de la probabilités a priori: P(H1) = Étendue du bassin 1/Total = 18/28 = 0,64 P(H2) = Étendue du bassin 2/Total = 10/28 = 0,36 Probabilité conditionnelle (VRAISEMBLANCE): par une carte géologique il calcule que 35% des roches du Crétacé dans le bassin 1 est d’origine marine tandis que 80% le sont dans le bassin 2 P (E|H1) = 0,35; P(E|H2)=0,80 Évidence = P(E|H1)*P(H1) + P(E|H2)*P(H2)= (0,35 *0,64 + 0,80*0,36) = 0,51 Conclusion: On fait nos fouilles en premier dans le bassin 2 car sa probabilité a posteriori est plus grande: P(H1|E) = 0,35*0,64/0,51 = 0,44 P(H2|E) = 0,80*0,36/0,51 = 0,56 Un paléontologue trouve un fragment d’un fossile d’un animal marin dans la zone de jonction des deux ruisseaux. Dans quel bassin versant se trouvent des restes plus complets de cet animal? H1: le bassin du ruisseau 1 qui est de 18 km2 H2: le bassin du ruisseau 2 qui est de 10 km2 La règle de Bayes: P (H1|E) = probabilité a posteriori étant donné le fossile E, ceci provient du bassin H1 P (H2|E) = probabilité a posteriori étant donné le fossile E, ceci provient du bassin H2 Attribue le fossile au bassin qui maximise la probabilité à posteriori.

Les problèmes d’application dans le cas des images de télédétection La probabilité a priori par classe: problème relativement mineur  dans le cas des occupations du sol estimation par une carte existante La probabilité conditionnelle (vraisemblance) : Problème majeur  deux approches : Paramétrique: les signatures spectrales d’une classe quelconque sont distribuées dans l’espace d’attributs selon une loi de distribution de densité de probabilité connue: nos échantillons nous permettent d’estimer les paramètres de cette distribution [notre cas dans le projet 1] Non paramétrique: la densité de probabilité est évaluée localement dans l’espace d’attributs selon nos échantillons sans faire une hypothèse sur la loi de distribution de la densité de probabilité par classe

Solution paramétrique: le plus souvent la distribution multinormale (souvent vérifiée avec les données de télédétection et la seule qui se prête à des calculs avec des données multidimensionnelles) Cas univarié Cas multivarié 𝜇 =𝑣𝑒𝑐𝑡𝑒𝑢𝑟 𝑑𝑒𝑠 𝑚𝑜𝑦𝑒𝑛𝑛𝑒𝑠 Les paramètres Σ=𝑚𝑎𝑡𝑟𝑖𝑐𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 −𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑝 𝑥 = 1 𝜎 2𝜋 𝑒 − 𝑥−𝜇 2 2 𝜎 2 𝑥 =𝑣𝑒𝑐𝑡𝑒𝑢𝑟 𝑑𝑒𝑠 𝑣𝑎𝑙𝑒𝑢𝑟𝑠 𝑑𝑢 𝑝𝑖𝑥𝑒𝑙 𝑒𝑥𝑎𝑚𝑖𝑛é N = dimension de l’espace d’attributs Σ =𝑑é𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑛𝑡 𝑑𝑒 𝑙𝑎 𝑚𝑎𝑡𝑟𝑖𝑐𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 −𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒

Comment appliquer la règle de Bayes dans le cas paramétrique en présence de deux ou plus classes L’espace d’attributs nous indique qu’il y a un mélange des distributions multinormales (pics des fréquences d’occurrence conjointe des valeurs numériques) On fournit des patterns appartenant à chacune des classes recherchées (prototypes) ainsi que les probabilités a priori de chacune de classe; Les paramètres de la distribution multinormale sont calculés par les prototypes; L’application de la formule nous permet d’évaluer la probabilité conjointe d’appartenance à chacune des classes; La loi de Bayes est alors appliquée pour calculer la probabilité a posteriori et le tour est joué

La règle de BAYES avec des attributs numériques : un exemple La vraisemblance (probabilité conditionnelle) de trois classes d’objets sur une image suit la loi normale avec les paramètres suivants: ω1 10 (±1,5) ; ω2 15(±1,5) ;ω3 20(±2,5). À quelle classe on attribuera les pixels ayant comme valeur numérique x: 5, 7, 10, 11, 12, 15, 17, 20, 25 ? Vraisemblance calculée par la formule standard d’une distribution normale Valeur (x) Classe 1 (ω1 ) Classe 2(ω2 ) Classe 3(ω3 ) Décision 5 0.99784 0.00216 0.00000 Classe 1 7 0.99444 0.00555 0.00001 10 0.90970 0.08993 0.00037 11 0.72329 0.27505 0.00166 12 0.35788 0.63588 0.00624 Classe 2 15 0.00160 0.93119 0.06721 17 0.70027 0.29972 20 0.07611 0.92389 Classe 3 25 0.00005 0.99995 Probabilités a posteriori selon la règle de Bayes : pour chaque x la somme des ces probabilités est égale à 1. Évidence calculée avec les probabilités a priori pour les trois classes : 1/6 ; 3/6 ; 2/6. 𝑃 𝑥 = 1 𝜎 2𝜋 𝑒 − 𝑥−𝜇 2 2 𝜎 2 Probabilité a posteriori

Formulation: calculs Règle de Bayes On peut simplifier les calculs en ignorant l’évidence (la même pour toutes les classes) Pour appliquer cette règle à la classification nous devons connaître la vraisemblance et la probabilité a priori par classe

Un exemple avec une image TM et une classe d’objets Vecteur des moyennes Matrice de variance-covariance   TM1 TM2 TM3 TM4 TM5 TM6 47.65 24.76 15.70 35.71 20.34 31.91 12.45 8.27 12.01 20.56 34.71 23.79 38.81 22.30 114.89 30.46 18.70 30.86 12.99 60.63 44.92

Formulation : calculs Ainsi en remplaçant la vraisemblance par la formule de la distribution multinormale et en prenant les logarithmes naturelles nous pouvons arriver à la formulation de la règle de décision du classificateur (fonctions discriminantes)

Fonctions discriminantes

PCI offre plusieurs variantes de classification paramétrique (multi-normale) Bayes (avec probabilité à priori  Bias) Maximum de vraisemblance (probabilité a priori égale  Bias =1.00) Classification par parallélépipède (on ignore la covariance seulement l’écart type par attribut) Classification par distance minimale (on ignore la variance et la covariance)

Distance minimale  le vecteur des moyennes par échantillon représente la classe Etc. Parmi ces distances quelle est la plus courte? Assigne le pixel 1 à la classe pour laquelle la distance est minimale Segmentation implicite de l’espace d’attributs (polygones de Voronoï)

La classification par parallélépipèdes

La classification par maximum de vraisemblance

Un exemple Image SPOT-5 à 4 bandes spectrales: Vert, rouge, PIR, IROC1 Image Classifiée par Maximum de Vraisemblance (7 classes)

Les sites d’entraînement On fournit des « prototypes » par classe  sites d’entraînement Règles: Par classe les sites doivent totaliser plus que 30 pixels Ils doivent être pris à différents endroits sur l’image pour capter la variabilité intra-classe Asphalte Asphalte fraîche Vieille asphalte

Statistiques (signatures spectrales) et tests de qualité

Statistiques (signatures spectrales) et tests de qualité La séparabilité mesure le degré de chevauchement entre deux distributions multinormales chacune représentant la densité de probabilité d’une classe donnée. Plus ces distributions sont éloignées moins d’erreurs de classification seront commises. Exemple ici avec une seule bande spectrale : la classe A présente un certain chevauchement (zone grise) avec la classe B mais il est bien éloignée de la classe C. Donc bonne séparabilité entre A et C mais risques d’erreur entre A et B et éventuellement, dépendant de l’algorithme de classification, des pixels non classifiés Distance de Bhattacharrya  Divergence transformée Les deux mesures proposées par GEOMATICA utilisent des formulations différentes impliquant les moyennes et les matrices de variance-covariance par paire de classes. Toutes deux nous donnent la valeur 2 si les classes sont bien éloignées et 0 si les deux classes sont identiques. Généralement avec une valeur <1.5 (pour d’autres 1.7) nous pouvons s’attendre à des confusions importantes entre les deux classes

Test de classification: aperçu avant la classification finale Maximum de vraisemblance sans classe nulle Maximum de vraisemblance avec classe nulle Distance minimale Parallélépipède Parallélépipède avec MV en cas de chevauchement

Classification avec validation finale des sites d’entraînement Si la qualité des sites d’entraînement est acceptable on passe à la classification et à la validation finale des sites d’entraînement. Si l’on est satisfait on passe à la validation finale, sinon on recommence avec le choix des sites

Classification avec validation finale des sites d’entraînements MV avec classe nulle

Classification avec validation finale des sites d’entraînements

Validation finale: pixels choisis au hasard Document auxiliaire

Validation finale

Mesures de qualité de la classification