Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes.

Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes de classification dirigée pixel par pixel

Qu’est-ce qu’on cherche sur les images?
Entités spatiales : localisation + attributs Points (spots) Lignes Polygones Abstraction cartographique Ce qu’est un point, ligne, polygone : fonction de l’échelle cartographique 1/ 1/ 1/ 1/50 000

Inventaire des ressources par classification d’images
Une ressource est considérée comme une variable géographique nominale dont on cherche les catégories dans un territoire donné: Forêt/Agriculture/Sols/Roches… On adopte un système de taxinomie Dépendant du niveau du système  sous-catégories demandant souvent un ordonnancement (ex. résidentiel faible – moyenne –forte densité) On cherche les images qui, en principe, permettent de différencier les catégories de la variable selon le niveau du système de taxinomie On applique une technique d’analyse classificatoire

Inventaire des occupations du sol, des infrastructures, ressources naturelles : l’approche analogique (photo-interprétation) Carte issue de la photo-interprétation par un expert du milieu rural. Est-ce possible de réaliser une telle carte par un robot?

L’approche numérique: trois questions fondamentales
En supposant que l’on possède une image dont les caractéristiques permettent a priori d’extraire l’information recherchée Comment procéder pour localiser dans l’espace image les points, lignes, polygones? Comment procéder pour identifier la nature ou la classe d’appartenance d’un élément détecté? Est-ce que la détection/identification des éléments recherchées est exacte et exhaustive (commission / omission)?

Exemple avec les occupations du sol
On cherche: Entités spatiales : localisation + attributs Points (spots) Lignes Polygones Notre intérêt dans le projet 1

Les systèmes de taxinomie
Chaque niveau correspond à une gamme d’échelles cartographiques en commençant par les petites échelles

Choix du niveau du système de taxinomie et des images disponibles
Images utilisées projet 1 National Image Interpretability Rating Scales Résolution spatiale

Exemple : Carte d’occupation du sol – Niveau II/1:50 000
Centres commerciaux Édifices à bureaux Commerces de détail Habitation haute densité Habitation moyenne densité Habitation faible densité Équipements collectifs Industrie légère Industrie lourde Zones récréatives

La notion centrale d’une approche numérique: l’attribut numérique l’équivalent du stimuli visuel en photo-interprétation Stimuli Image analogique Image numérique Éléments fondamentaux Teinte Niveaux de gris Couleur « Hyper-couleur »  plus de trois composantes images Arrangement spatiale des teintes/couleur Texture Différentes façons de « mesurer» la texture Dimensions (longueurs, aires) Utilisation possible seulement si des objets ont été formés après traitement Forme (incluant les objets 1-D ou 2-D) Patron (Motif) Reconnaissance complexe Éléments particuliers Ombres Différentes techniques de détection Hauteur (stéréo) Introduction de données exogènes (ex. MNA) Éléments contextuels Site Certaines possibilités par introduction d’informations exogènes Association Notre intérêt dans le projet 1

Les attributs numériques facilement extractibles des images
Teinte de gris  la valeur d’un pixel d’une bande spectrale quelconque Couleur (normale/fausse)  les valeurs d’un pixel dans trois bandes spectrales Signature spectrale  variation de la valeur numérique d’un pixel dans le spectre (généralisation de la notion de la couleur) [notre intérêt dans le projet 1] Signature spatiale  variation des caractéristiques de la texture autour d’un pixel (une ou plusieurs bandes spectrales) Signature temporelle  variation de la valeur du pixel dans le temps (une ou plusieurs bandes spectrales de deux ou plus images du même territoire) Signature polarimétrique  variation de la valeur d’un pixel selon la configuration de la polarisation (applicable seulement avec des images radar; une ou plusieurs fréquences).

Approche classificatoire: plusieurs méthodes, le pus souvent reconnaissance des formes
Reconnaissance des formes (pattern recognition): branche des sciences informatiques  appliquées aux images : identifier des objets sur des images via l’extraction des trais caractéristiques (teinte/couleur, texture, etc.) d’une quantité importante des données bruitées (définition adaptée de Gonzalez, 1978) Espace d’attributs

Notre cas: la classification d’images à plusieurs canaux pixel par pixel
Chaque pixel constitue une unité géographique dont la classe est d’appartenance est recherchée Chaque pixel est caractérisé par son vecteur de mesures (pattern)

L’espace d’attributs (ou de représentation), les signatures spectrales et la classification
Ce « pattern » contient les coordonnées du pixel dans un espace de représentation ou d’attributs Dans une situation idéale, chaque classe d’objets est représentée par un point unique dans cet espace À cause des variations des conditions d'illumination ainsi que les variations des propriétés des objets, les valeurs numériques des pixels appartenant à une classe d'objets sont représentés par une série de points plus ou moins dispersés dans cet espace. Nous cherchons alors de diviser cet espace en des domaines exclusifs de chaque classe Tout pixel selon sa localisation dans l’un ou l’autre des domaines est assigné à la classe appropriée

Un exemple: quatre domaines ont été identifiés, le pixel X dont la classe est recherchée, est représenté dans l’espace d’attributs. Il tombe dans le domaine de feuillus…la classe feuillus lui est alors assignée F C B Bande 1 Bande 2 S x F : feuillus C : conifères B : béton S : sol à nu

Le problème de classification
COMMENT DÉFINIR LE DOMAINE DE CHAQUE CLASSE? DEUX APPROCHES: DIRIGÉE: un échantillon de pixels dont la classe est connue est analysé afin de définir les domaines des classes NON-DIRIGÉE: un échantillon de pixels est analysé afin de définir des groupements de pixels dans l’espace d’attributs. Chaque groupement (cluster) définit un domaine dont la signification géographique reste à établir NOTA: Dans la littérature française une classification dirigée est appelée classement tandis que le terme classification est réservé à la classification non dirigée.

Notre cas: la classification dirigée
La plupart des classificateurs dirigées adoptent une vision probabiliste de ce qu’une classe et se fondent sur une règle d’attribution d’un vecteur de mesures (pattern) à une classe: la règle de Bayes Probabilité a posteriori = (vraisemblance x probabilité a priori)/évidence

La règle de BAYES: un exemple
Estimation de la probabilités a priori: P(H1) = Étendue du bassin 1/Total = 18/28 = 0,64 P(H2) = Étendue du bassin 2/Total = 10/28 = 0,36 Probabilité conditionnelle (VRAISEMBLANCE): par une carte géologique il calcule que 35% des roches du Crétacé dans le bassin 1 est d’origine marine tandis que 80% le sont dans le bassin 2 P (E|H1) = 0,35; P(E|H2)=0,80 Évidence = P(E|H1)*P(H1) + P(E|H2)*P(H2)= (0,35 *0,64 + 0,80*0,36) = 0,51 Conclusion: On fait nos fouilles en premier dans le bassin 2 car sa probabilité a posteriori est plus grande: P(H1|E) = 0,35*0,64/0,51 = 0,44 P(H2|E) = 0,80*0,36/0,51 = 0,56 Un paléontologue trouve un fragment d’un fossile d’un animal marin dans la zone de jonction des deux ruisseaux. Dans quel bassin versant se trouvent des restes plus complets de cet animal? H1: le bassin du ruisseau 1 qui est de 18 km2 H2: le bassin du ruisseau 2 qui est de 10 km2 La règle de Bayes: P (H1|E) = probabilité a posteriori étant donné le fossile E, ceci provient du bassin H1 P (H2|E) = probabilité a posteriori étant donné le fossile E, ceci provient du bassin H2 Attribue le fossile au bassin qui maximise la probabilité à posteriori.

Les problèmes d’application dans le cas des images de télédétection
La probabilité a priori par classe: problème relativement mineur  dans le cas des occupations du sol estimation par une carte existante La probabilité conditionnelle (vraisemblance) : Problème majeur  deux approches : Paramétrique: les signatures spectrales d’une classe quelconque sont distribuées dans l’espace d’attributs selon une loi de distribution de densité de probabilité connue: nos échantillons nous permettent d’estimer les paramètres de cette distribution [notre cas dans le projet 1] Non paramétrique: la densité de probabilité est évaluée localement dans l’espace d’attributs selon nos échantillons sans faire une hypothèse sur la loi de distribution de la densité de probabilité par classe

Solution paramétrique: le plus souvent la distribution multinormale (souvent vérifiée avec les données de télédétection et la seule qui se prête à des calculs avec des données multidimensionnelles) Cas univarié Cas multivarié 𝜇 =𝑣𝑒𝑐𝑡𝑒𝑢𝑟 𝑑𝑒𝑠 𝑚𝑜𝑦𝑒𝑛𝑛𝑒𝑠 Les paramètres Σ=𝑚𝑎𝑡𝑟𝑖𝑐𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 −𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑝 𝑥 = 1 𝜎 2𝜋 𝑒 − 𝑥−𝜇 𝜎 2 𝑥 =𝑣𝑒𝑐𝑡𝑒𝑢𝑟 𝑑𝑒𝑠 𝑣𝑎𝑙𝑒𝑢𝑟𝑠 𝑑𝑢 𝑝𝑖𝑥𝑒𝑙 𝑒𝑥𝑎𝑚𝑖𝑛é N = dimension de l’espace d’attributs Σ =𝑑é𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑛𝑡 𝑑𝑒 𝑙𝑎 𝑚𝑎𝑡𝑟𝑖𝑐𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 −𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒

Comment appliquer la règle de Bayes dans le cas paramétrique en présence de deux ou plus classes
L’espace d’attributs nous indique qu’il y a un mélange des distributions multinormales (pics des fréquences d’occurrence conjointe des valeurs numériques) On fournit des patterns appartenant à chacune des classes recherchées (prototypes) ainsi que les probabilités a priori de chacune de classe; Les paramètres de la distribution multinormale sont calculés par les prototypes; L’application de la formule nous permet d’évaluer la probabilité conjointe d’appartenance à chacune des classes; La loi de Bayes est alors appliquée pour calculer la probabilité a posteriori et le tour est joué

La règle de BAYES avec des attributs numériques : un exemple
La vraisemblance (probabilité conditionnelle) de trois classes d’objets sur une image suit la loi normale avec les paramètres suivants: ω1 10 (±1,5) ; ω2 15(±1,5) ;ω3 20(±2,5). À quelle classe on attribuera les pixels ayant comme valeur numérique x: 5, 7, 10, 11, 12, 15, 17, 20, 25 ? Vraisemblance calculée par la formule standard d’une distribution normale Valeur (x) Classe 1 (ω1 ) Classe 2(ω2 ) Classe 3(ω3 ) Décision 5 Classe 1 7 10 11 12 Classe 2 15 17 20 Classe 3 25 Probabilités a posteriori selon la règle de Bayes : pour chaque x la somme des ces probabilités est égale à 1. Évidence calculée avec les probabilités a priori pour les trois classes : 1/6 ; 3/6 ; 2/6. 𝑃 𝑥 = 1 𝜎 2𝜋 𝑒 − 𝑥−𝜇 𝜎 2 Probabilité a posteriori

Formulation: calculs Règle de Bayes
On peut simplifier les calculs en ignorant l’évidence (la même pour toutes les classes) Pour appliquer cette règle à la classification nous devons connaître la vraisemblance et la probabilité a priori par classe

Un exemple avec une image TM et une classe d’objets
Vecteur des moyennes Matrice de variance-covariance TM1 TM2 TM3 TM4 TM5 TM6 47.65 24.76 15.70 35.71 20.34 31.91 12.45 8.27 12.01 20.56 34.71 23.79 38.81 22.30 114.89 30.46 18.70 30.86 12.99 60.63 44.92

Formulation : calculs Ainsi en remplaçant la vraisemblance par la formule de la distribution multinormale et en prenant les logarithmes naturelles nous pouvons arriver à la formulation de la règle de décision du classificateur (fonctions discriminantes)

Fonctions discriminantes

PCI offre plusieurs variantes de classification paramétrique (multi-normale)
Bayes (avec probabilité à priori  Bias) Maximum de vraisemblance (probabilité a priori égale  Bias =1.00) Classification par parallélépipède (on ignore la covariance seulement l’écart type par attribut) Classification par distance minimale (on ignore la variance et la covariance)

Distance minimale  le vecteur des moyennes par échantillon représente la classe
Etc. Parmi ces distances quelle est la plus courte? Assigne le pixel 1 à la classe pour laquelle la distance est minimale Segmentation implicite de l’espace d’attributs (polygones de Voronoï)

La classification par parallélépipèdes

La classification par maximum de vraisemblance

Un exemple Image SPOT-5 à 4 bandes spectrales: Vert, rouge, PIR, IROC1
Image Classifiée par Maximum de Vraisemblance (7 classes)

Les sites d’entraînement
On fournit des « prototypes » par classe  sites d’entraînement Règles: Par classe les sites doivent totaliser plus que 30 pixels Ils doivent être pris à différents endroits sur l’image pour capter la variabilité intra-classe Asphalte Asphalte fraîche Vieille asphalte

Statistiques (signatures spectrales) et tests de qualité

Statistiques (signatures spectrales) et tests de qualité
La séparabilité mesure le degré de chevauchement entre deux distributions multinormales chacune représentant la densité de probabilité d’une classe donnée. Plus ces distributions sont éloignées moins d’erreurs de classification seront commises. Exemple ici avec une seule bande spectrale : la classe A présente un certain chevauchement (zone grise) avec la classe B mais il est bien éloignée de la classe C. Donc bonne séparabilité entre A et C mais risques d’erreur entre A et B et éventuellement, dépendant de l’algorithme de classification, des pixels non classifiés Distance de Bhattacharrya Divergence transformée Les deux mesures proposées par GEOMATICA utilisent des formulations différentes impliquant les moyennes et les matrices de variance-covariance par paire de classes. Toutes deux nous donnent la valeur 2 si les classes sont bien éloignées et 0 si les deux classes sont identiques. Généralement avec une valeur <1.5 (pour d’autres 1.7) nous pouvons s’attendre à des confusions importantes entre les deux classes

Test de classification: aperçu avant la classification finale
Maximum de vraisemblance sans classe nulle Maximum de vraisemblance avec classe nulle Distance minimale Parallélépipède Parallélépipède avec MV en cas de chevauchement

Classification avec validation finale des sites d’entraînement
Si la qualité des sites d’entraînement est acceptable on passe à la classification et à la validation finale des sites d’entraînement. Si l’on est satisfait on passe à la validation finale, sinon on recommence avec le choix des sites

Classification avec validation finale des sites d’entraînements
MV avec classe nulle

Classification avec validation finale des sites d’entraînements

Validation finale: pixels choisis au hasard
Document auxiliaire

Validation finale

Mesures de qualité de la classification

Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes.

Présentations similaires

Présentation au sujet: "Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes.

Présentations similaires

Présentation au sujet: "Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes."— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back