Classification d’images

Slides:



Advertisements
Présentations similaires
Introduction à l’analyse
Advertisements

Regroupement (clustering)
Regroupement (clustering)
RECONNAISSANCE DE FORMES
Les tests d’hypothèses (I)
Inférence statistique
C1 Bio-statistiques F. KOHLER
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
Comparaison de plusieurs moyennes observées
Photographie aérienne
Nombre de sujets nécessaires en recherche clinique
3. Analyse et estimation du mouvement dans la vidéo
Les tests d’hypothèses
Régression -corrélation
Modélisation des systèmes non linéaires par des SIFs
variable aléatoire Discrète
Traitements d'images et Vision par ordinateur
Tests de comparaison de moyennes
Zone de rejet et scoring
Décodage des informations
Méthode des k plus proches voisins
Construction de modèles visuels
La segmentation
DEA Perception et Traitement de l’Information
Comprendre la variation dans les données: Notions de base
Transformations-modifications dimages multispectrales.
Design dun système de vision embarqué. Application:
Algorithmes probabilistes
1. Étude des caractéristiques du mouvement de Vénus
Classification: signatures spectrales
Interprétation automatique
La régression multiple
Filtrage de Kalman et aperçu probabiliste
Régression linéaire (STT-2400)
l’algorithme du simplexe
Présentation de la méthode des Eléments Finis
Régression linéaire multiple : hypothèses & tests. Partie 3.
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Segmentation (1ère partie)
Introduction à la reconnaissance:
Eléments d’arithmétique dans l’ensemble des naturels
Les espaces couleurs Dans le cadre du projet ALPAGE.
Statistique Descriptive Analyse des données
Probabilités et Statistiques
Comportement des gaz.
Deux sujets traités La segmentation d’images
Physique 3 Vibrations linéaires et ondes mécaniques
Caractérisation texturale des surfaces boisées dans une image Ikonos de la région de Montréal Pierre Bugnet Langis.
Rappels de statistiques descriptives
Outils mathématiques pour le datamining
Mise-à-jour de données de haute incertitude spatiale Présentation dans le cadre du groupe de discussion sur la fusion de données géospatiales – 22 nov.
Les satellites Le rayonnement solaire réfléchi par les objets
PRINCIPE DES TESTS D’HYPOTHÈSE
Classification : objectifs
Présentation du marché obligataire
Micro-intro aux stats.
Étude de l’écoulement moyen
Méthode des moindres carrés (1)
Chapitre 4 Variables aléatoires discrètes
Traitement de la turbulence
MATIÈRE Initiation aux images satellitales de résolution spatiale moyenne à haute: images du rayonnement solaire réfléchi Le rayonnement solaire.
Modélisation du signal de télédétection
Détecter les groupes à hauts risques cardiaques à partir de caractéristiques telles que l’alimentation, le fait de fumer ou pas, les antécédents familiaux.
ECHANTILLONAGE ET ESTIMATION
Cartographie thématique: extraction de l’information géographique qualitative des images numériques de télédétection Familiarisation avec les méthodes.
MECANIQUE DES MILLIEUX CONTINUS ET THERMODYDAMIQUE SIMULATIONS.
Conversion des luminances en températures dans le cas des images du rayonnement émis par les objets.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Comparaison post-classification. Le problème du projet 3 Les changements du couvert arborescent dans le territoire urbain (zone blanche) de la Communauté.
Transcription de la présentation:

Classification d’images Module 4 Classification d’images

cartes d’inventaire Cartographie topographique (planimétrie) Cartographie géologique Cartographie géomorphologique Cartographie forestière Cartographie des occupations/utilisations des sols …..

Qu’est-ce qu’on cherche? Entités discrètes - avec limites matérialisées physiquement: bâtiments, réseau routier, etc.; - avec limites définies par nous: peuplements forestiers, lacs et rivières, etc.

Comment on opère avec une approche de classification pixel par pixel? Espace d’attributs

La classification pixel par pixel: plusieurs questions Système de taxinomie  à quel niveau du système nous voulons opérer? Quelle est l’imagerie qui répond au mieux à ce que l’on cherche? Comment former l’espace d’attributs (traits caractéristiques) ? Quelle technique de segmentation de l’espace d’attributs utiliser?

Système de taxinomie: un exemple Occupation/utilisation des sols

Carte du serveur métropolitain Cartes d’occupation du sol selon différents critères de taxinomie Carte du serveur métropolitain 1:50 000 (11 taxons) Carte de la CUM 1:50 000 (19 taxons)

Caractéristiques des images Les résolutions de l’image, notamment spatiale, doivent être adaptées aux entités recherchées

Choix du système de taxinomie et des classes

Les niveaux des systèmes de taxinomie atteignables par photo-interprétation souvent difficiles à atteindre par classification pixel par pixel Ainsi on simplifie, on modifie les classes pour adapter notre système de taxinomie à la classification pixel par pixel - ex. carte des milieux humides par classification d’images Landsat

Formation de l’espace d’attributs  l’équivalent de la combinaison des stimuli visuels utilisés en photo-interprétation Éléments d’interprétation visuelle Éléments primaires Teinte de grisé Couleur Arrangement spatial des teintes et des couleurs Taille Forme Texture Pattern Éléments particuliers Ombres Hauteur (stéréo) Éléments contextuels Site Association

Tous ces traits caractéristiques ne sont pas utilisables lors d’une classification pixel par pixel La puissance de la classification pixel par pixel est grande si l’espace est formé par un grand nombre d’attributs  les signatures

Les signatures Signatures spectrales variation de la valeur numérique d’un pixel dans le spectre Signatures spatiales Divers attributs de texture autour d’un pixel Signatures polarimétriques variation de la valeur d’un pixel selon la configuration de la polarisation (radar) Signatures temporelles …. variation de la valeur du pixel dans le temps

Exploiter les données multidimensionnelles Chaque pixel est caractérisée par son vecteur de mesures (pattern)  les coordonnées du pixel dans l’espace d’attributs

Classification: signatures spectrales

L’espace de représentation et les méthodes de classification Dans une situation idéale, chaque classe d’objets est représentée par un point unique dans cet espace. À cause des variations des conditions d'illumination ainsi que les variations des propriétés des objets, les pixels appartenant à une classe d'objets sont représentés par une série de points plus ou moins dispersés dans cet espace. Les méthodes de classification visent à définir les équations mathématiques qui permettent de localiser dans cet espace les limites de chacune des classes

Un exemple: quatre domaines ont été identifiés, le pixel X dont la classe est recherchée, est représenté dans l’espace d’attributs. Il tombe dans le domaine de feuillus…la classe feuillus lui est alors assignée F C B Bande 1 Bande 2 S x F : feuillus C : conifères B : béton S : sol à nu

Le problème de classification COMMENT DÉFINIR LE DOMAINE DE CHAQUE CLASSE???? DEUX APPROCHES: DIRIGÉE : un échantillon de pixels dont la classe est connue est analysé afin de définir les domaines NON-DIRIGÉE: un échantillon de pixels est analysé afin de définir des groupements de pixels dans l’espace d’attributs. Chaque groupement (cluster) définit un domaine dont la signification géographique reste à établir

La classification dirigée

La classification par distance minimale : un exemple simple Hypothèse: le domaine d’une classe est défini en fonction de la proximité de tous les points du domaine à un point central: distance euclidienne l’analyste fournit des échantillons de pixels par classe L’algorithme calcule le centre de chaque classe (moyennes) Illustration

Distance minimale Etc. Parmi ces distances quelle est la plus courte? Assigne le pixel 1 à la classe pour laquelle la distance est minimale

Les domaines des classes

Exemple: image SPOT à 4 bandes

Diffusiogrammes ROUGE-PIR Image entière

Choix de pixels échantillons Classes: Eau; Gazon; Boisés; Sol à nu; Bâti; Surfaces pavées.

Diffusiogrammes ROUGE-PIR Image entière EAU

Diffusiogrammes ROUGE-PIR Image entière GAZON

Diffusiogrammes ROUGE-PIR Image entière BOISÉ

Diffusiogrammes ROUGE-PIR Image entière SOL À NU

Diffusiogrammes ROUGE-PIR Image entière BÂTI

Diffusiogrammes ROUGE-PIR Image entière SURFACES PAVÉES

CLASSIFICATION FINALE

La classification par parallélépipèdes Hypothèse: le domaine d’une classe est défini en fonction de la proximité de tous les points du domaine à un point central: la proximité est évaluée tenant compte de l’écart type dans chaque bande spectrale l’analyste fournit des échantillons de pixels par classe L’algorithme calcule le centre de chaque classe (moyennes) ainsi que la dispersion (écarts types) Illustration

La classification par parallélépipèdes

La classification par maximum de vraisemblance (cas paramétrique) Hypothèse: le domaine d’une classe supposée distribuée normalement est défini en fonction de la proximité de tous les points du domaine à un point central: la proximité est évaluée tenant compte de la matrice de variance-covariance l’analyste fournit des échantillons de pixels par classe L’algorithme calcule le centre de chaque classe (moyennes) ainsi que la dispersion dans l’espace multidimensionnel (matrices de variance-covariance) Illustration

La classification par maximum de vraisemblance (cas paramétrique)

Exemple: Image à classifier: 3 bandes spectrales (V-R-PIR) + 15 m de résolution spatiale + été

Choix des sites d’entraînement par classe Règles: Par classe les sites doivent totaliser plus que 30 pixels Ils doivent être pris à différents endroits sur l’image pour capter la variabilité intra-classe

Choix des sites d’entraînement par classe Exemple1: Eau

Choix des sites d’entraînement par classe Exemple2: Urbain classe 1: forte densité du bâti Classe 2: faible densité du bâti

Choix des sites d’entraînement par classe Exemple3: Rural classe 1: boisés Classe 2: sol à nu

Génération des ‘signatures spectrales’

Test de classification

Test de classification

Test de classification

Test de classification

Test de classification

Test de classification

Revenons aux méthodes avec des explications théoriques

La classification dirigée La plupart des classificateurs dirigées adoptent une vision probabiliste de ce qu’une classe et se fondent sur une règle d’attribution d’un vecteur de mesures à une classe: la règle de Bayes

Notions de base Variable aléatoire Distribution d’une variable aléatoire à une dimension  la notion de la fonction de la densité de probabilité Comment ceci se traduit avec les images Variable aléatoire à plusieurs dimensions Distribution d’une variable aléatoire à plusieurs dimensions  la notion de la fonction de densité de probabilité conjointe

Variable aléatoire C’est une fonction définie sur l' ensemble des résultats possibles d'une expérience aléatoire (ex. lancer des dés), telle qu'il soit possible de déterminer la probabilité pour qu'elle prenne une valeur ou qu'elle prenne une valeur dans un intervalle donné. En télédétection  une classe d’objets est une variable aléatoire, c’est-à-dire une fonction définie sur l’ensemble des résultats possibles d’une mesure du rayonnement solaire réfléchi (ici de 0 à 255), telle qu’il soit possible de déterminer la probabilité (DE MASSE) pour qu’elle prenne une valeur (variable discrète)

La variable aléatoire à plusieurs dimensions (probabilité conjointe)

La règle de BAYES: un exemple Un paléontologue trouve un fragment d’un fossile d’un animal marin dans la zone de jonction des deux ruisseaux. Dans quel bassin versant se trouvent des restes plus complets de cet animal? H1: le bassin de 18 km2 H2: le bassin de 10 km2

La règle de BAYES: un exemple Probabilités a priori: P(H1) = 18/28 = 0,64 P(H2) = 10/28 = 0,36 Probabilité conditionnelle (VRAISEMBLANCE): par une carte géologique il calcule que 35% des roches du Crétacé dans le bassin H1 est d’origine marine tandis que 80% le sont dans le bassin H2 P (E|H1) = 0,35; P(E|H2)=0,80

La règle de BAYES: un exemple P (H1|E) = probabilité a posteriori étant donné le fossile E, ceci provient du bassin H1 P (H2|E) = probabilité a posteriori étant donné le fossile E, ceci provient du bassin H1 Le fossile provient du bassin avec le maximum de probabilité a posteriori

La règle de BAYES: un exemple a posteriori = (vraisemblance x a priori)/évidence Évidence = P(E|H1)*P(H1) + P(E|H2)*P(H2)= (0,35 *0,64 + 0,80*0,36) = 0,51

La règle de BAYES: un exemple P(H1|E) = 0,35*0,64/0,51 = 0,44 P(H2|E) = 0,80*0,36/0,51 = 0,56 Donc H2

Formulation

Formulation Question: comment connaître la probabilité conditionnelle par classe? Solution 1: paramétrique Solution 2: non paramétrique

Solution paramétrique: hypothèse  les classes ont une distribution qui suit la loi de la distribution multinormale ….Un rappel des notions statistiques

Distribution multi-normale ….Un rappel des notions statistiques

….Un rappel des notions statistiques Matrice de variance-covariance   TM1 TM2 TM3 TM4 TM5 TM6 47.65 24.76 15.70 35.71 20.34 31.91 12.45 8.27 12.01 20.56 34.71 23.79 38.81 22.30 114.89 30.46 18.70 30.86 12.99 60.63 44.92

….Un rappel des notions statistiques Composantes principales (variance selon ses axes=valeurs propres)… Ellipse de probabilité constante

Qualité de la classification On teste la qualité des sites d’entraînement Si la qualité est acceptable on passe à la validation de la classification, sinon on recommence avec le choix des sites La validation: on choisit des sites tests dont on connaît la classe et on vérifie les résultats de la classification

Comment évaluer la qualité de la classification ? La qualité de la classification est toujours fonction des objectifs poursuivis L’évaluation à partir de l’algorithme de classification se fait aisément. Mais elle se base sur des zones tests

L’évaluation quantitative: la matrice de confusion C’est un tableau à double entrée (table de contingence)comportant les classes Classes tests classe 1 2 3 Classes affectées

Les types d’erreur Erreur de commission : Erreur d’omission : Le classificateur a affecté des pixels dans une classe autre que celle à laquelle ils appartiennent Erreur d’omission : « Le classificateur n’a pas pu affecter à une classe connue certains pixels qui pourtant appartiennent à cette classe »

Exemple: qualité des sites choisis

Qualité des sites

Statistiques

Qualité de la classification Matrice de confusion

Qualité de la classification Probabilité a posteriori

Validation

Classification non dirigée

Classification non dirigée (par coalescence) ou (clustering): K-clusters L’analyste spécifie a) le nombre de classes (K) b) les paramètres d’arrêt de l’algorithme L’algorithme regroupe les données (processus itératif) – il établit les centres des classes (une classe = un cluster) spectrales, spatiales,… 2. classifie tous les pixels selon leur proximité aux centres des clusters 3. produit l’image classifiée L’analyste trouve la signification des clusters (il se peut que certains clusters soient regroupés)

Comment établissons-nous les centres? illustration

Exemple: regrouper en deux classes

Début: choix des deux centres arbitraires Centres initiaux

Assigner un pixel à un des deux centres selon sa distance euclidienne

Calculer la nouvelle position des deux centres selon les positions des pixels assignés à l’étape précédente

Réassigner les pixels aux nouveaux centres

Arrêter lorsque les déplacements des centres est inférieur à un seuil

Clusters vs. Classes thématiques Classe thématique: route Clusters vs. Classes thématiques Béton Idéal Clusters Classes thématiques A B 1 2 Réalité A B C 1 2 Asphalte ou Asphalte fraîche A B C 1 2 3 4 Vieille asphalte

Limitations Le nombre de classes? La séparation des classes qui n’ont pas une distribution circulaire? Données originales Données classées

Exemple: Image à classifier: 3 bandes spectrales (V-R-PIR) + 15 m de résolution spatiale + été

Exemple de classification non dirigée

Exemple de classification non dirigée