Réalisé par: Yassine MAHDANE Youssef REZZOUK Classification TÉLÉDÉTECTION Réalisé par: Yassine MAHDANE Youssef REZZOUK Encadré par: Mme JAMATY
Plan : introduction Problématique But 1) Définitions 2) Types de classifications Classification dirigée Classification non dirigée 3) Zonage par classification non dirigée: Classification hiérarchique Classification séquentielle 4) Zonage par classification dirigée : marche à suivre. 5) Catégories de classificateurs 6) Classification par la méthode parallélépipédique ou hyper boite 7) Méthode barycentrique ou K-proche voisin 8) Classification selon la distance de MAHALANOBIS 9) Classification du max de vraisemblance (MV) 10) Evaluation de la qualité d’une classification Conclusion
introduction "Télé" signifie de loin ou à distance. Le mot ‘’télédétection’’ se divise en deux; "Télé" signifie de loin ou à distance. Télédétection signifie obtenir de l'information à distance. Plus précisément, la télédétection est une technique permettant d'obtenir de l'information sur des objets en analysant des données collectées par des instruments n'étant pas en contact direct avec ces objets.
La classification joue un rôle primordial dans la télédétection puisqu’elle permet d’extraire des information de l’image. Et avant d’entamer la classification on va s’arrêter sur des définitions qu’on juge utile pour faciliter la compréhension de notre travail,
ET Etiquette : numéro affecté à un point , une région ou un segment. RQ : Lorsqu'on parle de classes, il faut faire la distinction entre: - les classes d'information : qui sont des catégories d'intérêt que l'analyste cherche à identifier dans les images, comme différents types de cultures, d'espèce d'arbres, etc. ET - les classes spectrales : qui sont des groupes de pixels qui ont les mêmes caractéristiques spectrales (ou presque) en ce qui a trait à leur valeur radiométrique dans les différents canaux. L'objectif ultime de la classification est de faire la correspondance entre ces deux classes. Dans ce contexte, l'analyste a le rôle de déterminer l'utilité des différentes classes spectrales et de valider leur correspondance à des classes d'informations utiles
définition Classification : est un processus de reconnaissance des formes. En télédétection, elle consiste à effectuer la correspondance entre : Les éléments d’une scène de l’image matérialisés généralement par leurs valeurs radiométriques, Des classes connues à priori ou non par un utilisateur. L’algorithmes associés : classificateurs
procédures de classification Elles se catégorisent selon la situation dans laquelle l’opérateur est placé selon l’objectif suivi. Deux catégories de démarches sont identifiées: Classification non dirigée Classification dirigée
Classification non dirigée L’operateur ne dispose d’aucune information sur la zone d’intérêt ou ne souhaite pas en exploiter pendant la phase initiale d’analyse Aucune information externe à l’image n’est donc introduite Le classement des pixels est effectué uniquement selon le critère de la ressemblance spectrale Etiquetage thématique est réalisé après la classification par interprétation des classes produites
Classification ascendante hiérarchique Classification séquentielle Il existe de nombreux algorithmes de classification qui se regroupent en deux catégories : Classification ascendante hiérarchique Classification séquentielle Selon les concepts math auxquels on fait reference
i) Classification ascendante hiérarchique Initialement, chaque pixel forme une classe. Soit n classes. On cherche à réduire le nombre de classes à un nombre inférieur à n , ceci se fait itérativement: À chaque étape, on fusionne deux classes, réduisant ainsi le nombre de classes. Les deux classes choisies pour être fusionnées sont celles qui sont les plus "proches ’’ .
En d'autres termes, celles dont la dissimilarité entre elles est minimale, cette valeur de dissimilarité est appelée indice d'agrégation. Comme on rassemble d'abord les individus les plus proches, la première itération a un indice d'agrégation faible, mais celui-ci va croître d'itération en itération.
Un dendrogramme est la représentation graphique d'une classification ascendante hiérarchique ; Il se présente souvent comme un arbre binaire dont les feuilles sont les pixels alignés sur l'axe des abscisses. Lorsque deux classes ou deux individus se rejoignent avec l'indice d'agrégation , des traits verticaux sont dessinés de l'abscisse des deux classes jusqu'à l'ordonnée , puis ils sont reliés par un segment horizontal. À partir d'un indice d'agrégation , on peut tracer une droite d'ordonnée qui permet de voir une classification sur le dendrogramme.
ii) Classification séquentielle Le nombre de classe est fixé au départ, et les premiers centres de classes sont définies par tirage au sort de l’échantillon On fixe ensuite une distance de fusion et, par agrégation, on crée un premier groupe de classe dont on calcul les centre de gravité puis on calcul les distance séparent les pixels qui ne sont pas encore classées dans ces centres. S’ils se trouvent à une distance inférieure à celle de fusion, ils seront intégrés à la classe Les mêmes opérations seront répétées jusqu’à que le nombre du nouveau pixel classé devient faible.
classification dirigée : C’est une procédure reposant sur une connaissance préalable de la zone à classer, et des classes thématiques à identifier. Le processus est itératif jusqu’à ce que la qualité de zonage requise est atteinte, en introduisant des élément de connaissance extérieurs à l’information contenu dans l’image.
Marche à suivre
signature spectrale La signature spectrale est l'émission électromagnétique caractéristique d'un objet en fonction de la longueur d'onde. Elle se définie par la valeur de la luminance dans chaque bande spectrale.
Catégories de classificateurs Il existe deux catégories de classificateurs à savoir: Paramétrique Non paramétrique
a) Classificateur paramétrique Il associe à la signature spectrale une distribution statique connue . Cette association offre la possibilité d’affecter a chaque pixels une probabilité de la pertinence à une classe donnée. L’algorithme le plus connu de cette catégorie est celui du maximum de vraisemblance
b) Classificateur non paramétrique Dans cette catégorie aucune distribution statique paramétrique n’est exploitée; seule la distance spectrale est prise en compte Cette catégorie comprend notamment les classificateur suivant: Hyperboîte Parallélépipédique Dempster-Shafer Réseaux neuronaux Distance de Mahalanobis
Classification par la méthode parallélépipédique ou hyper boite C’est la méthode la plus simple. Elle n’utilise pas la notion de distance, la limite de la classe est fixée sur la base de l’histogramme de chaque bande spectrale On prend garde que les classes ne se recoupent pas au moins dans une bande spectrale. Les seuls paramètres pris en compte sont le minimum et le maximum de luminance par classe et par bande spectrale comme le montre la figure suivante:
Méthode barycentrique ou K-proche voisin Cet algorithme ,communément utilisé pour la classification des données de télédétection, se base sur la distance euclidienne simple. À partir des zones d'échantillonnage, les moyennes (centre de gravité) µ i de chaque classe sont calculées Le pixel est affecté à la classe la plus proche, c'est-à- dire la plus proche de son centre de gravité.
Cette forme de division n'est évidemment pas réaliste, car un pixel très éloigné du centre de classe est probablement fort dissemblant de la classe à laquelle il est censé appartenir. Il est donc nécessaire de fixer un seuil, une distance limite au-delà de laquelle le pixel n'est plus classé. Ce classificateur proposé permet l’obtention d’une bonne précision de classification avec une complexité calculatoire relativement basse
Classification selon la distance de MAHALANOBIS
Classification par la méthode du max de vraisemblance (MV) Plus la place occupée par une classe est grande plus la probabilité qu’un pixel anonyme lui appartienne est élevée cette probabilité s’écrit : p(Ci)=nbre de pixel i/nbre de pixel de l’image
Evaluation de la qualité d’une classification La qualité d’une classification s’évalue par rapport aux objectifs poursuivis et au thème traités, ce qui entraine une diversité de critères d’évaluation. P(i) est défini pour la classe i par le rapport entre le nombre de pixels classés correctement et la somme marginale de la colonne i, c a d le total des pixels classés de la classe d’échantillon i. il mesure l’erreur d’omission. Il varie entre 0 à 1 et met en évidence la dominance d’une classe dans sa zone de référence P
Vérité terrain Des vérités terrain ont été acquises afin de mesurer la qualité de classification non supervisée obtenue, parce que cette dernière donne des étiquettes, mais elle doit être interprétée sémantiquement. D’habitude, les échantillons de vérité terrain s’utilisent, pour une classification supervisée, au début dans l’étape d’apprentissage et à la fin dans l’étape de validation
EXEMPLE Ci-dessous deux images qui proviennent des satellites Landsat de la région d’Aagdir (maroc),
Pour valider qualitativement la méthode de classification pour l’image de satellite, on dispose de vérités terrain de la région d’Agadir, En raison du manque de vérité terrain des deux autres images, l’interprétation des classifications sera uniquement visuelle.
Matrice de confusion Une matrice de confusion nous permet la précision d’une classification . Le but est de comparer le résultat de la classification avec l’information de réalité de terrain. C’est une matrice carrée de taille égale au nombre de classes, et dont un élément est égal au pourcentage de pixels classés.
Il mesure l’erreur d’omission. Il varie entre 0 à 1 Indice P(i) : Défini pour la classe i par le rapport entre le nombre de pixels classés correctement et le total des pixels classés de la classe d’échantillon i. Il mesure l’erreur d’omission. Il varie entre 0 à 1 Met en évidence la dominance d’une classe dans sa zone de référence
conclusion Ainsi, peut on dire que les classifications ou le zonage de l’image est le produit majeur des traitements d’image de la télédétection elle permet d’obtenir le plan d’occupation du sol.