Traitement d'images Hugues BENOIT-CATTIN.

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Reporting de la Cellule Nationale Droit dOption Situation au 31 décembre 2011.
CHAPITRE 8 LES ALIMENTS 3/25/2017 Des fruits Madame Craven.
Traitement d’images : concepts fondamentaux
Additions soustractions
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
______________________________________________________________________________________________________________________________________________________________________.
Analyse temps-fréquence
Transition image classique image numérique
PRINCIPE SIMPLIFIE DE LA COMPRESSION MP3
Mesures dans le domaine fréquentiel
Les numéros 70 –
Les identités remarquables
Cours MIAGE « Architectures Orientées Services » Henry Boccon-Gibod 1 Orchestration de Web Services Module 5 Exercice Pratique à l'usage de l'environnement.
1 Introduction 1 - Equations de Maxwell dans le vide 2 - Equations de propagation du champ électromagnétique dans le vide 2 - Equations de propagation.
1. Les caractéristiques de dispersion. 11. Utilité.
2. Echantillonnage et interpolation des signaux vidéo
Codage par transformées(1)
6. Quantification des signaux visuels. Codage prédictif (MICD)
8. Transformées Orthogonales et Codage par transformées


Séries de Fourier Tout signal périodique (T) de puissance finie peut être décomposé en une somme de sinus et de cosinus. An=0 1(4/) 1+ 3 (4/3)

Dpt. Télécommunications, Services & Usages Théorie de l information H. Benoit-Cattin Introduction 2. Sources discrètes & Entropie 3. Canaux discrets.

Dpt. Télécommunications, Services & Usages Théorie de l information H. Benoit-Cattin Introduction 2. Vue densemble 3. Sources discrètes & Entropie.
Traitement du Signal Hugues BENOIT-CATTIN.
Traitement d'images 4TC - Option « Télécoms » Hugues BENOIT-CATTIN.

Traitement d'images Hugues BENOIT-CATTIN.
Introduction à la logique
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Données statistiques sur le droit doption au 31/01 8 février 2012.
Introduction à limagerie numérique Acquisition, Caractéristiques, Espaces couleurs, Résolution.
Technologies et pédagogie actives en FGA. Plan de latelier 1.Introduction 2.Les technologies en éducation 3.iPads 4.TNI 5.Ordinateurs portables 6.Téléphones.
Révision (p. 130, texte) Nombres (1-100).
La législation formation, les aides des pouvoirs publics
Identification des personnes par l’iris
Application des algorithmes génétiques
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Prétraitement de l’image
Présentation générale
3 - Compression des images.
Les nombres.
LES NOMBRES PREMIERS ET COMPOSÉS
Les chiffres & les nombres
Les Monnaies et billets du FRANC Les Monnaies Euro.
Cours #6 Filtrage Découverte Plan du cours
N Découverte n Présentation des équipes et des projets n 3- Extraction des caractéristiques u 3.1 Caractéristiques 3D et 2D u 3.2 Arêtes u 3.3 Gradient.
La statistique descriptive
Les maths en francais 7ième année.
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
LES REHAUSSEMENTS D'IMAGES
Aire d’une figure par encadrement
ASI 3 Méthodes numériques pour l’ingénieur
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Certains droits réservés pour plus d’infos, cliquer sur l’icône.
Annexe Résultats provinciaux comparés à la moyenne canadienne
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Bienvenue.
Etude et test des algorithmes d'estimation de mouvement en MPEG
Introduction au Traitement d’image
Photoshop 6.0 Aurélie KNOSP Ye LU.
SSII, séance n°13, bilan du cours 15 décembre 2015 Dernière séance 2015 Résumé des chapitres et notions abordées en 2015.
VI. Introduction à l ’indexation
Transcription de la présentation:

Traitement d'images Hugues BENOIT-CATTIN

I. Introduction

HBC Traitement d'images Traitement d'images Ce n'est pas ce qui nous intéresse ! Traitement d'images Traitement d'images HBC

Domaines d'application Vision industrielle Imagerie médicale Imagerie satellite Microscopie Télécommunications Animations, Images de synthèse ....

Plan I. Introduction II. Représentations & Acquisition III. Pré-traitement & Amélioration IV. Compression V. Segmentation VI. Introduction à l'indexation VII. Introduction au tatouage VIII. Conclusion Remerciements à A. Baskurt, C. Odet pour les parties II, III, V

Eclairage Formation de l’image Numérisation Corrections Scène, objets 2D 3D... Formation de l’image Image 2D,3D,... Numérisation Image numérique Corrections - radiométriques - géométriques Restauration Reconstruction Image numérique

BDO Tatouage Indexation Compression Segmentation Transmission Image numérique Indexation Compression Segmentation Transmission Reconnaissance de formes Décision

II. Représentation & Acquisition 1. Représentation continue 2. Représentation échantillonnée 3. Voisinage, connexité, distance 4. Acquisition : échantillonnage, quantification, bruit 5. Représentations fréquentielles 6. Représentations pyramidales 7. Représentation de la couleur

II.1 Représentation continue Image = fonction d’au moins deux variables réelles Image : f(x,y) image 2D Volume : f(x,y,z) «image» 3D Séquence d’image : f(x,y,t) Séquence de volumes : f(x,y,z,t) «image» 4D Les valeurs prises par f(.) peuvent être Scalaires (intensité lumineuse) Vectorielles (couleur (RVB, ..), imagerie multispectrale, image de paramètres...) Réelles ou complexes

Si f(.) représente une intensité lumineuse Une image 2D f(x,y) scalaire réelle peut être vue comme une surface en 3D : Interprétation altimétrique des images, bassin versant, détection de ligne de crêtes, dénivellation ... Si f(.) représente une intensité lumineuse Cette représentation est utilisée quel que soit le paramètre représenté par f(.) ( Température, pression,....) Correspondance entre niveau de gris et grandeur physique.

Opérations sur les images continues : Toutes opérations réalisables «sur le papier» sur les fonctions continues à variables réelles Transformée de Fourier bidimensionnelle (2D) Filtrage, convolution, corrélation, intégration, dérivation, traitements non linéaire... On utilisera souvent la notation «continue» pour représenter et manipuler des images numériques (discrètes, échantillonnées, quantifiées) Le traitement numérique de l’image sera parfois une «discrétisation» d’une opération en continu

II.2 Représentation échantillonnée Echantillonnage d’une fonction f(x,y) fe(x,y) = f(x,y).Si Sj d( x - i Dx , y - j Dy ) Dx pas d’échantillonnage dans la direction x Dy pas d’échantillonnage dans la direction y x Dx Dy Si Sj d( x - i Dx , y - j Dy ) Peigne de Dirac 2D

Le poids de chaque Dirac est : Soit la valeur de f(x,y) en x = i Dx et y = j Dy Soit la valeur «moyenne» de f(x,y) dans une région entourant (i Dx , j Dy) (f(x,y) est pondérée et intégrée dans la région R) Caméra CCD Caméra à tube

Dans le cas général on aura (cas variant) : Si h(.,.) est identique en tout point (x,y), on aura (cas invariant) : h représentera la réponse impulsionnelle du système de prise de vue. C’est une opération de convolution, donc de filtrage. L’image échantillonnée est donc : Dans un ordinateur, l’image (numérique) sera représentée par une matrice (tableau 2D) :

f [i,j] est appelé «valeur du PIXEL (i,j) » (Pixel: PICture ELement) Pour visualiser une image, on remplit une région rectangulaire (Pixel) avec un niveau de gris (ou de couleur) correspondant à la valeur du pixel. En général les niveaux de gris (ou de couleur) utilisé pour la visualisation sont compris entre 0 et 255 (code de longueur fixe sur 8 bits). f [i,j] Niveau de gris Affichage 0.1 0.23 0.15 0.50 50 115 75 250

La maille (répartition des pixels) est le plus souvent carrée (Dx=Dy) ou rectangulaire On utilise parfois une maille hexagonale qui possède des propriétés intéressantes pour les notions de voisinage et de distance.

II.3 Voisinage, connexité, distance Beaucoup de traitements font intervenir la notion de voisinage Un pixel possède plusieurs voisins (4 ou 8) On parlera de connexité 4 ou 8 La région grise forme : UN seul objet en connexité 8 DEUX objets en connexité 4

Distance entre deux pixels f [i,j] et f ’[k,l] Distance Euclidienne Distance City-Block longueur du chemin en connexité 4 Distance de l’échiquier

II.4 Acquisition : échantillonnage / quantification Effets de l'échantillonnage : pixelisation 256 x 256 pixels 64 x 64 pixels 16 x 16 pixels Contours en marche d’escalier Perte de netteté Détails moins visibles/ moins précis Perte de résolution

Effets de la quantification à l'acquisition CAN sur les systèmes d’acquisition d’images Codage de la valeur de chaque pixel sur N bits (En général 8 bits) 8 bits (256 niv.) 4 bits (16 niv.) 2 bits (4 niv.) Apparition de faux contours Bruit de quantification Effet visible à l’œil en dessous de 6/7 bits Quantification sur 8 bits pour l’affichage

Bruits liés à l'acquisition Les images sont souvent entachées de bruit, parfois non visible à l’œil, et qui perturberont les traitements Diaphragme F/4 F/8 F/16 Optimiser les conditions d’éclairage Attention à l’éclairage ambiant Mais... diaphragme ouvert = faible profondeur de champ Mais... éclairage important = dégagement de chaleur

Eclairage non uniforme ! Correction de l'éclairage

Flou de bougé/filé dû à un temps de pose/intégration trop long Cet effet est limité par l’usage d’obturateur rapide et/ou d’éclairage flash Effet de lignage dû au balayage entrelacé des caméras vidéo Cet effet disparaît avec les caméras à balayage progressif non entrelacé Une bonne acquisition Des traitements facilités

II.5 Représentations fréquentielles Notion de fréquence spatiale Transformée de Fourier Transformée Cosinus

Notion de fréquence spatiale

x y Variation sinusoïdale  rapide (fréquence) des niveaux de gris dans une direction donnée

Transformée de Fourier 2D Image = S images sinusoïdales (A,f,j) F = image complexe (module & phase) x y fx fy (Module de F(fx , fy)

Images sinusoïdales Impulsions de Dirac fx fy Haute fréquence fx fy Basse fréquence

Transformée de Fourier Discrète 2D (DFT) Image échantillonnée (M x N) pixels, la DFT est donnée par : u v

Propriétés de la DFT 2D Identiques au 1D Périodique en u,v (période M,N) F(0,0) = composante continue = moyenne des NG Conservation de l ’énergie  SS |f(m,n)|² = SS |F(u,v)|² f réelle  F symétrique conjuguée (mod. pair, arg. impair) Séparable Algorithme rapide (FFT) : N².log2 (N) Convolution circulaire = DFT

Importance de la phase DFT - DFT-1 Module Phase Module

Echantillonnage & Aliasing Si le théorème de Shannon n’est pas respecté lors de l’échantillonnage d’une image continue, il y a repliement de spectre Ceci se traduit dans les images par des figures de Moiré, c’est à dire des formes fausses qui n’existaient pas dans l’image d’origine Les caméras matricielles types CCD induisent systématiquement du repliement de spectre. L’image d’entrée ne devra donc pas contenir trop de hautes fréquences ( Ne passez pas à la télé avec un costume rayé ! )

Continue ! Echantillonnée Sans repliement Remarque DFT périodique

Continue ! Echantillonnée Avec repliement

Transformée Cosinus Discrète

Propriétés de la DCT 2D Linéaire, séparable Coefficients réels C(0,0) = composante continue = moyenne des NG Concentration d ’énergie en basse-fréquence Algorithme rapide (via la FFT) : N².log2 (N)  compression d ’images

II.6 Représentations pyramidales Pyramides Gaussiennes & Laplaciennes Sous-Bandes / Transformée en ondelettes  Traitement multirésolution : Coarse To Fine

Pyramides Gaussiennes & Laplaciennes

Burt & Adelsson (1983) Filtrage passe-bas 2D de type gaussien  Compression d ’images  Analyse et segmentation d ’images

Décomposition en sous-bandes / ondelettes Esteban/Galland 1977 - Woods/O ’Neil 1986 - … - Mallat (1989) Filtres FIR 1D, 2D Filtres IIR 1D, 2D Une Décomposition

Une reconstruction Décomposition / Reconstruction sans pertes  cascades

Pyramidale (itérée en octave) Adaptative

Réversible Concentration d ’énergie Spatio - fréquentiel Analyse & Compression

II.7 Représentation de la couleur RGB CMY YUV / YIQ HSL Palettes

Rouge Vert Bleu (RGB) Synthèse additive de la couleur (perception d ’une source) Œil, Moniteur, Carte graphique … Images 24 bits (3*8 bits) 16 M de couleurs >> 350 000 NG : R=G=B

Cyan Magenta Jaune (CMY) Synthèse soustractive de la couleur Objet éclairé absorbant un certain nombre de fréquences Extension CMYK pour l ’impression en quadrichromie

YUV (PAL) / YIQ (NTSC) Y = intensité lumineuse = TV N&B UV / IQ = information chrominance YUV >> RGB pour la décorrélation de l ’information Compression d ’images couleur DVB  YUV 4:2:0

Hue Saturation Lightness (HSL) Le cerveau réagit à : la longueur d ’onde dominante (teinte) la contribution à la luminosité de l ’ensemble (saturation) l ’intensité par unité de surface = luminance Y = L UV  coordonnées polaire  HS

Palettes de couleur 16 Millions de couleurs  256 couleurs = palettes (GIF, BMP) Image indexée = Palette (couleur sur 24 bits) + matrice d ’index  visualisation en fausses couleurs

Plan I. Introduction II. Représentations & Acquisition III. Pré-traitement & Amélioration IV. Compression V. Segmentation VI. Introduction à l'indexation VII. Introduction au tatouage VIII. Conclusion

III. Pré-traitements & Amélioration 1. Opérations pixel à pixel 2. Opérations sur un voisinage : filtrage 3. Transformations géométriques

Pourquoi pré-traiter une image ? Pour corriger les effets de la chaîne d ’acquisition Correction radiométriques et/ou géométriques Réduire le bruit : Restauration, Déconvolution Améliorer la visualisation Améliorer les traitements ultérieurs (segmentation, compression …)

III.1 Opérations pixel à pixel Modification d'un pixel indépendamment de ses voisins Histogramme des niveaux de gris Comptage des pixels ayant un niveau de gris (NG) donné Histogramme  densité de probabilité des niveaux de gris Niveau de gris

Modification d ’histogramme Transformation des niveaux de gris : f v=f(u) avec u niv. gris de départ, v niv.gris d'arrivée f peut prendre une forme quelconque v 255 u u v 255

Recadrage linéaire des niveaux de gris v 255 v=f(u) u 255

Seuillage binaire Négatif

Egalisation d'histogramme

Autres transformations Non-linéaire, Logarithme, Extraction de plans binaires, Ecrêtage, Compression-dilatation de dynamique, Spécification d’histogramme, Codage en couleur, Pseudo-couleur, .... Segmentation basée sur les niveaux de gris (multi-seuillage)

III.2 Opérations sur un voisinage : filtrage Modification d'un pixel en fonction des ses voisins Filtrage linéaire Domaine spatial : filtres FIR 2D (masque), filtres IIR Domaine fréquentiel dans le plan de Fourier Image f(x,y) Filtre h(x,y) Image filtrée g(x,y) g(x,y) = h(x,y)*f(x,y) (convolution bidimensionnelle) G(u,v) = H(u,v) . F(u,v) Filtrage non-linéaire dans le domaine spatial

Filtrage spatial FIR 2D : masque de convolution Convolution par une réponse impulsionnelle finie appelée Masque de Convolution f est l’image de départ h est le masque de convolution W défini un voisinage Un pixel f(i,j) est remplacé par une somme pondérée de lui- même et des pixels de son voisinage

Exemple : Filtre moyenneur 1 k W: voisinage 2x2  k=0,1 l=0,1 1/4 1/4 1 h(k,l) = 1 /4 pout tout (k,l) 1/4 1/4 l ( En ne conservant que la valeur entière ) 0 1 2 2 1 1 2 1 1 2 0 0 3/4 6/4 7/4 x 5/4 5/4 3/4 x x x x x 0 1 1 x 1 1 0 x x x x x

Moyenneur 2x2 (zoom)

Remarques Utilisation de voisinages très divers : Rectangulaires 2x2, 3x3, 4x4, 5x5, 7x7, 1x2, 2x1, 1x3, 3x1... En croix, «Circulaires»... Valeurs des coefficients: Constants(Moyenneur), Gaussiens… Effets de filtrage passe-bas : image plus «flou»:, contours moins précis mais réduction du bruit haute fréquence Le principe du masque de convolution sera utilisé pour d’autres traitements (Détection de contours) L’utilisation d’un voisinage entourant un pixel est un principe très général en traitement de l’image

Exemple : réduction du bruit Filtre moyenneur 3x3 (k=-1,0,1 l=-1,0,1), Valeur constante h(k,l)=1/9

Exemple : réhaussement de contours 0 -1 0 -1 5 -1 0 -1 0 -1 4 -1 = Image d’origine + Laplacien

Filtres FIR 2D et plan de Fourier g(x,y) = h(x,y)*f(x,y)  G(u,v) = H(u,v) . F(u,v) Filtrage : N².(L-1) + N² vs. N².Log2N + N² Synthèse de filtres 1D  2D Echantillonnage en fréquence Fenêtre

C’est un filtre passe-bas, peu sélectif, anisotrope Filtre Moyenneur Masque 3x3 h(k,l) u v H(u,v) TFD 2D C’est un filtre passe-bas, peu sélectif, anisotrope

- Filtre IIR  version tronquée à Ks et échantillonnée  masque FIR Filtre Gaussien - Filtre IIR  version tronquée à Ks et échantillonnée  masque FIR h(k,l) H(u,v) TFD 2D - C’est un filtre passe-bas isotrope peu sélectif. - H(u,v) est aussi une gaussienne

Fenêtrage fréquentiel DFT Filtrage DFT-1

Illustrations

Filtrage non linéaire 2D : filtre Médian Remplacer le pixel central par la valeur médiane du voisinage 1 3 2 4 3 1 4 2 2 3 2 1 1 2 3 3 1 1 2 2 2 3 3 3 4 . . . . . 2 . .

Avantage par rapport au filtrage linéaire  les bords sont conservés Filtre linéaire de largeur 3 Filtre médian voisinage 3

Principe du filtrage IIR 2D Notion de causalité 2D Pixels du passé Pixels du futur Pixel du présent Exemple: balayage colonne puis ligne Filtrage récursif Remarques Le choix du balayage est arbitraire Le pixel présent ne dépend que des pixels du passé Voisinage = pixels du passé entourant le pixel présent

III.3 Transformations géométriques Objectif Corriger les déformations dues au système de prise de vue f(x,y) = f’(x’,y’) avec x’=h1(x,y) et y’=h2(x,y) Exemple : transformation affine (translation, rotation) Remarque : les paramètres a,b,c,d peuvent ne pas être les mêmes pour toutes les régions d’une image

x,y,sont des valeurs discrètes (image échantillonnée) x=kDx , y=lDy Problème x,y,sont des valeurs discrètes (image échantillonnée) x=kDx , y=lDy et x’=h1(kDx , lDy) et y’=h2(kDx , lDy) ne seront pas nécessairement des multiples entiers de Dx et Dy k k+1 m m+1 Dx Dx l n P1 Dy P2 Dy l+1 n+1 P3 P4

Solution: Interpolation m f’(Q)=f’(mDx,nDy) = G[f(P1),f(P2),f(P3),f(P4)] avec f(P1)=f (kDx, lDy) f(P2)=f ((k+1)Dx,lDy) f(P3)=f ((k+1)Dx,(l+1)Dy) f(P4)=f (kDx, (l+1)Dy) P1 P2 Q n d4 P3 P4 Plus proche voisin: f(Q)=f(Pk) , k : dk=min{d1,d2,d3,d4} Interpolation linéaire Interpolation bilinéaire, fonctions spline, Moindre ², ....

Warping  Placage de texture  animation ... y y’ x’= x+0.5 y y’= y x x’ 128x128 Warping  Placage de texture  animation ...

Plan I. Introduction II. Représentations & Acquisition III. Pré-traitement & Amélioration IV. Compression V. Segmentation VI. Introduction à l'indexation VII. Introduction au tatouage VIII. Conclusion

IV. Compression 1. Introduction 2. Approches directes 3. Approches par transformation 4. Compression de séquences d'images

IV.1 Introduction Objectifs Historique Réduction du volume occupé par les images numériques pour faciliter leur transfert et/ou leur stockage Historique 1952 : Codeur entropique (Huffman) 1978 : DCT (Pratt) 1980 : Vectoriel (Linde-Buzo-Gray) 1986 : Sous-bandes (Woods) 1986 : Vectoriel sur treillis (Fisher) 1989 : JPEG 1989 : MPEG-2 1989 : Ondelettes (Mallat, Daubechies) 1990 : Fractales (Jacquin) 1996 : SPIHT 1996 : MPEG-4 1997 : MPEG-7 1998 : JPEG2000

Applications Imagerie médicale  Télémédecine Imagerie spatiale Imagerie sous-marine Archivage divers (Musée, BNF, Empreintes ...) Vidéo conférence / visiophone (64 kb/s) Télésurveillance Video On Demand Télévision numérique (150 Mb/s) ...

Classification des méthodes de compression image Quantification Codage Transformation bits Sans pertes / avec pertes contrôlées Sans pertes (Huffman, Quadtree) image originale = image comprimée  TC limité (#3) Avec pertes contrôlées On perd l'information qui se voit peu  TC augmente Recherche d'un compromis Tc / Qualité Directe / Transformation Directe  Quantification & codage des pixels de l'image Transformation  Quantification & codage des coeff. transformés

Evaluation d'une méthode compression Dépend de l'application Taux de compression (Tc) Ex : image (512x512x8bpp) avec Tc=10  512x512x8/10=26215 bits  0.8 bpp Qualité Critère mathématique (RSB) Avec Critères subjectifs - Courbes ROC (médecine) - Notations subjectives (TV)

Vitesse d'exécution : codeur /décodeur Complexité Autres critères Vitesse d'exécution : codeur /décodeur Complexité - Additions / multiplications - Soft / Hard Résistance au bruit de transmission Intégration de post-traitements - Prise en compte du récepteur (homme / machine) Coût financier Scalability

Codage par longueur de plage Codage type dictionnaire IV.2 Approches directes Codage Huffman Codage arithmétique Codage par longueur de plage Codage type dictionnaire Quantification scalaire Quantification vectorielle Méthodes prédictives Approche quadtree Codage fractale Codeurs de source (Th. Information)

Codage Huffman (1952) Algorithme

Codage Arithmétique (1976) JBIG  Codage des Fax type IV

Exemple

Codage par longueur de plage (Run length coding) CCITT, Fax groupe III JPEG

Codage de type dictionnaire (1977)

Quantification scalaire Traitement pixel à pixel  Diminuer le nombre de niveaux de gris utilisés : Nnq < Nnp Problèmes - Comment choisir les seuils de quantification (si) ? - Comment choisir les niveaux de quantification (qi) ?

Quantification scalaire uniforme linéaire Seuils répartis de façon uniforme Niveaux = milieux des seuils C'est un quantificateur linéaire avec

Quantification scalaire uniforme optimale Seuils répartis de façon uniforme Niveaux = Barycentre (histogramme) Quantification optimale (Loyd-Max : 1960) Minimise l'erreur de quantification Algorithme itératif très long pour des distributions inconnues Tables pour des dist. gaussiennes, laplaciennes, ... Fait le travail du codeur !

Exemple de comparaison (peppers : 512x512x8bpp) Remarque Efficacité variable du codeur entropique !

Image originale Q. uni. lin. : RSB 22,5 dB Q. uni. opt. : RSB 23,8 dB Q. Max : RSB 24,2 dB

Quantification vectorielle Extension de la quantification scalaire  Pixel  Vecteur = bloc de pixels contigus Vecteur de taille et forme variable Approche optimale : Linde Buzo Gray (1980) Phase d'apprentissage : dictionnaire de vecteurs Vecteur = représentant d'une région de Voronoï de taille variable Dictionnaire connu du codeur /décodeur Phase d'apprentissage délicate Temps de recherche dans le dictionnaire Approche treillis

Modulation par Impulsions Codées Différentielles (MICD) Méthodes prédictives (1974) Exploitent la corrélation entre pixel voisin Modulation par Impulsions Codées Différentielles (MICD) DPCM Propagation des erreurs Prédicteurs non optimaux Adaptation aux statistiques locales

IV.3 Approches par transformation

Représentation différente de l'image  Décorrélation  Gain en performances Temps de calcul supplémentaire Une Transformation  Réversible (sans perte)  Orthogonale (énergie conservée)  Rapide DCT  JPEG Ondelettes  SPIHT, JPEG2000

Compression DCT bloc : JPEG (1989) DCT bloc 8x8  homogénéité locale de l'image  l'erreur de quantification est localisée au bloc

Schéma général

Matrice de normalisation  allocation des bits aux coeffs avant quantification par arrondi Matrice chrominance Matrice luminance

Lecture zig-zag  prise en compte de la répartition spatiale de l'énergie pour faire apparaître de longues plages de coeffs nuls Codage du coeff DC  DPCM d'ordre 1 + Huffman

Codage des coeffs AC  Codage hybride : runlength + ... + Huffman - Huffman = Code (plage de 0 + catégorie) 162 codes : 10catx16lp+2(EOB+16)

Exemple 0 -2 -1 02 -1 046  111001 0 0 / 00 0 / 11011 0 / 1010 Extrait de la table d'Huffman des AC

 JPEG = méthode générale  à adapter ... Remarques  JPEG = méthode générale  à adapter ...  Très performant à taux faibles (#10)  Effets de blocs à taux élevés Tc = 10 / RSB = 30.1 dB Tc = 20 / RSB = 28.7 dB

IV.4 Compression de séquences d'images Supprimer la redondance spatiale ou intra-image  approches 2D Supprimer la redondance temporelle ou inter-image  utiliser le déjà vu et le mouvement

Les normes MPEG

Les bases de H261 à MPEG2 3 types d'images : 3 codages

Images I (intra) - Codées JPEG' - Point d'accès séquence (0.5s) - Tc faible Images P (Prédites) - Prédites à partir de I ou P - Codage DPCM des vecteurs mvt - Codage JPEG* de l'erreur de prédiction - Tc élevé - Propagation de l'erreur Images B (Bidirectionnelles) - Interpolées à partir des I P - Tc le plus élevé

2 paramètres de réglage - N : distance inter-I (#12) - M : distance inter-P (#3) GOP

Estimation du mouvement par block matching - Blocs 16x16 - Compromis simplicité / efficacité - Rapide : algorithme logarithmique

Le codage des images P 1- Calcul des Vj entre 2- Synthèse de Ip(n) : 3- Calcul de l'erreur : E(n) = Ip(n) - I(n) 4- Codage JPEG* de E(n) 4bis- Mémorisation de 5- Codage DPCM des Vj

Codeur MPEG2

Décodeur MPEG2

Codage et TVnum Numérisation brute : 200 Mb/s DVB # DVD = MPEG2 MP@ML - 720 x 480/576 (30/25 Hz) avec IPB - 4 Mb/s (PAL/SECAM) à 9 Mb/s (studio) - Tc de 40 à 18

V. Introduction à la segmentation

Pas de norme ! Pas de méthode unique ! Pas de recette !

VI. Introduction à l ’indexation Texte écrit  recherche d'info. sur le contenu (symbolique du mot) Images Contenu d'une image  texte ! Indexation manuelle dans des bases de données Augmentation exponentielle du nombre d'images Un défi Automatisation de l'indexation d'images par le contenu Interfaces et moteurs de recherche adaptés Rque :  Analyse d'une image = quelques sec.

Retrouver des images semblables à celles que cherche l'utilisateur Problème posé Retrouver des images semblables à celles que cherche l'utilisateur Que cherche l'utilisateur ?  exemples, mots clés Quelles mesures considérer sur les images ? Quelles fonctions de ressemblance ? Contraintes de robustesse rotation échelle éclairage

VII. Introduction au tatouage Objectif Protéger la propriété des images numériques Watermark = signal inséré dans l'image Unique  identifie l'image Multiple  identifie la source 2 types visible  facile à enlever, propriétaire visible invisible  difficile à enlever, piéger les truands

Remarques Original + watermark # original watermark  signature électronique Contraintes ! Impossible à enlever sans dégrader l'image Résiste au scaling, cropping, coding, modif histogramme Invisible mais extractible En nombre suffisants

Domaine spatial (peu résistant) Quelles approches Domaine spatial (peu résistant) flip des bits de poids faible de quelques pixels Modifications d'amplitude (YUV) Domaine fréquentiel Modifications de coefs TFD / TCD / Sous-bandes Compromis entre (invisibilité / indélébilité)

VIII. Conclusion BDO Tatouage Indexation Compression Segmentation Image numérique Indexation Compression Segmentation Image  Multimédia Des techniques complexes et prometteuses Dimension affective forte Au cœur de nouveaux services & usages Transmission Rec. formes Décision