Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
78
IV. Compression 1. Introduction 2. Approches directes
3. Approches par transformation 4. Compression de séquences d'images
79
IV.1 Introduction Objectifs Historique
Réduction du volume occupé par les images numériques pour faciliter leur transfert et/ou leur stockage Historique 1952 : Codeur entropique (Huffman) 1978 : DCT (Pratt) 1980 : Vectoriel (Linde-Buzo-Gray) 1986 : Sous-bandes (Woods) 1986 : Vectoriel sur treillis (Fisher) 1989 : JPEG 1989 : MPEG-2 1989 : Ondelettes (Mallat, Daubechies) 1990 : Fractales (Jacquin) 1996 : SPIHT 1996 : MPEG-4 1997 : MPEG-7 1998 : JPEG2000
80
Applications Imagerie médicale Télémédecine Imagerie spatiale
Imagerie sous-marine Archivage divers (Musée, BNF, Empreintes ...) Vidéo conférence / visiophone (64 kb/s) Télésurveillance Video On Demand Télévision numérique (150 Mb/s) ...
81
Classification des méthodes de compression
Sans pertes / avec pertes contrôlées Sans pertes (Huffman, Quadtree) image originale = image comprimée TC limité (#3) Avec pertes contrôlées On perd l'information qui se voit peu TC augmente Recherche d'un compromis Tc / Qualité Directe / Transformation Directe Quantification & codage des pixels de l'image Transformation Quantification & codage des coeff. transformés Fonction de la zone élémentaire de traitement Pixel, ligne, bloc, image entière ...
82
Evaluation d'une méthode compression
Dépend de l'application Taux de compression (Tc) Ex : image (512x512x8bpp) avec Tc=10 512x512x8/10=26215 bits 0.8 bpp Qualité Critère mathématique (RSB) Avec Critères subjectifs - Courbes ROC (médecine) - Notations subjectives (TV)
83
Vitesse d'exécution : codeur /décodeur Complexité
Autres critères Vitesse d'exécution : codeur /décodeur Complexité - Additions / multiplications - Soft / Hard Résistance au bruit de transmission Intégration de post-traitements - Prise en compte du récepteur (homme / machine) Coût financier Scalability
84
Codage par longueur de plage Codage type dictionnaire
IV.2 Approches directes Codage Huffman Codage arithmétique Codage par longueur de plage Codage type dictionnaire Quantification scalaire Quantification vectorielle Méthodes prédictives Approche quadtree Codage fractale Codeurs de source (Th. Information)
85
Codage Huffman (1952) Algorithme
87
Codage Arithmétique (1976)
JBIG Codage des Fax type IV
88
Exemple
90
Codage par longueur de plage (Run length coding)
CCITT, Fax groupe III JPEG
91
Codage de type dictionnaire (1977)
93
Quantification scalaire
Traitement pixel à pixel Diminuer le nombre de niveaux de gris utilisés : Nnq < Nnp Problèmes - Comment choisir les seuils de quantification (si) ? - Comment choisir les niveaux de quantification (qi) ?
94
Quantification scalaire uniforme linéaire
Seuils répartis de façon uniforme Niveaux = milieux des seuils C'est un quantificateur linéaire avec
95
Quantification scalaire uniforme optimale
Seuils répartis de façon uniforme Niveaux = Barycentre (histogramme) Quantification optimale (Loyd-Max : 1960) Minimise l'erreur de quantification Algorithme itératif très long pour des distributions inconnues Tables pour des dist. gaussiennes, laplaciennes, ... Fait le travail du codeur !
96
Exemple de comparaison (peppers : 512x512x8bpp)
Remarque Efficacité variable du codeur entropique !
97
Image originale Q. uni. lin. : RSB 22,5 dB Q. uni. opt. : RSB 23,8 dB Q. Max : RSB 24,2 dB
98
Quantification vectorielle
Extension de la quantification scalaire Pixel Vecteur = bloc de pixels contigus Vecteur de taille et forme variable Approche optimale : Linde Buzo Gray (1980) Phase d'apprentissage : dictionnaire de vecteurs Vecteur = représentant d'une région de Voronoï de taille variable Dictionnaire connu du codeur /décodeur Phase d'apprentissage délicate Temps de recherche dans le dictionnaire Approche treillis
100
Approche Treillis : Fisher, Conway, Sloane (1986)
Extension de la quantification linéaire uniforme Treillis = vecteurs régulièrement répartis dans Rn Dictionnaire pré-défini Pas d'apprentissage Algorithme de quantification rapide Algorithme de quantification vectorielle sur treillis - Choix de la norme : L1 Laplacien Pyramide L2 Gaussien Sphère - Choix de la taille des vecteurs - Choix du treillis : Zn, An, Dn (4), En(8), n(16) Taux (B) K rayon du dictionnaire contenant 2nB vecteurs Procédure de dénombrement
101
Bornage des vecteurs par le facteur d'échelle A = Es/K
Ramène les vecteurs à l'intérieur du dictionnaire - Traitement spécial pour les vecteurs d'énergie > Es Quantification - Vecteur vecteur du dictionnaire le plus proche Codage des vecteurs : code produit - Rayon : code Huffman - Index : code de longueur fixe
102
Illustration de la quantification vectorielle sur treillis
Vecteurs 2x1
103
Structure de fichier codé
104
Modulation par Impulsions Codées Différentielles (MICD)
Méthodes prédictives (1974) Exploitent la corrélation entre pixel voisin Modulation par Impulsions Codées Différentielles (MICD) DPCM Propagation des erreurs Prédicteurs non optimaux Adaptation aux statistiques locales
105
Approche Quadtree Découpage récursif en carrés homogènes
Critère de split : variance, ...
106
Codage de l'arbre : règle de parcours (Peano)
Codage des régions homogènes : moyenne, interpolation ...
107
Compression par fractale
Les Fractales (B. Mandelbrott) - Observations naturelles : nuages, plantes ... - Auto-similarité à toutes les échelles redondance dans l'image Les 'Iterated Functions Systems' (IFS) - Wi : Transformation affine contractante rotations, réflexions position déplacement scaling variance niveau de gris offset moyenne
108
Recherche d'un IFS pour générer une image
très fort taux de compression mais image spéciale Approche directe Transformation de l'image = morceau de l'image image # w1(image) w2 (image) ... wn (image) Fougère : 4 transformations = 192 bits 512² : Tc = 1365 Utilisation de bibliothèque d'IFS image segmentée en un ensemble d'IFS connus
109
Compression par IFS local (Jacquin 1990)
- Approche valable sur des images quelconques Codage
110
Mettre les Dj à la taille de R : Sous-échantillonnage +- moyennage
Définir la zone de recherche - toute l'image - limitée (ei,fi) Recherche du (WiDj) le plus proche de Ri - Mesure de distance L1, L2, L Ex : pour L2 - - ai, bi, ci, di = (0,-1,1) 4 rotations (-90, 90,180,0) 4 réflexions(_ | / \) Codage de longueur fixe ou variable code = Swi
111
Variantes - formes des blocs - recherche des wi - codage des wi Codage très long Décodage instantané
112
Point de départ It n° 1 RSB = 23,8 dB It n° 2 RSB = 27,33 dB It n° 3 RSB = 32,16 dB Tc = 10
113
IV.3 Approches par transformation
114
Représentation différente de l'image
Décorrélation Gain en performances Temps de calcul supplémentaire Une Transformation Réversible (sans perte) Orthogonale (énergie conservée) Rapide DCT JPEG Ondelettes SPIHT, JPEG2000
115
Compression DCT bloc : JPEG (1989)
DCT bloc 8x8 homogénéité locale de l'image l'erreur de quantification est localisée au bloc
116
Schéma général
117
Matrice de normalisation
allocation des bits aux coeffs avant quantification par arrondi Matrice chrominance Matrice luminance
118
Lecture zig-zag prise en compte de la répartition spatiale de l'énergie pour faire apparaître de longues plages de coeffs nuls Codage du coeff DC DPCM d'ordre 1 + Huffman
119
Codage des coeffs AC Codage hybride : runlength Huffman - Huffman = Code (plage de 0 + catégorie) 162 codes : 10catx16lp+2(EOB+16)
120
Exemple / 00 0 / / 1010 Extrait de la table d'Huffman des AC
121
JPEG = méthode générale à adapter ...
Remarques JPEG = méthode générale à adapter ... Très performant à taux faibles (#10) Effets de blocs à taux élevés Tc = 10 / RSB = 30.1 dB Tc = 20 / RSB = 28.7 dB
122
Compression sous-bandes / ondelettes
123
Décomposition pyramidale en sous-bandes
banc de filtres FIR 1D : bi-orthogonaux 9-7 - phase linéaire, rec. parfaite, pas orthogonaux, réguliers Concentration d'énergie dans la BB
124
Quantification séparée des sous-bandes (Woods 86)
Sous-bande BF : histogramme - DPCM + scalaire + codeur entropique Sous-bandes HF : histogramme laplacien - QV treillis, ... Allocation des bits aux sous bandes par modèle - Min(D) avec B<Bf Optimisation - Théorie de la distorsion : bruit de quantification D=f(B) - très rapide sous-optimal (modèle réalité)
125
Exemples Originale Sous-bandes Tc=32
126
Sous-bandes Tc=32 RSB = 30.1 dB JPEG Tc=32 RSB -3%
127
Originale Sous-bandes Tc=60 !!
128
Quantification globale des sous-bandes (shapiro 93) SPIHT
Algorithme très rapide, RSB élevé, 'embedded' Basé sur : - Transmission progressive par plan de bits = Q. scalaire - Exploite l'auto-similarité inter-sous-bandes : arbres de coeffs
129
SPIHT (Set Partitionning In Hierarchical Trees) Said & Pearlman 96
Décomposition en ondelettes (9-7) Partition des coeffs en arbres signifiants Transmission progressive par plan de bits +- Codeur arithmétique
130
Transmission progressive par plan de bits
Minimiser l'erreur de quantification D
132
Partitionning Tree Relation de parenté inter sous-bandes
133
Règles de signification
|ci,j| 2n Définition des ensembles
134
Règles de division Listes de signifiants ! SPIHT ne fait que de la gestion de liste de coordonnées et du masquage binaire
135
Algorithme de codage
136
La stratégie de parcourt est connue du décodeur
les coordonnées ne sont plus codées !
137
Exemples JPEG Tc=32 RSB : 30.25 SPIHT Tc=32 RSB : 32.45
138
SPIHT , TC=30 SPIHT , TC=240 !
139
JPEG 2000 (96-Fin99)
140
IV.4 Compression de séquences d'images
Supprimer la redondance spatiale ou intra-image approches 2D Supprimer la redondance temporelle ou inter-image utiliser le déjà vu et le mouvement
141
Les normes MPEG
142
Les bases de H261 à MPEG2 3 types d'images : 3 codages
143
Images I (intra) - Codées JPEG' - Point d'accès séquence (0.5s) - Tc faible Images P (Prédites) - Prédites à partir de I ou P - Codage DPCM des vecteurs mvt - Codage JPEG* de l'erreur de prédiction - Tc élevé - Propagation de l'erreur Images B (Bidirectionnelles) - Interpolées à partir des I P - Tc le plus élevé
144
2 paramètres de réglage - N : distance inter-I (#12) - M : distance inter-P (#3) GOP
145
Estimation du mouvement par block matching
- Blocs 16x16 - Compromis simplicité / efficacité - Rapide : algorithme logarithmique
146
Le codage des images P 1- Calcul des Vj entre 2- Synthèse de Ip(n) : 3- Calcul de l'erreur : E(n) = Ip(n) - I(n) 4- Codage JPEG* de E(n) 4bis- Mémorisation de 5- Codage DPCM des Vj
147
Codeur MPEG2
148
Décodeur MPEG2
149
Codage et TVnum Numérisation brute : 200 Mb/s DVB # DVD = MPEG2 MP@ML
- 720 x 480/576 (30/25 Hz) avec IPB - 4 Mb/s (PAL/SECAM) à 9 Mb/s (studio) - Tc de 40 à 18
150
Appli. graph. interactives
MPEG4 : caisse à outil multimédia ! MPEG4 = beaucoup + que de la compression TV Num Appli. graph. interactives WWW MPEG4 Eléments technologiques standardisés Auteurs - Fournisseurs de services - Utilisateurs Production - Distribution - Accès
151
Auteurs - Rendre faisable et flexible la production d'objets intégrant des technos TV, Web, VRML ... - Protéger leur droit Fournisseurs de service - Fournir une info transparente, auto-adaptable aux réseaux - Gestion de la Qualité de service (QoS) Utilisateurs - Bénéficier de nouveaux produits avec une forte interactivité
152
Les AVO de MPEG4 Données = Audio Visual Objects
153
Interactivité pour les utilisateurs
Scène = S(AVO's) Interactivité pour les utilisateurs - Changement de point de vue - Navigation dans la scène - Interaction avec la scène - Modification de la scène
155
La compression d'images dans MPEG4
Boite à outils adaptée aux AVO - JPEG, MPEG2 - Ondelettes, Zerotree - Méthodes de 2ème génération
156
La compression par maillage actif
Objectif Déformer un maillage pour l'adapter à l'image : - Noeuds sur les contours & Cellules homogènes Stratégie de déformation - Modèle mécanique avec minimisation d'énergie Stratégies de codage - Codage de la structure : position des noeuds - DPCM + Codeur entropique - Codage de la texture : intérieur des cellules - Interpolation - Wharping + méthodes par transformation
157
Maîtriser le temps de déformation
158
La compression par modèle
Principe - Déformer le modèle pour le faire coller à l'image - Coder la déformation au cours du temps - Coder l'intérieur des mailles Spécifique à des modalités d'images
159
La compression par approche Objets
Principe - Segmenter () l'image en régions homogènes : les objets - Coder la carte des objets () : 'chain coding' - Coder l'intérieur des Objets : shape DCT Chain coding
160
Plan I. Introduction II. Représentations & Acquisition
III. Pré-traitement & Amélioration IV. Compression V. Segmentation VI. Introduction à l'indexation VII. Introduction au tatouage VIII. Conclusion
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.