La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Présentations similaires


Présentation au sujet: ""— Transcription de la présentation:

78 IV. Compression 1. Introduction 2. Approches directes
3. Approches par transformation 4. Compression de séquences d'images

79 IV.1 Introduction Objectifs Historique
Réduction du volume occupé par les images numériques pour faciliter leur transfert et/ou leur stockage Historique 1952 : Codeur entropique (Huffman) 1978 : DCT (Pratt) 1980 : Vectoriel (Linde-Buzo-Gray) 1986 : Sous-bandes (Woods) 1986 : Vectoriel sur treillis (Fisher) 1989 : JPEG 1989 : MPEG-2 1989 : Ondelettes (Mallat, Daubechies) 1990 : Fractales (Jacquin) 1996 : SPIHT 1996 : MPEG-4 1997 : MPEG-7 1998 : JPEG2000

80 Applications Imagerie médicale  Télémédecine Imagerie spatiale
Imagerie sous-marine Archivage divers (Musée, BNF, Empreintes ...) Vidéo conférence / visiophone (64 kb/s) Télésurveillance Video On Demand Télévision numérique (150 Mb/s) ...

81 Classification des méthodes de compression
Sans pertes / avec pertes contrôlées Sans pertes (Huffman, Quadtree) image originale = image comprimée  TC limité (#3) Avec pertes contrôlées On perd l'information qui se voit peu  TC augmente Recherche d'un compromis Tc / Qualité Directe / Transformation Directe  Quantification & codage des pixels de l'image Transformation  Quantification & codage des coeff. transformés Fonction de la zone élémentaire de traitement Pixel, ligne, bloc, image entière ...

82 Evaluation d'une méthode compression
Dépend de l'application Taux de compression (Tc) Ex : image (512x512x8bpp) avec Tc=10  512x512x8/10=26215 bits  0.8 bpp Qualité Critère mathématique (RSB) Avec Critères subjectifs - Courbes ROC (médecine) - Notations subjectives (TV)

83 Vitesse d'exécution : codeur /décodeur Complexité
Autres critères Vitesse d'exécution : codeur /décodeur Complexité - Additions / multiplications - Soft / Hard Résistance au bruit de transmission Intégration de post-traitements - Prise en compte du récepteur (homme / machine) Coût financier Scalability

84 Codage par longueur de plage Codage type dictionnaire
IV.2 Approches directes Codage Huffman Codage arithmétique Codage par longueur de plage Codage type dictionnaire Quantification scalaire Quantification vectorielle Méthodes prédictives Approche quadtree Codage fractale Codeurs de source (Th. Information)

85 Codage Huffman (1952) Algorithme

86

87 Codage Arithmétique (1976)
JBIG  Codage des Fax type IV

88 Exemple

89

90 Codage par longueur de plage (Run length coding)
CCITT, Fax groupe III JPEG

91 Codage de type dictionnaire (1977)

92

93 Quantification scalaire
Traitement pixel à pixel  Diminuer le nombre de niveaux de gris utilisés : Nnq < Nnp Problèmes - Comment choisir les seuils de quantification (si) ? - Comment choisir les niveaux de quantification (qi) ?

94 Quantification scalaire uniforme linéaire
Seuils répartis de façon uniforme Niveaux = milieux des seuils C'est un quantificateur linéaire avec

95 Quantification scalaire uniforme optimale
Seuils répartis de façon uniforme Niveaux = Barycentre (histogramme) Quantification optimale (Loyd-Max : 1960) Minimise l'erreur de quantification Algorithme itératif très long pour des distributions inconnues Tables pour des dist. gaussiennes, laplaciennes, ... Fait le travail du codeur !

96 Exemple de comparaison (peppers : 512x512x8bpp)
Remarque Efficacité variable du codeur entropique !

97 Image originale Q. uni. lin. : RSB 22,5 dB Q. uni. opt. : RSB 23,8 dB Q. Max : RSB 24,2 dB

98 Quantification vectorielle
Extension de la quantification scalaire  Pixel  Vecteur = bloc de pixels contigus Vecteur de taille et forme variable Approche optimale : Linde Buzo Gray (1980) Phase d'apprentissage : dictionnaire de vecteurs Vecteur = représentant d'une région de Voronoï de taille variable Dictionnaire connu du codeur /décodeur Phase d'apprentissage délicate Temps de recherche dans le dictionnaire Approche treillis

99

100 Approche Treillis : Fisher, Conway, Sloane (1986)
Extension de la quantification linéaire uniforme Treillis = vecteurs régulièrement répartis dans Rn Dictionnaire pré-défini  Pas d'apprentissage Algorithme de quantification rapide Algorithme de quantification vectorielle sur treillis  - Choix de la norme : L1  Laplacien  Pyramide L2  Gaussien  Sphère - Choix de la taille des vecteurs - Choix du treillis : Zn, An, Dn (4), En(8), n(16)  Taux (B)  K rayon du dictionnaire contenant 2nB vecteurs  Procédure de dénombrement

101  Bornage des vecteurs par le facteur d'échelle A = Es/K
 Ramène les vecteurs à l'intérieur du dictionnaire - Traitement spécial pour les vecteurs d'énergie > Es  Quantification - Vecteur  vecteur du dictionnaire le plus proche  Codage des vecteurs : code produit - Rayon : code Huffman - Index : code de longueur fixe

102 Illustration de la quantification vectorielle sur treillis
Vecteurs 2x1

103 Structure de fichier codé

104 Modulation par Impulsions Codées Différentielles (MICD)
Méthodes prédictives (1974) Exploitent la corrélation entre pixel voisin Modulation par Impulsions Codées Différentielles (MICD) DPCM Propagation des erreurs Prédicteurs non optimaux Adaptation aux statistiques locales

105 Approche Quadtree Découpage récursif en carrés homogènes
 Critère de split : variance, ...

106 Codage de l'arbre : règle de parcours (Peano)
Codage des régions homogènes : moyenne, interpolation ...

107 Compression par fractale
Les Fractales (B. Mandelbrott) - Observations naturelles : nuages, plantes ... - Auto-similarité à toutes les échelles  redondance dans l'image Les 'Iterated Functions Systems' (IFS) - Wi : Transformation affine contractante rotations, réflexions position déplacement scaling variance niveau de gris offset moyenne

108 Recherche d'un IFS pour générer une image
 très fort taux de compression mais image spéciale Approche directe  Transformation de l'image = morceau de l'image image # w1(image)  w2 (image)  ...  wn (image)  Fougère : 4 transformations = 192 bits 512² : Tc = 1365 Utilisation de bibliothèque d'IFS  image segmentée en un ensemble d'IFS connus

109 Compression par IFS local (Jacquin 1990)
- Approche valable sur des images quelconques Codage

110  Mettre les Dj à la taille de R : Sous-échantillonnage +- moyennage
 Définir la zone de recherche - toute l'image - limitée  (ei,fi)  Recherche du (WiDj) le plus proche de Ri - Mesure de distance  L1, L2, L Ex : pour L2 - - ai, bi, ci, di = (0,-1,1)  4 rotations (-90, 90,180,0)  4 réflexions(_ | / \)  Codage de longueur fixe ou variable  code = Swi

111 Variantes - formes des blocs - recherche des wi - codage des wi Codage très long Décodage instantané

112 Point de départ It n° 1 RSB = 23,8 dB It n° 2 RSB = 27,33 dB It n° 3 RSB = 32,16 dB Tc = 10

113 IV.3 Approches par transformation

114 Représentation différente de l'image
 Décorrélation  Gain en performances Temps de calcul supplémentaire Une Transformation  Réversible (sans perte)  Orthogonale (énergie conservée)  Rapide DCT  JPEG Ondelettes  SPIHT, JPEG2000

115 Compression DCT bloc : JPEG (1989)
DCT bloc 8x8  homogénéité locale de l'image  l'erreur de quantification est localisée au bloc

116 Schéma général

117 Matrice de normalisation
 allocation des bits aux coeffs avant quantification par arrondi Matrice chrominance Matrice luminance

118 Lecture zig-zag  prise en compte de la répartition spatiale de l'énergie pour faire apparaître de longues plages de coeffs nuls Codage du coeff DC  DPCM d'ordre 1 + Huffman

119 Codage des coeffs AC  Codage hybride : runlength Huffman - Huffman = Code (plage de 0 + catégorie) 162 codes : 10catx16lp+2(EOB+16)

120 Exemple  / 00 0 / / 1010 Extrait de la table d'Huffman des AC

121  JPEG = méthode générale  à adapter ...
Remarques  JPEG = méthode générale  à adapter ...  Très performant à taux faibles (#10)  Effets de blocs à taux élevés Tc = 10 / RSB = 30.1 dB Tc = 20 / RSB = 28.7 dB

122 Compression sous-bandes / ondelettes

123 Décomposition pyramidale en sous-bandes
 banc de filtres FIR 1D : bi-orthogonaux 9-7 - phase linéaire, rec. parfaite, pas orthogonaux, réguliers  Concentration d'énergie dans la BB

124 Quantification séparée des sous-bandes (Woods 86)
 Sous-bande BF : histogramme  - DPCM + scalaire + codeur entropique  Sous-bandes HF : histogramme laplacien - QV treillis, ...  Allocation des bits aux sous bandes par modèle - Min(D) avec B<Bf  Optimisation - Théorie de la distorsion : bruit de quantification  D=f(B) -  très rapide  sous-optimal (modèle  réalité)

125 Exemples Originale Sous-bandes Tc=32

126 Sous-bandes Tc=32 RSB = 30.1 dB JPEG Tc=32 RSB -3%

127 Originale Sous-bandes Tc=60 !!

128 Quantification globale des sous-bandes (shapiro 93)  SPIHT
 Algorithme très rapide, RSB élevé, 'embedded' Basé sur : - Transmission progressive par plan de bits = Q. scalaire - Exploite l'auto-similarité inter-sous-bandes : arbres de coeffs

129 SPIHT (Set Partitionning In Hierarchical Trees) Said & Pearlman 96
Décomposition en ondelettes (9-7) Partition des coeffs en arbres signifiants Transmission progressive par plan de bits +- Codeur arithmétique

130 Transmission progressive par plan de bits
Minimiser l'erreur de quantification D

131

132 Partitionning Tree Relation de parenté inter sous-bandes

133 Règles de signification
|ci,j|  2n Définition des ensembles

134 Règles de division Listes de signifiants ! SPIHT ne fait que de la gestion de liste de coordonnées et du masquage binaire

135 Algorithme de codage

136 La stratégie de parcourt est connue du décodeur
 les coordonnées ne sont plus codées !

137 Exemples JPEG Tc=32 RSB : 30.25 SPIHT Tc=32 RSB : 32.45

138 SPIHT , TC=30 SPIHT , TC=240 !

139 JPEG 2000 (96-Fin99)

140 IV.4 Compression de séquences d'images
Supprimer la redondance spatiale ou intra-image  approches 2D Supprimer la redondance temporelle ou inter-image  utiliser le déjà vu et le mouvement

141 Les normes MPEG

142 Les bases de H261 à MPEG2 3 types d'images : 3 codages

143 Images I (intra) - Codées JPEG' - Point d'accès séquence (0.5s) - Tc faible Images P (Prédites) - Prédites à partir de I ou P - Codage DPCM des vecteurs mvt - Codage JPEG* de l'erreur de prédiction - Tc élevé - Propagation de l'erreur Images B (Bidirectionnelles) - Interpolées à partir des I P - Tc le plus élevé

144 2 paramètres de réglage - N : distance inter-I (#12) - M : distance inter-P (#3) GOP

145 Estimation du mouvement par block matching
- Blocs 16x16 - Compromis simplicité / efficacité - Rapide : algorithme logarithmique

146 Le codage des images P 1- Calcul des Vj entre 2- Synthèse de Ip(n) : 3- Calcul de l'erreur : E(n) = Ip(n) - I(n) 4- Codage JPEG* de E(n) 4bis- Mémorisation de 5- Codage DPCM des Vj

147 Codeur MPEG2

148 Décodeur MPEG2

149 Codage et TVnum Numérisation brute : 200 Mb/s DVB # DVD = MPEG2 MP@ML
- 720 x 480/576 (30/25 Hz) avec IPB - 4 Mb/s (PAL/SECAM) à 9 Mb/s (studio) - Tc de 40 à 18

150 Appli. graph. interactives
MPEG4 : caisse à outil multimédia ! MPEG4 = beaucoup + que de la compression TV Num Appli. graph. interactives WWW MPEG4 Eléments technologiques standardisés Auteurs - Fournisseurs de services - Utilisateurs Production - Distribution - Accès

151 Auteurs - Rendre faisable et flexible la production d'objets intégrant des technos TV, Web, VRML ... - Protéger leur droit Fournisseurs de service - Fournir une info transparente, auto-adaptable aux réseaux - Gestion de la Qualité de service (QoS) Utilisateurs - Bénéficier de nouveaux produits avec une forte interactivité

152 Les AVO de MPEG4 Données = Audio Visual Objects

153 Interactivité pour les utilisateurs
Scène = S(AVO's) Interactivité pour les utilisateurs - Changement de point de vue - Navigation dans la scène - Interaction avec la scène - Modification de la scène

154

155 La compression d'images dans MPEG4
Boite à outils adaptée aux AVO - JPEG, MPEG2 - Ondelettes, Zerotree - Méthodes de 2ème génération

156 La compression par maillage actif
Objectif Déformer un maillage pour l'adapter à l'image : - Noeuds sur les contours & Cellules homogènes Stratégie de déformation - Modèle mécanique avec minimisation d'énergie Stratégies de codage - Codage de la structure : position des noeuds - DPCM + Codeur entropique - Codage de la texture : intérieur des cellules - Interpolation - Wharping + méthodes par transformation

157  Maîtriser le temps de déformation

158 La compression par modèle
Principe - Déformer le modèle pour le faire coller à l'image - Coder la déformation au cours du temps - Coder l'intérieur des mailles  Spécifique à des modalités d'images

159 La compression par approche Objets
Principe - Segmenter () l'image en régions homogènes : les objets - Coder la carte des objets () : 'chain coding' - Coder l'intérieur des Objets : shape DCT Chain coding

160 Plan I. Introduction II. Représentations & Acquisition
III. Pré-traitement & Amélioration IV. Compression V. Segmentation VI. Introduction à l'indexation VII. Introduction au tatouage VIII. Conclusion


Télécharger ppt ""

Présentations similaires


Annonces Google