La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Vidéo Numérique: Analyse et Codage Cours en Master ISM Jenny Benois -Pineau Partie II Université Bordeaux -1.

Copies: 1
H.264/MPEG4 AVC H.263/MPEG4 V1. H.264/MPEG4 AVC Principes clés : Codage intra-image et inter-image par des blocs de taille variable et par combinaison.

Présentations similaires


Présentation au sujet: "Vidéo Numérique: Analyse et Codage Cours en Master ISM Jenny Benois -Pineau Partie II Université Bordeaux -1."— Transcription de la présentation:

1 Vidéo Numérique: Analyse et Codage Cours en Master ISM Jenny Benois -Pineau Partie II Université Bordeaux -1

2 Programme du cours (I) 1. Introduction. Video dans des systèmes multimédia 2. Aspects technologiques Formats, numérisation, résolution, couleur 3. Analyse et estimation du mouvement dans la vidéo 4. Notions de la théorie de l’information 5. Codage sans pertes des informations multimédia 6. Codage prédictif (MICD) et quantification des signaux visuels 7. Eléments de codage par QV 8. Transformées orthogonales et codage par transformées. Application au codage. JPEG, MJPEG

3 9. Normes et standards de codage vidéo avec la compression Algorithmes MPEG1, MPEG2
Les premier codecs des images animées : 1974 : pour un service des visioconférence à 6 puis à 2 Mbit/s 1984 : nouvelle génération de codecs pour la visioconférence (début de l’étude) : TCD, Compensation du mouvement. Normes et standards 1989 : norme H.261 couvrant les débits de 64 Kbit/s à 2 Mbit/s (CCITT-IUT-T) nx64 Kbit/s 1992 : ISO MPEG1 : codage des images animées pour le stockage, le débit Mbit/s (dérivé de H. 261) optimisé pour CD-I - ISO/IEC 11172, 1992 : ISO MPEG2 : Le codage générique de haute qualité pour TV numérique et TVHD – ISO/IEC 13818, 1995 Video : ITU – T H.262 : ISO MPEG4 (version 1) : Le codage générique multi-fonctionnel, avec éléments d’analyse / synthèse à bas débit et manipulation des scènes vidéo. ISO/IEC : 1998 IT – Coding of Audio-Visual Objects H.263 : recommendation IUT-T

4 Normes et standards vidéo
2003 MPEG4 10 et H.264 – ISO/IEC et Rec. H.264 Advanced Video Coding : ISO MPEG7 – Multimedia Content description Interface: description du contenu des flux multimédia.

5 9.1. Fondements des standards MPEG1 et MPEG2
MPEG = « Motion Picture Expert Group » Standards MPEG1 et MPEG2 (ainsi que les normes H.261, H. 263, H.264) sont conçus selon les mêmes principes fondamentaux : Vidéo : - codage hybride : spatial et temporel avec la compensation du mouvement; - codage spatial : TCD, quantification, codage entropique appliqué à l’image d’origine ou au signal d’erreur . - prédiction par compensation du mouvement basée bloc (ou macro-bloc). MPEG1 vidéo : débit cible : 1,5 Mbit/sec MPEG2 vidéo : 2-15 Mbit/sec voir plus (TVHD) Les standards spécifient l’architecture du train binaire et les décodeurs, mais ne spécifient pas les méthodes de génération des trains binaires. Compatibilité descendante entre MPEG2 et MPEG1 : le décodeur MPEG2 décode le train binaire MPEG1.

6 Spécifications MPEG1, MPEG2
Trois composants des standards - Vidéo; - Audio; - Système (le système de multiplexage) Encodeur vidéo Multi-plexeur Et encodeur système Source Vidéo Encodeur audio Source Audio Horloge système

7 Schéma générique des codeurs MPEG1,2
Vers VLC + TCD Q Décodage - t=0? + Image précédente Prédiction par mvt Estimation du mvt Décodage Codage du mouvement - Signal d’erreur -Vecteurs de déplacement - Image d’origine - Image codée et décodée

8 Structure d’une séquence vidéo (I)
Base : GOP = « group of pictures » I – « intra-coded» - codage spatial type JPEG P – « predictive-coded », « forward predicted » par compensation du mouvement à partir de l’image de référence précédente B – bidirectionnaly predictive coded (par rapport au passé et /ou futur) N – la distance entre deux images I sucessives = longueur d’un GOP M – la distance entre deux images de référence (anchor frames) I-P ou P-P - paramètrable

9 Structure d’une séquence vidéo (II)
Valeurs typiques : (1) N = 12 ou 15 = 0,5 sec pour Pal/SECAM et NTSC respectivement (2) M=1 -> absence des images B M=1,2,3 Les images B assurent des taux de compression plus importants Ordre d’affichage et d’encodage d’un GOP

10 Structure d’une séquence vidéo (III)
Règles de composition d’un GOP (1) Dans l’ordre d’encodage, ou dans le train binaire, la première image dans un GOP est toujours une image I (2)Dans l’ordre d’affichage ( à la sortie du décodeur), la première image peut être soit I, soit la première image B dans la série des images B juste avant la première image I (3) La dernière image dans un GOP est toujours soit I soit P (4) Le premier GOP dans une vidéo commence toujours avec une image I.

11 Exemples MPEG1 7ips, N=12, M=3 MPEG1 25 ips, N=12, M=3
CERIMES, « De l’arbre à l’ouvrage »

12 Structure hiérarchique du train binaire des standards MPEG1,2
Le train binaire des standards MPEG1,2 est organisé de façon hiérarchique en ensemble de niveaux (layers). Layer = layer header + layer data. Ensemble des niveaux 1. Séquence : Sequence layer 2. GOP : GOP layer 3. Image : Picture layer 4. Couche : Slice layer 5. Macro- Bloc: MB layer 6. Bloc: Block layer

13 Structure hiérarchique d’une séquence vidéo
GOP Sequence Picture Slice MB (16x16) Block 8x8

14 Propagation de l’erreur en MPEG1
Limitations de la propagation spatiale : chaque « slice » est encodé indépendamment des autres Limitations de la propagation temporelle si l’erreur est observée sur une image B, alors elle est limitée à cette image si l’erreur est observée sur une image I, alors elle peut se propager uniquement dans le GOP courant. IBBPBBPBBPBBI si l’erreur est observée sur une image P, elle peut se propager uniquement jusqu’à la fin du GOP courant. Codage indépendant Erreur Erreur

15 Codage inter/intra-frame par macro-bloc (I)
Sequence GOP Picture Slice MB (16x16) Block 8x8 Au centre de notre intérêt!

16 Codage inter/intra-frame par macro-bloc (II)
I. Images P Modes de codage : inter-frame, intra-frame Inter-frame : - codage du vecteur de déplacement V - codage de l’erreur de compensation Image de référence Image P courante

17 Codage des images P mode Inter-frame
Image de référence Image P courante Vecteurs de déplacement, (distance IP M=3), SFRS, « Aquaculture en Méditerranée »

18 Exemples -MPEG2, M-blocs 16x16

19 Codage des vecteurs de déplacement
Les vecteurs de déplacement en MPEG1et 2 sont encodés à la précision de 0,5 pixels. En MPEG1 les vecteurs de déplacement sont limités : forward search window: / forward vector range: /

20 Types des MB dans les images P en mode Inter-Image
Par rapport au : - compensation du mouvement - codage de l’erreur de compensation du mouvement (1) Motion compensated (MC) : - erreur peut être codé; - non-codée (2) No-motion compensated (No MC) - pas de compensation et de codage d’erreur (« skipped ») – le block est directement récupéré de l’image de référence précédente: - pas de codage du mouvement, mais uniquement l’erreur; Ces modes sont désignées par des bit-flags dans l’entête des MB.

21 Les MB « skipped » Image P ou I de référence Image P courante
Prediction « forward » sans compensation du mouvement D’après MPEG2 FAQ C. Fogg, Univ. de Berkeley

22 Codage en mode Intra dans les images P
b) Codage des MB en « Intra » Décomposition en blocs 8x8 pixels - Codage du signal YUV (intra) - Mais aussi : Codage du signal d’erreur (inter) Algorithme de codage : ~JPEG

23 Exemple du codage P-frame (MPEG1)
Hiragasy, SFRS picture statistics: # of intra coded macroblocks: (14.1%) # of coded blocks: (21.5%) # of not coded macroblocks: (17.1%) # of skipped macroblocks: (51.2%) # of forw. pred. macroblocks: (31.4%) # of backw. pred. macroblocks: 0 (0.0%) # of interpolated macroblocks: 0 (0.0%) Pour image 64 dans le flux

24 Cartes des MB de la scène 2
skipped

25 Variation du nombre des blocs codés « Intra » dans les images P
Changement de plan Aquaculture en Méditerranée, SFRS..\2005_2006\MPEG1-2\aqua2_21.mpg

26 Codage inter/intra-frame par macro-bloc (III)
II. Images B Modes de codage : inter-frame, intra-frame a) Inter-frame : - 3 possibilités de sélection du meilleur vecteur Image de référence précédente (I ou P) A Image B courante C

27 Types des MB dans les images B en mode Inter-Image
(1) Motion compensated (MC) : - par le passé « forward-predicted »: compensation par blocA - par le futur « backward – predicted »: compensation par block C - bi-directionnel « interpolated » : et compensation par (bloc A + bloc C)/2 Codage d’erreur - pas de codage; - codage (2) Pas de compensation du mouvement Intra- image d’origine Inter – pas de codage : skipped

28 Exemple des statistiques des MBs B-frame
Image B : 63 du clip Hiragasy picture statistics: # of intra coded macroblocks: (7.4%) # of coded blocks: (15.4%) # of not coded macroblocks: (62.7%) # of skipped macroblocks: (9.7%) # of forw. pred. macroblocks: (38.0%) # of backw. pred. macroblocks: 404 (24.9%) # of interpolated macroblocks: 481 (29.7%) « Skipped » MB dans les images B-frames : quand le vecteur de déplacement est le même que pour le bloc précédemment codé dans la même image

29 Codage des images I et de l’erreur de compensation du mouvement (I)
Les macros-blocs dans les images I sont tous codées en mode intra –image par blocs de 8x8 pixels - « Intra-macroblocs ». Les macros-blocs dans les images P et B codés en mode intra –image sont codés de même façon. Les macros-blocs codés en mode « inter » avec l’erreur de compensation de mouvement sont codés avec le même algorithme, mais avec une matrice de quantification spécifique (Test Model 5, 1993). Algorithme de codage : similaire au JPEG.

30 Algorithme de codage TCD Quantification Balayage Zig-Zag CULV bloc 8x8
(1) W - matrice de quantification (2) manquant - pas de quantification, défini pas le méchanisme du contrôle de débit, propre à chaque macrobloc. Quantification Balayage Zig-Zag CULV

31 Quantification des blocs Intra (MPEG1) (I)
DC AC Précision initiale des coefficients DC : 11 bits Quantification sur 8, 9 et 10 bits 8-bit : QDC = dc//8 9-bit : QDC = dc//4 10-bit : QDC = dc//2 // - division entière avec arrondi

32 Images « DC »

33 Quantification des blocs Intra (II)
Coefficients ac : Valeurs avec le pas de quantification par bloc p3, q=4 Matrice de quantification des blocs intra

34 Quantification des blocs en mode inter-image
Particularités : la matrice de quantification pour le « non-intraquantizer » est plus « plate ». C’est le signal d’erreur qui est quantifié et donc la distribution de l’énergie dans les coefficients DCT est plus uniforme Matrice de quantification des blocs intra

35 Formats d’entrée MPEG1 et applications
MPEG1 est destiné aux formats progressifs et au stockage local ( CD ROM, DD). Les mécanismes de protection contre les erreurs de transmission ne sont pas suffisamment développés. Formats d’entrée : SIF x288 ou SIF 525 (352x240) Chroma : 4:2:0 - valeur Y - valeurs Cr,Cb

36 19.2 Standard MPEG2 La structure fondamentale et les algorithmes de codage MPEG2 sont les mêmes que pour MPEG1 (*) - architecture I,B,P (**) - codage du mouvement par macro-bloc (***) - TCD intra-frame et inter-frame Pourquoi MPEG2 ? – pour répondre aux besoins - de résolution et de qualité supérieures; - de compatibilité avec le parc d’équipement ( TV) et les canaux de transmission hétérogènes - de protection contre les erreurs de transmission dans des canaux bruités

37 Applications MPEG2 Télévision numérique SD et HD;
DVB ( satellite), DTTB(TNT), Production et archivage de la vidéo HD VOD Digital Cinéma via satellite, Internet large bande Qualité de télédiffusion SD est associé à un débit à 6Mbit/s pour un seul programme vidéo Qualité HD >15 (19 et plus) Mbit/sec.

38 Décodeur vidéo MPEG simplifié
Train binaire codé Balayage inverse et déquantif Décodage LV TCD Inverse + pels Mémoire- image Compens. MvT Vecteurs de déplacement V D’après ISO/IEC, MPEG2 Test Model 5, Avril, 1993

39 Spécificités technologiques du MPEG2
(1) MPEG2 traite les images vidéo progressives et entrelacées Moyens du standard : - field/frame prediction modes - field/frame DCT (2) MPEG2 permet d’assurer une meilleure qualité visuelle à la résolution spatiale et temporelle égale - matrice de quantification propriétaire, un mode de balayage supplémentaire (alternative scan order vs. Zig-zag). (3) Compatibilité et adaptation aux moyens matériels de visionnage et de la transmission Moyens du standard - scalabilité - chroma supporté 4:2:0, 4:2:2, 4:4:4 (4) Orientation vers la transmission plutôt que vers le stockage - mécanismes de récupération de l’erreur « error concealment », ex. « concealment motion vectors ».

40 Modes de prédiction image/trame
Trame inférieure « Bottom field » Trame supérieure « Top field » Image - frame

41 Modes de prédiction image/trame (II)
Image de référence Image Prédite Mode Field : Chaque trame peut être prédite soit par la trame de la même parité soit par la trame de la parité opposée Ainsi dans les images P pour le mode « field » deux vecteurs du mouvement sont possibles.

42 Field/frame prediction (III)
Image de référence Image Prédite Mode Frame : un seul vecteur de déplacement par macro-bloc, les deux trames sont considérées comme une image

43 Sélection des modes de prédiction par le mouvement
Critère de sélection : minimisation du critère de la mise en correspondance ( MAD ou EQM). Quelques indications : - Si le mouvement est fort, le mode de prédiction « field » sera la meilleure ; - Si le mouvement est faible alors le codage progressif ( frame ) conviendrait. Un mode supplémentaire : « dual prime prédiction » - permet de coder les vecteurs de déplacement de façon différentiel en économisant le débit pour le codage de vecteurs de déplacement des trames;

44 Support du mode entrelacé field/frame DCT (I)
Macroblock Frame DCT Mode image (frame) pour le codage des blocs (DCT) : Chaque bloc 8x8 contient les pixels de deux trames (supérieure et inférieure) et la transformée DCT est appliquée à un tel bloc;

45 Support du mode entrelacé field/frame DCT (II)
Macroblock Frame DCT Mode field DCT : chaque bloc 8x8 contient les pixels d’une seule trame et la transformée DCT est appliquée à un tel bloc; L’intérêt : quand le mouvement est fort, le décalage spatial entre les trames est important ; cela peut amener à une variation importante de la luminance, donc à l’augmentation de la haute fréquence.

46 Balayage alternatif Zig-zag: plus convenable
pour la vidéo aux formats progressifs Balayage alternatif : a été proposé pour le mode frame DCT: Statistiquement, l’énergie s’avère plus forte dans les hautes fréquences. RLC est donc plus efficace

47 Support du mode entrelacé Field DCT(I)
Macroblock Exemple du mouvement fort nécessitant le mode « field DCT »

48 Scalabilité Scalabilité : capacité d’avoir dans le même train binaire plusieurs versions de la source. Dans le train binaire scalable on peut omettre des parties spécifiées et décoder une image complète avec la qualité correspondante au débit utilisé Scalabilité en MPEG2 Spatiale : le décodeur peut décoder les images de plusieurs résolutions Temporelle : une vidéo peut être décodée à la cadence temporelle différente SNR : la qualité différente d’une même source vidéo déterminée par le pas de quantification. Les trains binaires scalables contiennent toujours le « niveau de base » - la version « minimale » de la source.

49 Scalabilité spatiale Base layer SD Codage MPEG2
Décodage et sur-échantillonnage Filtrage spatial et sous-échantillonnage Prédiction Enhancement layer Prédiction Encodeur MPEG2 Source HD Le niveau de base est encodé indépendamment des niveaux d’amélioration

50 Scalabilité temporelle
Base layer Encodage Source Décodage Enhancement layer Encodeur MPEG2

51 Profils et niveaux (I) La diversité des résolutions et des qualités d’encodage est formalisée en MPEG2 à l’aide des profils et niveaux. Profil : est défini comme un sous-ensemble de la syntaxe complète du train binaire Niveau : des niveaux sont définis à l’intérieur de chaque profil. Le niveau (level) est défini comme l’ensemble des contraintes imposées sur les paramètres du train binaire (par exemple, la résolution spatiale des images) Notation : Ex. signifie main level

52 Profils et niveaux (II)
Profile Level Commentaire Simple main Main low,main, High-1440, High SNR Low, main scalable Spatial High-1440 ( base layer + SNR), High-1440(Base layer + spatial)… High Profile Main (Base layer + SNR), Main (Base Layer + spatial)… Scalable

53 Profils et niveaux. Exemples (III)
Profile Level Résolution max, Nbr niveaux Simple main 720/576/30 Main low, main, High-1440, High 352/288/30 1440/1152/60 1920/1152/60 SNR 352/288/30, 2 niveaux 720/576/30, 2 niveaux Spatial High-1440 ( base layer + SNR), High-1440(Base layer + spatial)… 2 niveaux : base 720/576/30 ou 352/288/30 ou 768/576/30 Etc.. Enh. 1440/1152/30

54 MPEG 2 System Flux de programme (program stream)
Flux de transport (transport stream). Le flux de transport est conçu pour communiquer ou enregistrer un ou plusieurs programmes audio, vidéo ou autre. Avant qu’un flux vidéo puisse être décodé, il doit être extrait du transport stream. Décodeur vidéo Canal Démulti- plexeur du TS Décodeur du canal Horloge Décodeur audio TS contenant 1 ou plusieurs programmes

55 9.3. Technologies des normes de la nouvelle génération
H.263/MPEG4 V1. H.264/MPEG4 AVC Principes clés : Codage intra-image et inter-image par des blocs de taille variable et par combinaison des blocs (H.264) Sélection du meilleur mode intra/inter, configuration locale Codage au sens débit/distorsion.

56 La norme H.264 Le standard de codage vidéo qui dépasse les performances de H.263/MPEG4-V1 L’intitulé AVC = “Advanced Vidéo Coding” Fait partie de MPEG4 = V. 10 ISO/IEC and IUT Rec H.264 Date 2003

57 Représentation et compensation du mouvement H. 264
Partition arborescente récursive : - décomposition des macroblocs 16x16: 16x16, 2x 16x8, 2x8x16, 4x8x8 - décomposition des blocs 8x8 : 8x8, 2x8x4,2x4x8, 4x4x4

58 Estimation du mouvement
Principe: recherche du vecteur optimal au sens d’un critère de compensation Image de référence précédente Image courante à encoder MPEG2 – uniquement 1 niveau : estimation du mouvement sur de macro-blocs 16x16, H. 263 /MPEG4 V1 – uniquement 2 niveaux : 16x16 et 8x8

59 H.264 : Compensation du mouvement « arborescente »
16 x 8 8 x 16 8 x 8 8x8 8x4 4x8 4x4 La partition la plus fine : par de blocs de taille 4x4 pixels.

60 Exemple de décomposition optimale H. 264
From Iain E.G. Richardson : H.264 and MPEG-4, WIley, 2003, curtesy to the author

61 Codage optimal au sens débit/distorsion
D(C) R(C) - D(C) : distorsion du codage ; - R(C) : débit associé au codage. . H. 264: Comment choisir la partition optimale étant donné le débit maximal à respecter. Partition optimale : pour le débit donné choisir la partition minimisant la fonctionnelle d’erreur.

62 Construction d’une partition optimale au sens débit – distorsion des images vidéo (1)
D’après E. Reusens, « Joint optimization of representation model and frame segmentation for generic video compression », Signal Processing, 46, 1995, 105 – 117 Problème classique de la théorie d’allocation des ressources : Etant donné un quota de ressources, déterminer la distribution parmi l’ensemble d’activités pour maximiser le rendement. Notations : L – un ensemble fini des stratégies admissibles B – une stratégie : - fonction du rendement - « ressource »

63 Construction d’une partition optimale au sens débit – distorsion des images vidéo (2)
Formulation du problème : trouver la stratégie qui maximise le rendement sous contrainte ou Fonction de « rendement » de Lagrange - multiplicateur de Lagrange

64 Construction d’une partition optimale au sens débit – distorsion des images vidéo (3)
Théorème :

65 Construction d’une partition optimale au sens débit – distorsion des images vidéo (4)
Formualtion pour le codage de la source : minimiser la distorsion D(B) sous contrainte du débit disponible Mesure de distorsion erreur quadratique du codage (ou de compensation du mouvement). La recherche exhaustive de la solution optimale sous contrainte n’est pas possible à cause de la multitude des solutions. Minimisation du fonction de coût de Lagrange.

66 Construction d’une partition optimale au sens débit – distorsion des images vidéo (5)
La solution est basée sur le théorème (1) Trouver tel que (2) Trouver la solution B* Nous allons considérer d’abord (2) : comment minimiser pour fixé.

67 Construction d’une partition optimale au sens débit – distorsion des images vidéo (6)
Le plan-image est tout d’abord divisé en ensemble des N macro-blocs MB non-recouvrants. La fonctionnelle est additive par la nature de D et de R. Donc la minimisation pour l’image complète peut être effectuée indépendamment pour chaque MB.

68 16 configurations au total, pour chaque nœud en plus inter-intra
Construction d’une partition optimale au sens débit – distorsion des images vidéo (7) Les configurations de Reusens 1 config 1 16 configurations au total, pour chaque nœud en plus inter-intra

69 Construction d’une partition optimale au sens débit – distorsion des images vidéo (7)
1. Pour chaque nœud on choisit le mode optimal ( ex. inter/intra) 2. Pour chaque nœud macro-bloc MBi on choisit la configuration minimisant additive. Ensuite on peut remonter vers les partitions plus grossières en effectuant la récursion « des feuilles vers le sommet » sur l’arbre de la partition du plan-image. Dans un codec H. 264 on s’arrète au niveau MB car un MB est l’unité la plus grande de partition. Calcul du Débit R, Distorsion D et J globales par image :

70 Construction d’une partition optimale au sens débit – distorsion des images vidéo (8)
Considérons maintenant (1) : trouver La fonction R(B) est monotonne vis-à-vis de Il s’agit de trouver la racine de l’équation Algorithme : 1.1 Choisir 1.2. Appliquer la méthode de bissection : Calculer Si alors sion f-si 1.3 Condition d’arrêt :

71 H. 264 Nouveautés Fondamentales
Compensation du mouvement avec la structure de l’arbre; Transformation DCT “entière”; Mise en échelle des coefficients de DCT. Codage entropique “CABAC” – Content – Based Adaptive Binary Arithmetic Coding

72 Structure arborescente des macro-blocks
16x16 pels 8x8 pels 4x4 pels

73 Codage des vecteurs de déplacement
Le nombre de vecteurs de déplacement peut être important à cause de la taille variable des blocs. Codage prédicitif : MVD = MV -MVp

74 Prédiction des vecteurs de déplacement
B (1)E=med(A,B,C) A E B C 16x8 4x8 A 8x4 E 16x16 (2) Prédiction par voisinage causal pour les partitions 16x8 et 8x16

75 Approximation de TCD en H.264(1)
Objectifs : réaliser des calculs en entier autant que possible; Limiter la dynamique des coeficients ( calculs avec la représentation sur 16 bits) Au lei de la TCD 8x8 on propose une transformée approximant la TCD 4x4 pels.

76 Approximation de TCD en H.264(2)
TCD pour les blocs de taille 4x4

77 Approximation de TCD en H.264(3)
On démontre que cette multiplication matricielle peut être factorisée Signifie la multiplication élément par élément S’appelle la « transfromation principale »

78 Approximation de TCD en H.264(3)
Pour simplifier les calculs on approxime Alors pour maintenir l’orthogonalité des fonctions de base, on modifie Enfin pour éviter les multiplications par 0.5 on multiplie 2ème et 4ème lignes de C par 2 et 2ème et 4ème colonne de CT de même On compense cela dans la matrice E

79 Approximation de TCD en H.264(4)

80 Approximation de TCD en H.264(5)
Transformée inverse Orthogonalité : Remise en échelle – différence avec la quantification inverse

81 9.4.Standard Multimédia MPEG4

82

83

84

85

86

87

88

89 PLACEMENT DES OBJETS DANS DES SCENES SELON L’ORDRE DE PROFONDEUR
L’ordre de profondeur est traduit comme des neuds spécifiques dans le graphe de la scène ”2D and 3D scenes may be composed and overlapped on the screen using Layer2D and Layer3D nodes ;”

90

91

92

93

94

95

96

97

98 R. Forscheimer

99

100

101 Image obtenue par H.Nicolas, IRISA/INRIA

102

103

104

105

106

107

108 VISUAL PROFILES ET LEVELS (2)
“Simple profile” : le plus populaire. Un CODEC compatible avec Simple profile utilise les moyens suivants : I-VOP ( rectangulaire, progressif) P-VOP (rectangulaire, progressif) Short header ( mode compatible avec H. 263, assure l’identité des entêtes des I et P VOPs) Les moyens pour la compression efficace (cf. H.263, 4 vect de mouvement , prédiction Intra, etc.) Les moyens pour la transmission efficace (paquets vidéo, partitionnement des données, des codes à longueur variable réversibles) Paquets vidéo = slices de MPEG1,2. Permettent d’arrêter la propagation de l’erreur de transmission.

109 VISUAL PROFILES ET LEVELS(2)
“Advanced Simple Profile” : est paru dans la version plus récente du standard. Par rapport au Simple Profile il contient : B-VOP (rectangulaire, progressif) Les vecteurs du déplacement à ¼ de pixel près. Quantificateur alternatif : possibilité de quantifier les coefficients AC avec une matrice spécifique Global Motion Compensation : (x, y)i, (dx,dy)i i=1,…,4 GMC est encodé dans l’entête du VOP, “sprite” objects

110 10. Eléments d’analyse sur le flux compressé
Segmentation temporelle du flux en plans de montage Plusieurs approches utilisant les paramètres des flux encodés Variété de méthodes pour MPEG1 – 2: (1) Evaluation de la variation du débit associé aux images B (2) Utilisation des vecteurs du mouvement et des images DC


Télécharger ppt "Vidéo Numérique: Analyse et Codage Cours en Master ISM Jenny Benois -Pineau Partie II Université Bordeaux -1."

Présentations similaires


Annonces Google