Standard MPEG2 La structure fondamentale et les algorithmes de codage MPEG2 sont les mêmes que pour MPEG1 (*) - architecture I,B,P (**) - codage du mouvement par macro-bloc (***) - TCD intra-frame et inter-frame Pourquoi MPEG2 ? – pour répondre aux besoins - de résolution et de qualité supérieures; - de compatibilité avec le parc d’équipement ( TV) et les canaux de transmission hétérogènes - de protection contre les erreurs de transmission dans des canaux bruités …
Applications MPEG2 Télévision numérique SD et HD; DVB ( satellite), DTTB(TNT), Production et archivage de la vidéo HD VOD Digital Cinéma via satellite, Internet large bande Qualité de télédiffusion SD est associé à un débit à 6Mbit/s pour un seul programme vidéo Qualité HD >15 (19 et plus) Mbit/sec.
Décodeur vidéo MPEG simplifié Train binaire codé Balayage inverse et déquantif Décodage LV TCD Inverse + pels Mémoire- image Compens. MvT Vecteurs de déplacement V D’après ISO/IEC, MPEG2 Test Model 5, Avril, 1993
Spécificités technologiques du MPEG2 (1) MPEG2 traite les images vidéo progressives et entrelacées Moyens du standard : - field/frame prediction modes - field/frame DCT (2) MPEG2 permet d’assurer une meilleure qualité visuelle à la résolution spatiale et temporelle égale - matrice de quantification propriétaire, un mode de balayage supplémentaire (alternative scan order vs. Zig-zag). (3) Compatibilité et adaptation aux moyens matériels de visionnage et de la transmission Moyens du standard - scalabilité - chroma supporté 4:2:0, 4:2:2, 4:4:4 (4) Orientation vers la transmission plutôt que vers le stockage - mécanismes de récupération de l’erreur « error concealment », ex. « concealment motion vectors ».
Modes de prédiction image/trame Trame inférieure « Bottom field » Trame supérieure « Top field » Image - frame
Modes de prédiction image/trame (II) Image de référence Image Prédite Mode Field : Chaque trame peut être prédite soit par la trame de la même parité soit par la trame de la parité opposée Ainsi dans les images P pour le mode « field » deux vecteurs du mouvement sont possibles.
Field/frame prediction (III) Image de référence Image Prédite Mode Frame : un seul vecteur de déplacement par macro-bloc, les deux trames sont considérées comme une image
Sélection des modes de prédiction par le mouvement Critère de sélection : minimisation du critère de la mise en correspondance ( MAD ou EQM). Quelques indications : - Si le mouvement est fort, le mode de prédiction « field » sera la meilleure ; - Si le mouvement est faible alors le codage progressif ( frame ) conviendrait. Un mode supplémentaire : « dual prime prédiction » - permet de coder les vecteurs de déplacement de façon différentiel en économisant le débit pour le codage de vecteurs de déplacement des trames;
Support du mode entrelacé field/frame DCT (I) Macroblock Frame DCT Mode image (frame) pour le codage des blocs (DCT) : Chaque bloc 8x8 contient les pixels de deux trames (supérieure et inférieure) et la transformée DCT est appliquée à un tel bloc;
Support du mode entrelacé field/frame DCT (II) Macroblock Frame DCT Mode field DCT : chaque bloc 8x8 contient les pixels d’une seule trame et la transformée DCT est appliquée à un tel bloc; L’intérêt : quand le mouvement est fort, le décalage spatial entre les trames est important ; cela peut amener à une variation importante de la luminance, donc à l’augmentation de la haute fréquence.
Balayage alternatif Zig-zag: plus convenable pour la vidéo aux formats progressifs Balayage alternatif : a été proposé pour le mode frame DCT: Statistiquement, l’énergie s’avère plus forte dans les hautes fréquences. RLC est donc plus efficace
Support du mode entrelacé Field DCT(I) Macroblock Exemple du mouvement fort nécessitant le mode « field DCT »
Scalabilité Scalabilité : capacité d’avoir dans le même train binaire plusieurs versions de la source. Dans le train binaire scalable on peut omettre des parties spécifiées et décoder une image complète avec la qualité correspondante au débit utilisé Scalabilité en MPEG2 Spatiale : le décodeur peut décoder les images de plusieurs résolutions Temporelle : une vidéo peut être décodée à la cadence temporelle différente SNR : la qualité différente d’une même source vidéo déterminée par le pas de quantification. Les trains binaires scalables contiennent toujours le « niveau de base » - la version « minimale » de la source.
Scalabilité spatiale Base layer SD Codage MPEG2 Décodage et sur-échantillonnage Filtrage spatial et sous-échantillonnage Prédiction Enhancement layer Prédiction Encodeur MPEG2 Source HD Le niveau de base est encodé indépendamment des niveaux d’amélioration
Scalabilité temporelle Base layer Encodage Source Décodage Enhancement layer Encodeur MPEG2
Profils et niveaux (I) La diversité des résolutions et des qualités d’encodage est formalisée en MPEG2 à l’aide des profils et niveaux. Profil : est défini comme un sous-ensemble de la syntaxe complète du train binaire Niveau : des niveaux sont définis à l’intérieur de chaque profil. Le niveau (level) est défini comme l’ensemble des contraintes imposées sur les paramètres du train binaire (par exemple, la résolution spatiale des images) Notation : profile@level, Ex. MP@LL signifie main profile@low level
Profils et niveaux (II) Profile Level Commentaire Simple main Main low,main, High-1440, High SNR Low, main scalable Spatial High-1440 ( base layer + SNR), High-1440(Base layer + spatial)… High Profile Main (Base layer + SNR), Main (Base Layer + spatial)… Scalable
Profils et niveaux. Exemples (III) Profile Level Résolution max, Nbr niveaux Simple main 720/576/30 Main low, main, High-1440, High 352/288/30 1440/1152/60 1920/1152/60 SNR 352/288/30, 2 niveaux 720/576/30, 2 niveaux Spatial High-1440 ( base layer + SNR), High-1440(Base layer + spatial)… 2 niveaux : base 720/576/30 ou 352/288/30 ou 768/576/30 Etc.. Enh. 1440/1152/30
TS contenant 1 ou plusieurs programmes MPEG 2 System Flux de programme (program stream) Flux de transport (transport stream). Le flux de transport est conçu pour communiquer ou enregistrer un ou plusieurs programmes audio, vidéo ou autre. Avant qu’un flux vidéo puisse être décodé, il doit être extrait du transport stream. Décodeur vidéo Canal Démulti- plexeur du TS Décodeur du canal Horloge Décodeur audio TS contenant 1 ou plusieurs programmes