H.264/MPEG4 AVC H.263/MPEG4 V1. H.264/MPEG4 AVC Principes clés : Codage intra-image et inter-image par des blocs de taille variable et par combinaison.

Slides:



Advertisements
Présentations similaires
Structures de données avancées : MLH (Multidimensional linear hashing)
Advertisements

Gestion de portefeuille
Modèle des jeux et des mécanismes
Cours 7 Problèmes d’ordre 2 en temps : Analyse modale
Unité #3 Analyse numérique matricielle Giansalvo EXIN Cirrincione.
Compression des images et de la vidéo : principes
Xavier Décoret* Frédo Durand° François Sillion*
2. Echantillonnage et interpolation des signaux vidéo
Codage par transformées(1)
6. Quantification des signaux visuels. Codage prédictif (MICD)
Laboratoire Bordelais de Recherche en Informatique 23/02/ Caractérisation du mouvement et méthodes par comparaison du mouvement - Présument une.
3. Analyse et estimation du mouvement dans la vidéo
8. Transformées Orthogonales et Codage par transformées
Vidéo Numérique: Analyse et Codage Cours en Master ISM Jenny Benois -Pineau Partie II Université Bordeaux -1.
Les premier codecs des images animées :
Standard MPEG2 La structure fondamentale et les algorithmes de codage MPEG2 sont les mêmes que pour MPEG1 (*) - architecture I,B,P (**) - codage du.
A Pyramid Approach to Subpixel Registration Based on Intensity
Piecewise Affine Registration of Biological Images
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Maria-João Rendas CNRS – I3S Novembre 2006
Le codage, la compression et l’édition vidéo
A.Faÿ 1 Recherche opérationnelle Résumé de cours.
Chapitre II.Rappels mathématiques et complexité
L’objectif est de présenter
Le Codage M P E G PAR ERAUD yann BLAS Tony CANUTE Amirt.
Algorithmes Branch & Bound
ASI 3 Méthodes numériques pour l’ingénieur
Rappel... Opérations élémentaires sur les matrices:
Chapitre 2 : Filtrage Professeur. Mohammed Talibi Alaoui
3 - Compression des images.
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Rappel... Solution itérative de systèmes linéaires (suite et fin).
DEA Perception et Traitement de l’Information
Un principe de compression d’image
Examen partiel #3 Mercredi le 15 décembre de 15h30 à 17h20
Courbes de Bézier.
Modélisation de l’impact d’un réservoir rempli de fluide par la méthode SPH Directeur de thèse : Alain Combescure ( Lamcos )
SUJETS SPÉCIAUX EN INFORMATIQUE I
Pr. M. Talibi Alaoui Département Mathématique et Informatique
Programmation linéaire en nombres entiers : les méthodes de troncature
L’adaptativité pour un solveur de l’équation de Vlasov
l’algorithme du simplexe
La décomposition en valeurs singulières: un outil fort utile
Géométrie épipolaire (deux vues)
ASI 3 Méthodes numériques pour l’ingénieur
Rappel... Valeurs propres et vecteurs propres. Définitions;
Etude et test des algorithmes d'estimation de mouvement en MPEG
Programmation linéaire en nombres entiers
Calcul parallèle => partitionner les données en sous-groupes associés aux processeurs. P0 P2 P1.
Régulation de débit pour MPEG-4 SVC
Algorithmes Branch & Bound
I.A. Session 2009/2010 E.P.S.I. Bordeaux – C.S.I.I – 2 ème Année – Cours n°6.
Modèles Mathématiques et représentation discrètes pour la description des images couleur Luc Brun.
CHAPITRE III Calcul vectoriel
Apparence globale 1 image = 1 vecteur Base apprentissage Rotation –capture les variabilités Troncature –Quelques coefficients Représentation linéaire Espace.
INF3500 : Conception et implémentation de systèmes numériques Pierre Langlois Performance de circuits.
- 5 - Optimisation linéaire et non-linéaire
PROGRAMMATION SCIENTIFIQUE EN C PRO Résolution de système d’équations non- linéaires (racines d’équations) u Méthode de la bissection u Analyse.
1/16 Chapitre 3: Représentation des systèmes par la notion de variables d’état Contenu du chapitre 3.1. Introduction 3.2. Les variables d’état d’un système.
Post-optimisation, analyse de sensibilité et paramétrage
programmation linéaire
1. Méthode du simplexe et son analyse.
PROGRAMMATION SCIENTIFIQUE EN C
A propos du “Minimal Controllability Problem” C. Commault Département Automatique Gipsa-Lab Grenoble –FRANCE 1 Séminaire GIPSA-Lab 22 octobre 2015.
Compression d’images par DCT et par Ondelettes.
Pierre Joli Cours de Mathématique Pierre Joli
GdR MoMaS Novembre 2003 Conditions d’interface optimales algébriques pour la vibro-élasticité. François-Xavier Roux (ONERA) Laurent Sériès (ONERA) Yacine.
Gestion de portefeuille Chapitre 5: Portefeuille efficient au sens de Markovitz.
1 UE Intro. Optimisation L3 INFO UPSud II. Programmation linéaire en variables entières (ou mixtes)
Transcription de la présentation:

H.264/MPEG4 AVC H.263/MPEG4 V1. H.264/MPEG4 AVC Principes clés : Codage intra-image et inter-image par des blocs de taille variable et par combinaison des blocs (H.264) Sélection du meilleur mode intra/inter, configuration locale Codage au sens débit/distorsion.

La norme H.264 Le standard de codage vidéo qui dépasse les performances de H.263/MPEG4-V1 Lintitulé AVC = Advanced Vidéo Coding Fait partie de MPEG4 = V. 10 ISO/IEC and IUT Rec H.264 Date 2003

Représentation et compensation du mouvement H. 264 Partition arborescente récursive : - décomposition des macroblocs 16x16: 16x16, 2x 16x8, 2x8x16, 4x8x8 - décomposition des blocs 8x8 : 8x8, 2x8x4,2x4x8, 4x4x4

Estimation du mouvement MPEG2 – uniquement 1 niveau : estimation du mouvement sur de macro-blocs 16x16, H. 263 /MPEG4 V1 – uniquement 2 niveaux : 16x16 et 8x8 Image courante à encoder Image de référence précédente Principe: recherche du vecteur optimal au sens dun critère de compensation

H.264 : Compensation du mouvement « arborescente » 8x8 16 x 88 x 168 x 8 8x44x 8 4x 4 La partition la plus fine : par de blocs de taille 4x4 pixels.

Exemple de décomposition optimale H. 264 From Iain E.G. Richardson : H.264 and MPEG- 4, WIley, 2003, curtesy to the author

Codage optimal au sens débit/distorsion - D(C) : distorsion du codage ; - R(C) : débit associé au codage.. D(C) R(C) H. 264: Comment choisir la partition optimale étant donné le débit maximal à respecter. Partition optimale : pour le débit donné choisir la partition minimisant la fonctionnelle derreur.

Construction dune partition optimale au sens débit – distorsion des images vidéo (1) Daprès E. Reusens, « Joint optimization of representation model and frame segmentation for generic video compression », Signal Processing, 46, 1995, 105 – 117 Problème classique de la théorie dallocation des ressources : Etant donné un quota de ressources, déterminer la distribution parmi lensemble dactivités pour maximiser le rendement. Notations : L – un ensemble fini des stratégies admissibles B – une stratégie : - fonction du rendement - « ressource »

Construction dune partition optimale au sens débit – distorsion des images vidéo (2) Formulation du problème : trouver la stratégie qui maximise le rendement sous contrainte ou Fonction de « rendement » de Lagrange - multiplicateur de Lagrange

Construction dune partition optimale au sens débit – distorsion des images vidéo (3) Théorème :

Construction dune partition optimale au sens débit – distorsion des images vidéo (4) Formualtion pour le codage de la source : minimiser la distorsion D(B) sous contrainte du débit disponible Mesure de distorsion -erreur quadratique du codage (ou de compensation du mouvement). La recherche exhaustive de la solution optimale sous contrainte nest pas possible à cause de la multitude des solutions. Minimisation du fonction de coût de Lagrange.

Construction dune partition optimale au sens débit – distorsion des images vidéo (5) La solution est basée sur le théorème (1) Trouver tel que (2) Trouver la solution B* Nous allons considérer dabord (2) : comment minimiser pour fixé.

Construction dune partition optimale au sens débit – distorsion des images vidéo (6) Le plan-image est tout dabord divisé en ensemble des N macro-blocs MB non- recouvrants. La fonctionnelle est additive par la nature de D et de R. Donc la minimisation pour limage complète peut être effectuée indépendamment pour chaque MB.

Construction dune partition optimale au sens débit – distorsion des images vidéo (7) Les configurations de Reusens 1 config configurations au total, pour chaque nœud en plus inter-intra

Construction dune partition optimale au sens débit – distorsion des images vidéo (7) 1. Pour chaque nœud on choisit le mode optimal ( ex. inter/intra) 2. Pour chaque nœud macro-bloc MBi on choisit la configuration minimisant - additive. Ensuite on peut remonter vers les partitions plus grossières en effectuant la récursion « des feuilles vers le sommet » sur larbre de la partition du plan-image. Dans un codec H. 264 on sarrète au niveau MB car un MB est lunité la plus grande de partition. Calcul du Débit R, Distorsion D et J globales par image :

Construction dune partition optimale au sens débit – distorsion des images vidéo (8) Considérons maintenant (1) : trouver La fonction R(B) est monotonne vis-à-vis de Il sagit de trouver la racine de léquation Algorithme : 1.1 Choisir 1.2. Appliquer la méthode de bissection : –Calculer –Si alors sion f-si 1.3 Condition darrêt :

H. 264 Nouveautés Fondamentales Compensation du mouvement avec la structure de larbre; Transformation DCT entière; Mise en échelle des coefficients de DCT. Codage entropique CABAC – Content – Based Adaptive Binary Arithmetic Coding

Structure arborescente des macro-blocks 16x16 pels 8x8 pels 4x4 pels

Codage des vecteurs de déplacement Le nombre de vecteurs de déplacement peut être important à cause de la taille variable des blocs. Codage prédicitif : MVD = MV -MVp

Prédiction des vecteurs de déplacement A B C E 16x16 16x8 4x8 B A 8x4 C E (1)E=med(A,B,C) (2) Prédiction par voisinage causal pour les partitions 16x8 et 8x16

Approximation de TCD en H.264(1) Objectifs : réaliser des calculs en entier autant que possible; Limiter la dynamique des coeficients ( calculs avec la représentation sur 16 bits) Au lei de la TCD 8x8 on propose une transformée approximant la TCD 4x4 pels.

Approximation de TCD en H.264(2) TCD pour les blocs de taille 4x4

Approximation de TCD en H.264(3) On démontre que cette multiplication matricielle peut être factorisée Signifie la multiplication élément par élément Sappelle la « transfromation principale »

Approximation de TCD en H.264(3) Pour simplifier les calculs on approxime Alors pour maintenir lorthogonalité des fonctions de base, on modifie Enfin pour éviter les multiplications par 0.5 on multiplie 2 ème et 4 ème lignes de C par 2 et 2 ème et 4 ème colonne de C T de même On compense cela dans la matrice E

Approximation de TCD en H.264(4)

Approximation de TCD en H.264(5) Transformée inverse Orthogonalité : Remise en échelle – différence avec la quantification inverse