La compression d’images animées Sébastien CRESPIN TER Réseaux – DESS TNI Université Montpellier II 5 décembre 2001
Plan de l’exposé 1. Principes de base 2. La compression MPEG La vidéo – La compression vidéo – Les données vidéo 2. La compression MPEG Le codage spatial – Le codage prédictif – La compensation de mouvement – Le codage bidirectionnel – La partie système 3. Normes et produits MPEG-1 – MPEG-2 – MPEG-4 – MPEG-7 – MPEG-21 – Formats propriétaires
1. Principes de base 1.1. La vidéo L’œil humain retient pendant un certain temps toute image imprimée sur la rétine. Principe : faire défiler un nombre suffisant d’images fixes par seconde, pour donner l’illusion de mouvement. En fait, au moins 25 images/sec.
1. Principes de base 1.1. La vidéo Deux grandes familles de systèmes vidéo : Systèmes vidéo analogiques Systèmes vidéo numériques
1. Principes de base 1.1. La vidéo Les systèmes analogiques : principe de balayage PAL/SECAM : 625 lignes, 25 trames/sec NTSC : 525 lignes, 30 trames/sec
1. Principes de base 1.1. La vidéo Les systèmes numériques : chaque trame est une matrice rectangulaire de pixels N&B : 8 bits par pixel, c.à.d. 256 niveaux de gris Couleur : 24 bits par pixel, c.à.d. 16,8 millions de couleurs
1. Principes de base 1.2. La compression vidéo Petit calcul simple : débit nécessaire pour un affichage vidéo numérique couleur en 1024 x 768 : Taille d’une image : 1024 x 768 x 24 = 2,25 Mo Débit nécessaire : 2,25 x 25 = 56,25 Mo/sec Taille d’un film de 2 h : 56,25 x 7200 = 395,5 Go La compression est obligatoire !
1. Principes de base 1.2. La compression vidéo But : réduire les redondances d’informations, tout en gardant une certaine qualité. Compression avec pertes : on accepte des pertes d’informations pas toujours visibles à l’œil. Difficulté : le taux de compression s’améliore, en même temps que la qualité devient médiocre.
1. Principes de base 1.2. La compression vidéo Deux sortes de redondances en vidéo : La redondance spatiale : redondance dans chaque image prise individuellement. Codage en JPEG de chaque image : on parle alors de MJPEG (Motion JPEG).
1. Principes de base 1.2. La compression vidéo La redondance temporelle : deux images qui se suivent sont quasiment identiques. L’idée : coder uniquement ce qui est modifié lors du passage d’une image à l’autre. On utilise la technique de compensation de mouvement.
La redondance spatiale et la redondance temporelle 1. Principes de base 1.2. La compression vidéo La redondance spatiale et la redondance temporelle
Hiérarchie des données dans le flux vidéo 1. Principes de base 1.3. Les données vidéo Hiérarchie des données dans le flux vidéo
2. La compression MPEG MPEG : Moving Picture Experts Group (on trouve aussi Motion Picture Experts Group) Comité fondé en 1988 dans le but de créer une norme pour stocker de la vidéo sur CD-ROM Dans cette partie : décrire et expliquer le principe de compression vidéo commun aux différentes normes MPEG
2. La compression MPEG 2.1. Le codage spatial Les images I (intracodées) : images complètes codées en JPEG. Typiquement, on code une image I toutes les 10 à 15 images. Les images I sont indispensables.
La différence entre les deux images est codée spatialement 2. La compression MPEG 2.2. Le codage prédictif Les images P (prédictives) : images codées par rapport à l’image précédente. La différence entre les deux images est codée spatialement
2. La compression MPEG 2.2. Le codage prédictif Utilité des images P : exemple On utilise la technique de compensation de mouvement
2. La compression MPEG 2.2. Le codage prédictif Exemple de séquence MPEG basique Problèmes de gestion de pertes et d’erreurs
2. La compression MPEG 2.3. La compensation de mouvement Principe : pour chaque macrobloc de l’image, on recherche dans l’image précédente un macrobloc identique ou semblable. On calcule ensuite la différence entre les deux macroblocs, et on code cette différence spatialement.
2. La compression MPEG 2.3. La compensation de mouvement Le fichier ainsi compressé contient : Un vecteur de déplacement entre le macrobloc de référence et le macrobloc qui va être codé Le terme d’erreurs : la différence entre le contenu du macrobloc de référence et le macrobloc qui va être codé
2. La compression MPEG 2.3. La compensation de mouvement Calcul des vecteurs de déplacements : la norme ne dit rien, implémentation laissée libre. Méthode la plus courante : similitude de blocs.
2. La compression MPEG 2.3. La compensation de mouvement
2. La compression MPEG 2.4. Le codage bidirectionnel
2. La compression MPEG 2.4. Le codage bidirectionnel Les images B (bidirectionnelles) : semblables aux images P, avec le macrobloc de référence qui peut être soit dans l’image précédente soit dans l’image suivante. Les images B peuvent se référer soit à une image I soit à une image P, mais pas à une autre image B.
2. La compression MPEG 2.4. Le codage bidirectionnel
2. La compression MPEG 2.4. Le codage bidirectionnel A cause des images B, on est obligé de changer l’ordre des images dans le flux vidéo
2. La compression MPEG 2.5. La partie système Deux flux à synchroniser : la vidéo et le son. Utilisation de deux paramètres inclus dans les paquets de données codées : L’horloge de référence du système Le marquage temporel
2. La compression MPEG 2.5. La partie système
3. Normes et produits 3.1. MPEG-1 Norme ISO/IEC 11172, finalisée en 1992. But : stocker et reproduire de la vidéo avec le son associé sur des supports de stockage, en qualité magnétoscope (352 x 288), avec un débit maximum de 1,5 Mbits/sec.
3. Normes et produits 3.1. MPEG-1 Principe : cf. partie 2 Restrictions techniques : Maximum 30 trames/sec Mode progressif uniquement Format de couleur 4:2:0 Aujourd’hui, MPEG-1 est la norme de stockage des vidéos sur CD-ROM au format CD-I ou CD-vidéo.
3. Normes et produits 3.2. MPEG-2 Norme ISO/IEC 13818, finalisée en 1996. But : compression de la vidéo de qualité télévision à un débit de 4 à 6 Mbits/sec, et compression de la télévision à haute définition (TVHD).
3. Normes et produits 3.2. MPEG-2 Principe : identique au MPEG-1. Différences techniques avec MPEG-1 : Mode entrelacé autorisé Maximum 60 trames/sec (ou 120 champs/sec) Formats de couleur 4:2:2 autorisé Résolutions : de 352 x 288 à 1920 x 1152 Débits : de 4 Mbits/sec à 100 Mbits/sec Multiplexage
3. Normes et produits 3.2. MPEG-2 Aujourd’hui, MPEG-2 est la norme de compression pour la TVHD et pour le stockage des films sur DVD. Produits : Sharewares aux alentours de 30 euros Logiciels professionnels de 100 à 600 euros Codecs gratuits de laboratoires universitaires
3. Normes et produits 3.3. MPEG-4 Norme ISO/IEC 14496, finalisée en v.2 en 1999. But : fusionner trois mondes (informatique, télécommunications et télévision). Standardisation multimédia à tous les nouveaux : production, distribution et diffusion. Domaines d’application : visiophonie, multimédia mobile, téléconférence, post-production, etc.
3. Normes et produits 3.3. MPEG-4 Principe : méthode orientée objets. Une scène devient une composition d'objets médias hiérarchisés, chaque objet étant décomposé en différents paramètres.
3. Normes et produits 3.3. MPEG-4 Utilisation du langage XMT (eXtensible MPEG-4 Textual format), pour décrire les relations spatiales et temporelles entre les objets vidéo. Les objets sont des VOP (Video Object Plan). Similitude avec le MPEG-1 et 2 : on a des I-VOP, P-VOP et B-VOP, et le principe de compensation de mouvement.
3. Normes et produits 3.3. MPEG-4 Aujourd’hui, MPEG-4 est utilisé dans son profil bas (10 trames/sec, débit maximum de 64 Kbits/sec), pour la visioconférence et le multimédia mobile. Stockage des films sur CD grâce au codec DivX;-)
3. Normes et produits 3.4. MPEG-7 Norme ISO/IEC 15938, en élaboration depuis 1997 But : simplifier et optimiser la recherche de fichiers multimédia.
3. Normes et produits 3.4. MPEG-7 Principe : spécifier une description standard des différents types d'informations multimédia. Cette description devra être associée au contenu lui-même pour permettre la recherche rapide et efficace des informations qui intéressent l'utilisateur.
3. Normes et produits 3.4. MPEG-7 Description en plusieurs niveaux : Forme, couleur, texture, mélodie, etc. Auteur, date de création, genre, etc. Agencement des objets dans la séquence Taille, durée, méthodes de codage, etc. Domaines d’application : bases de données multimédia, télévision et cinéma, e-commerce, journalisme, services culturels et éducatifs, etc.
3. Normes et produits 3.5. MPEG-21 Norme ISO/IEC 18034, en élaboration depuis 2000 Ajout d’une couche sécurité (déclaration, identification, protection) lors des échanges de matériaux audiovisuels Optimisation des interactions possibles entre les objets audiovisuels, et entre les utilisateurs et ces mêmes objets
3. Normes et produits 3.6. Formats propriétaires QuickTime : lancé par Apple en 1991. Indeo : lancé par Intel. Il est maintenant à la base de nombreux formats vidéo dont QuickTime et AVI. Codec DivX;-) : piratage et amélioration du codec MPEG-4 de Microsoft. Cinepak, Microsoft Video Codecs, Real, etc.
Références Livres MPEG-2, John Watkinson, Focal Press, 1999 Réseaux, Andrew Tanenbaum, Dunod, 1996 Sites web MPEG.org MPEG home page FAQ MPEG Travaux universitaires divers
En guise de conclusion La preuve par l’exemple Séquence vidéo Nombre total d’images : 750 Durée totale : 30 sec Nombre d’images/sec : 25 Résolution : 352 x 288 Taille originale : 222,5 Mo Vidéo : 352 x 288 x 24 x 750 = 217,5 Mo Son (à 172 Ko/sec) : 172 x 30 = 5,0 Mo
En guise de conclusion La preuve par l’exemple Compression en MPEG-1 : 2,1 Mo Taux de compression : 106:1 Débits nécessaires : Sans compression : 7,42 Mo/sec Avec compression MPEG-1 : 72 Ko/sec