Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/2002 1 Son : codage et compression.

Slides:



Advertisements
Présentations similaires
TECHNOLOGIE DES ORDINATEURS
Advertisements

Analyse temps-fréquence
Numérisation du signal principes
Université de La Rochelle Laboratoire Informatique Image Interaction Son Vincent Courboulay Janvier 2004.
Une approche informationnelle de la restauration d’images
PRINCIPE SIMPLIFIE DE LA COMPRESSION MP3
1 Jean-Paul Stromboni, mars 2005, Révision des cinq premières séances S.S.I. Jean-Paul Stromboni, mars 2005, ESSI1 Elève : ______________________ groupe.
S.S.I., ESSI1, lundi 9 mai 2005 Page 1 Comment compresser avec le spectre Séance 10, 1 heure Version : lundi 9 mai 2005 Auteur : Jean-Paul Stromboni Contenu.
Calculs de complexité d'algorithmes
Filtres (n entier, Te=1s)
Calcul de la composition fréquentielle du signal audio
1 Jean-Paul Stromboni, mars 2005, Révision des cinq premières séances S.S.I. Jean-Paul Stromboni, mars 2005, ESSI1 Elève : ______________________ groupe.
Codage de la parole Ivan Magrin-Chagnolleau, CNRS
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Du signal continu au numérique
Mesures dans le domaine fréquentiel
Architecture de réseaux
Performances 1 Évolution : Performance. Performances 2 Évolution : Mémoire.
Comment bien échantillonner
Son : codage et compression
Son : codage et compression
Ordonnancement des mouvements de deux robots
1 PolytechNice-Sophia, Département S.I., S.I.3, octobre 2012, Jean-Paul Stromboni Séance 7 : Retour sur les cinq premiers chapitres du cours S.S.I.I.
Lenregistreur numérique Formation par Maurice Périard Novembre 2012.
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
LE SON & L’ AUDITION Dr CHAKOURI M.
Le Codage M P E G PAR ERAUD yann BLAS Tony CANUTE Amirt.
Application des algorithmes génétiques
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 1 : La notion de système.
Modélisation d'environnements forestiers
Traitement Numérique du Signal
Le son numérique Note : Il n’est pas possible de traiter de manière approfondie un sujet comme le son numérique. Cette courte présentation n’a comme seule.
5. Echantillonnage Introduction
SSII : séance finale , lundi 9/01/2012 Page 1 Voici quelques questions pour assimiler la seconde partie du cours S.S.I.I., spectre, filtrage, banc.
Divers procédés de modulation sont utilisés dans le domaine hertzien et dans le domaine câblé pour transporter les informations numériques Ces techniques.
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Méthode des k plus proches voisins
S.S.I.I., , cours n°8 : Compresser avec un banc de filtres Page 1 Compresser avec un banc de filtres Le contenu de ce cours : T.D. n° 8 : simulation.
F Copyright © Oracle Corporation, Tous droits réservés. Créer des programmes avec Procedure Builder.
Partie 1: Ondes et Particules.
Analogique-numérique
Un moyen de compresser le signal audio présenté à travers un exemple
Représentation numérique de l’information
S.S.I., ESSI1, le 8 février 2004 Page 1 Numériser le signal audio Séance 2, cours, 1 heure auteur : Jean-Paul Stromboni Idées clefs de la séance De nombreuses.
Reconnaissance Vocale
Courbes de Bézier.
Les changements de numéraire dans la tarification d’options
3ème partie: les filtres
Les formats Débutant – Semaine 4.
SCIENCES PHYSIQUES ET CHIMIQUES FONDAMENTALES ET APPLIQUEES
SUJET D’ENTRAINEMENT n°4
Préparé par Louise Levasseur1 Encoder une piste musicale avec MUSICMATCH A l'aide du magnétophone de MUSICMATCH et de vos CD de musique, vous pouvez encoder.
ASI 3 Méthodes numériques pour l’ingénieur
7 - Son.
Théorie de l'Échantillonnage
Chapitre 1 Correction des exercices.
1. Présentation générale du système
Suites numériques Définitions.
L’ordinateur et la musique: initiation à MIDI et au studio maison
SoundEngine Un serveur d ’effets sonore en temps réel Juillerat Nicolas.
Les Réseaux Informatiques La couche physique Laurent JEANPIERRE DEUST AMILOR.
Juillet 2001  Les organes Cavité nasale Cavité buccale Langue Épiglotte et cordes vocales Trachée Voile du palais.
Cours 8 La transmission.
Julien Tardot Romain Tisserand Exposé SI28 Printemps 2005
Stéphanie Lechanteux Stéphane Moreau Exposé SI 28.
Edition et Enregistrement Sonore Damien DUJARDIN UTC - SI28 - A06.
Guillaume AUDIBERT & Thomas DERIVE Présentent dans le cadre de l’UV si28.
Sound Forge 4.0 Matthieu LOUVET23/11/2003 SI28. SI28 Présentation du logiciel Sound forge 4.0 Sommaire  Qu’est-ce qu’un son ?  L’échantillonnage  Principaux.
AUDACITY Jiuying LI Benoît CHARPENTIER. Audacity est un éditeur audio Permet de modifier vos fichiers sonores Exemples de fonctionnements: -Mixez plusieurs.
Qu'est-ce que le son ? Le son est une vibration de l'air, c'est-à-dire une suite de surpressions et de dépressions de l'air par rapport à une moyenne,
Transcription de la présentation:

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Son : codage et compression

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Format du son  2 types de formats pour stocker des sons ou de la musique :  Les formats numériques.  Les formats musicaux.  Formats numériques :  Stocker une approximation du son analogique.  Constitué d'une suite d'échantillons.  Formats musicaux :  Stockent essentiellement des informations sur quand et comment jouer tel ou tel instrument.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Formats numériques  Stocker des sons, des textes parlés ainsi que des morceaux de musique.  2 Dimensions : temps et amplitude.  Stocker une approximation du son analogique :

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Numérisation du son Numérisation d'un signal sonore : 2 étapes. Echantillonnage : –Discrétisation dans le temps. –Choix du nombre d'échantillons par seconde. Quantification : –Discrétisation de l'amplitude. –Choix de la précision de représentation d'un échantillon.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Echantillonnage du son  Discretisation dans le temps : Découpage en "tranches". Choix du nombre d'échantillons par seconde.  Ex. : échantillonage à 11 KHz. Le son est analysé fois par seconde.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Quantification du son Discrétisation de l'amplitude. –Choix de la précision de représentation d'un échantillon. Ex. : représentation sur 1 octet. –Un échantillon est codé sur 256 niveaux.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Echantillonnage et quantification Exemple : –Echantillonage : 10 Hz. –Quantification : 3 bits

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Echantillonnage : fréquence optimale Théorème de Shannon : Si un signal est échantillonné périodiquement à une fréquence au moins égale à deux fois la fréquence la plus élevée contenue dans ce signal, l'ensemble des échantillons contient toute l'information du signal d'origine. On peut alors déterminer la fréquence d'échantillonnage optimale. Par exemple : –Le domaine perceptible par l'oreille humaine : jusqu'à 20 kHz. –La qualité CD est donc fixée à 44100Hz. –Celui de la parole est restreint à 150 Hz - 5 kHz. –En téléphonie, on utilise 8 kHz.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Qualité de la numérisation Dépend de 3 paramètres. Fréquence d'échantillonnage (nombre d'échantillons/seconde). –Qualité téléphonique : 8 kHz. –Qualité CD : 44,1 kHz. Le nombre de bits par échantillon : –8 bits (qualité médiocre). –16 bits (qualité CD). Le nombre de canaux : –1 canal : son mono. –2 canaux : son stéréophonique. –4 canaux : son quadriphonique.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Numérisation et taille des données (1) Exemple : numérisation qualité CD. –Fréquence d'échantillonnage : 44 KHz. –Nombre de bits par échantillon : 16 bits. –Nombre de canaux : 2 (stéréo) échantillons par seconde, chacun nécessitant 2 octets, le tout stocké en double : – x 16 x 2 = bits/s. –C'est-à-dire 172 Ko/s.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Numérisation et taille des données (2) 8 bits mono8 bits Stéréo16 bits mono16 bits stéréo 8000 Hz voix 7 kb/s 420 Ko 15 kb/s 900 Ko 31 kb/s 1860 Ko Hz voix,mus. 10 kb/s 600 Ko 21 kb/s 1260 Ko 43 kb/s 2580 Ko Hz musique 21 kb/s 1260 Ko 43 kb/s 2580 Ko 86 kb/s 5160 Ko HZ musique 43 kb/s 2580 Ko 86 kb/s 5160 Ko 172 kb/s Ko (CD-A)

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Le format WAV (1) Le format de données comprend : –44 octets d'en-tête permettant une identification. –Une structure les organisant. –Le codage des données. Fichier RIFF (Resource Interchange File Format), formé de blocs hiérarchisés :

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Le format WAV (2)

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Le format AIFF AIFF (Audio Interchange File Format). Apple 1988 : –Fichiers son de haute qualité. –Initialement développé pour les ordinateurs Macintosh. Jusqu'à 44,1 kHz en 16 bits. Equivalent Macintosh du format WAV.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Formats musicaux Les fichiers de sons de synthèse. Permettre aux musiciens de contrôler plusieurs instruments électroniques à partir d'un seul. Stocker des messages musicaux permettant de piloter un périphérique MIDI : –Quelle note jouer, –Sur quel instrument, –A quel volume, etc. Les instruments ne sont pas définit dans le format, ce qui permet un gain de place considérable. Faible volume d'information requis (1000 fois que le signal audio en qualité CD) La qualité de la musique dépend du périphérique utilisé pour la jouer. Ex. : le format MIDI (Musical Instrument Digital Interface).

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Le format MIDI Le format MIDI (Musical Instrument Digital Interface). –16 canaux : 16 instruments peuvent jouer en même temps. –Indications sur quelle note jouer, sur quel instrument, à quel volume, etc. Gain de place : 2 minute : –Format MIDI : 80 Ko. –Format WAV : 20 Mo (qualité CD). Fichier facilement éditable avec un séquenceur MIDI. Il est facile de changer les instruments.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Le format MIDI : limitations Utilisable que pour la musique. La qualité de la musique : –Dépend du périphérique utilisé pour la jouer. –(En particulier le nombre de canaux). Le codage des instruments n'est pas normalisé : –Par exemple : un morceau de violon. –Peut être interprété par un saxophone sur un autre synthétiseur. Obligation d'utiliser des sons déjà existants : Impossible d'intégrer un son créé par le musicien (échantillonné ou réellement synthétisé).

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Compression des sons Principale méthode de compression de sons : –Retirer des données audio les fréquences inaudibles par l'oreille humaine L'oreille humaine : –Capable de discerner des sons entre 0.20Khz et 20Khz. –Sensibilité est maximale entre 2 et 5Khz.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Méthodes de compression des sons Principale méthode de compression (MPEG, PASC) : –Modèle psycho-acoustique. –Déterminer les sons que nous n'entendons pas. –Les supprimer : "masquage". Mais aussi... Elimination de la redondance : –Utilisation de l'Algorithme de Huffman. Codage paramétrique, par modélisation de la voix (LPC) : –Analyse de la voix. –Codage et transmission des paramètres de modélisation de la cavité acoustique. –Synthèse en réception

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Méthodes de compression des sons (2) Autres traitements : –Suppression des silences, –Interfonctionnememt avec FAX, Huffman, etc. Utilisation de processeurs de signaux spécialisés (DSP). Chercher un compromis : –Débit. –Qualité exprimée en MOS (Mean Opinion Score) : 5 : excellent. 4 : bon (dégradation à peine perceptible) 3 : passable (dégradation perceptible, mais on reconnaît son interlocuteur). 2 : médiocre (dégradation considérable, voix synthétique) 1 : mauvais (problèmes d'intelligibilité). –Retard introduit par la compression (peut varier de 0,125 à 30 ms). –Complexité de l'algorithme (exprimée en MIPS requis pour le DSP).

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Algorithme PASC 2 tâche distinctes : Un rôle filtreur : –Eliminer du signal toutes les fréquences inférieures à 15 Hz et supérieures à 20 KHz. Un rôle échantillonneur : –Diviser le spectre audible en 32 bandes de 720 Hz chacunes. –Comparer la valeur moyenne de chaque bande à la valeur correspondant sur la courbe de réponse de l'oreille. –Toute bande en dessous de la courbe de réponse est éliminée. –Chaque bande retenue est divisée en 12 sous-bandes échantillonées sur 16 bits. –On compare encore une fois la valeur des sous-bandes à la courbe de référence. –On quantifie les différences à la courbes, et on code ces différences sur un nombre minimum de bits. –Ces opérations sont renouvelées tous les 8 millièmes de seconde.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Algorithme PASC (2)

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ Algorithme PASC (3) 6 bandes (traits verticaux) : –Traversent ou non la zone de masquage. –2 restent sous la courbes : rejetées. –Les 4 autres sont échantillonnées en 12 autres sous-bandes. –Pour chaque sous-bande : un nombre de bits. Taux de compression : ~ 25 %.

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 14/05/ MPEG Audio MPEG (Moving Picture Experts Group). –Echantillonnage à 32, 44.1 ou 48 kHz. –Précision équivalant à une quantification à 16 bits par échantillon. 3 niveaux de compression possibles : –Layer 1 : 192 kbit/s (compression 4:1). –Layer 2 : 128 kbit/s (compression 6:1). –Layer 3 : 64 kbit/s (compression 12:1) (le célèbre MP3!!!). Spectre divisé en 32 sous-bandes. Application du modèle psycho-acoustique : –Calcul des masquages (ne conserver que les sons audibles). –Allocation du nombre de bits. –Quantification.