La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/2006 1 Son : codage et compression.

Présentations similaires


Présentation au sujet: "Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/2006 1 Son : codage et compression."— Transcription de la présentation:

1 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Son : codage et compression

2 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Son : phénomène physique Naît en général de la déformation dun corps : –corde dun violon frottée par larchet, –membrane dun instrument à percussion déformée par le choc du maillet… Cette déformation engendre une vibration mécanique qui va déformer le milieu dans lequel se trouve ce corps La vibration va se propager selon une onde dite sonore ou acoustique Onde circulaire

3 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Transmission dun son La vibration de lair constitue un phénomène périodique car elle se reproduit identiquement à elle-même au bout dun certain temps appelé période. La période (T), exprimée en secondes, désigne le temps nécessaire à un cycle vibratoire complet, cest-à-dire à une oscillation La fréquence (f) définit le nombre de périodes par unité de temps : il sagit de cycles par secondes ou Hertz (Hz)

4 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Période, Fréquence Caractéristiques temporelles de la vibration génératrice du son Exemple : mouvement périodique dont la fréquence est de 4Hz La Période est 0,25 s Plus la période est petite, plus la fréquence est grande La fréquence est linverse de la période : f=1/T Temps 1,00 0,25 0,75 0,50 Période Fréquence = 4 Hz Amplitude

5 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Amplitude et Audibilité Lamplitude est la grandeur de la vibration Si par exemple une source émettait une vibration de fréquence 4Hz, celle-ci serait inaudible quelle que soit son amplitude car on considère généralement que la perception auditive humaine sétale dans le meilleur des cas, entre 20 et Hz Cette fourchette Hz définit la bande de fréquences ou bande passante utile quun système de reproduction sonore de haute qualité doit sefforcer de reproduire le plus linéairement possible

6 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Exemples de bandes passantes SystèmeBande passante (Hz) Téléphone Radio AM Radio FM Magnétophone K CD audio et matériel professionnel

7 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Signal pur, signal complexe Un son pur est défini par une seule fréquence Les sons que lon rencontre généralement ne sont pas purs, constitués de plusieurs fréquences, ils sont dits complexes Dans tout son complexe, à la fréquence fondamentale qui définit la hauteur sonore viennent sajouter une série de signaux dits harmoniques. Temps Son pur Son complexe

8 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Signal fondamental, signal harmonique (1) Fourier a démontré mathématiquement que tout phénomène périodique pouvait être décomposé en une série de sinusoïdes élémentaires dont les fréquences sont des multiples entiers de la fréquence la plus grave dite fondamentale Si par exemple nous frappons la touche dun piano correspondant au « la », nous obtenons un son complexe constitué par laddition à la fréquence fondamentale (440Hz) –et à des amplitudes variables- des fréquences dites harmoniques à des valeurs double, triple, quadruple, etc. de cette fondamentale (harmonique 2 à 880Hz, harmonique 3 à 1320 Hz, 4 à 1760 Hz, etc.)

9 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Signal fondamental, signal harmonique (2) Le nombre et lamplitude des diverses fréquences harmoniques sont spécifiques à chaque source sonore et déterminent le timbre propre de cette source. Les harmoniques caractéristiques de chaque source qui permettent à loreille et au cerveau humains de distinguer des sources sonores différentes. Le timbre dune voix émettant par exemple à une fréquence fondamentale de 400Hz sera perçu comme différent de celui dune autre voix émettant pourtant à la même fréquence fondamentale

10 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Format du son 2 types de formats pour stocker des sons ou de la musique : Les formats numériques. Les formats musicaux. Formats numériques : Stocker une approximation du son analogique. Constitué d'une suite d'échantillons. Formats musicaux : Stockent essentiellement des informations sur quand et comment jouer tel ou tel instrument.

11 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Formats numériques Stocker des sons, des textes parlés ainsi que des morceaux de musique. 2 Dimensions : temps et amplitude. Stocker une approximation du son analogique :

12 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Numérisation du son Numérisation d'un signal sonore : 2 étapes. Echantillonnage : –Discrétisation dans le temps. –Choix du nombre d'échantillons par seconde. Quantification : –Discrétisation de l'amplitude. –Choix de la précision de représentation d'un échantillon.

13 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Echantillonnage du son Discretisation dans le temps : Découpage en "tranches". Choix du nombre d'échantillons par seconde. Ex. : échantillonage à 11 KHz. Le son est analysé fois par seconde.

14 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Quantification du son Discrétisation de l'amplitude. –Choix de la précision de représentation d'un échantillon. Ex. : représentation sur 1 octet. –Un échantillon est codé sur 256 niveaux.

15 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Fonctions de quantifications Quantification par arrondi (valeur approchée) –Larrondi permet tantôt de supprimer, tantôt dajouter : la somme de toutes ces petites « erreurs » peut être souvent voisine de zéro et donc avoir une incidence moindre que la seconde procédure suivante Quantification par troncature –Conduit toujours à des suppressions de valeurs

16 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Echantillonnage et quantification Exemple : –Echantillonage : 10 Hz. –Quantification : 3 bits Exemple animé

17 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Distorsion de quantification Le bruit de quantification affecte gravement les signaux de faible amplitude Lorsque le niveau du signal augmente, lerreur de quantification (dont la valeur maximale est toujours égale à q/2) devient de plus en plus petite relativement à lamplitude du signal q

18 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Echantillonnage : fréquence optimale Théorème de Shannon : Si un signal est échantillonné périodiquement à une fréquence au moins égale à deux fois la fréquence la plus élevée contenue dans ce signal, l'ensemble des échantillons contient toute l'information du signal d'origine. SystèmeBande passante(HZ) Fréq. dechantill. Téléphone300 – kHz CD audio et matériel professionnel 20 – KHz

19 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Echantillonnage : fréquence optimale (2) On peut alors déterminer la fréquence d'échantillonnage optimale. Par exemple : –Le domaine perceptible par l'oreille humaine : jusqu'à 20 kHz. –La qualité CD est donc fixée à 44100Hz. –Celui de la parole est restreint à 150 Hz - 5 kHz. –En téléphonie, on utilise 8 kHz.

20 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Qualité de la numérisation Dépend de 3 paramètres. Fréquence d'échantillonnage (nombre d'échantillons/seconde). –Qualité téléphonique : 8 kHz. –Qualité CD : 44,1 kHz. Le nombre de bits par échantillon : –8 bits (qualité médiocre). –16 bits (qualité CD). Le nombre de canaux : –1 canal : son mono. –2 canaux : son stéréophonique. –4 canaux : son quadriphonique.

21 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Numérisation et taille des données (1) Exemple : numérisation qualité CD. –Fréquence d'échantillonnage : 44 KHz. –Nombre de bits par échantillon : 16 bits. –Nombre de canaux : 2 (stéréo) échantillons par seconde, chacun nécessitant 2 octets, le tout stocké en double : – x 16 x 2 = bits/s. –C'est-à-dire 172 Ko/s.

22 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Numérisation et taille des données (2) 8 bits mono8 bits Stéréo16 bits mono16 bits stéréo 8000 Hz voix 7 kb/s 420 Ko 15 kb/s 900 Ko 31 kb/s 1860 Ko Hz voix,mus. 10 kb/s 600 Ko 21 kb/s 1260 Ko 43 kb/s 2580 Ko Hz musique 21 kb/s 1260 Ko 43 kb/s 2580 Ko 86 kb/s 5160 Ko HZ musique 43 kb/s 2580 Ko 86 kb/s 5160 Ko 172 kb/s Ko (CD-A) Exemples

23 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Le format WAV (Waveform audio File Format) Le format propriétaire de lenvironnement windows sur PC Lu directement par le lecteur multimédia de windows ou le lecteur QuickTime ainsi que la quasi-totalité des logiciels dédition ou de compression musicale Le format de données comprend : –44 octets d'en-tête permettant une identification. –Une structure les organisant. –Le codage des données.

24 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Le format AIF ou AIFF (ou SND) AIFF (Audio Interchange File Format). Apple 1988 : –Fichiers son de haute qualité. –Initialement développé pour les ordinateurs Macintosh. Jusqu'à 44,1 kHz en 16 bits. Equivalent Macintosh du format WAV. Devenu le premier format déchange multi- plateformes.

25 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Le format AU Format développé par UNIX Lu par la quasi-totalité des logiciels

26 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Real Audio (RA, RM ou RAM) Format propriétaire adapté aux débits limités de Internet pour la diffusion de sons ou de vidéos en streaming. Peuvent être lus grâce à lapplication spécifique RealPlayer (en version commerciale ou shareware).

27 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Quicktime (MOV ou QT) Destiné à lorigine à lenvironnement Macintosh. Il est aujourdhui disponible sur PC et peut être utilisé pour réaliser du streaming.

28 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ MP3 (MPEG-Layer 3) Brevet de lalgorithme de compression déposé en 1996 par linstitut de recherche allemand Fraunhofer, qui fait partie du groupe Thomson Multimédia. Recommandé par le MPEG (Mouving Picture Experts Group) Autorise un taux de compression important sans altérer notablement la qualité sonore (du moins jusquà un taux de lordre de 12:1) De nombreux lecteurs permettent la restitution des fichiers.mp3 : WinAmp, Nad mp3 Player, UnrealPlayer, JetAudio, etc. Taux de compression très intéressant, dautant plus que ceux-ci sont adaptables en fonction de la bande passante disponible pour la diffusion en temps réel (streaming) du fichier compressé.

29 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ MP3, à titre comparatif FormattempsBande passante Taux de compression taille MP31min de musique 64Kbits/s22:1469 Non compressé CD audio Même min de musique 10 Mo MP3//64Kbits/sTrès forte MP3//96Kbits/sTrès forte MP3//128Kbits/s11:1 Qualité médiocre Qualité améliorée Bonne qualité //192Kbits/s7:1 Qualité CD

30 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Formats musicaux Les fichiers de sons de synthèse. Permettre aux musiciens de contrôler plusieurs instruments électroniques à partir d'un seul. Stocker des messages musicaux permettant de piloter un périphérique MIDI : –Quelle note jouer, –Sur quel instrument, –A quel volume, etc. Les instruments ne sont pas définit dans le format, ce qui permet un gain de place considérable. Faible volume d'information requis (1000 fois que le signal audio en qualité CD) La qualité de la musique dépend du périphérique utilisé pour la jouer. Ex. : le format MIDI (Musical Instrument Digital Interface).

31 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Le format MIDI Le format MIDI (Musical Instrument Digital Interface). –16 canaux : 16 instruments peuvent jouer en même temps. –Indications sur quelle note jouer, sur quel instrument, à quel volume, etc. Gain de place : 2 minute : –Format MIDI : 80 Ko. –Format WAV : 20 Mo (qualité CD). Fichier facilement éditable avec un séquenceur MIDI. Il est facile de changer les instruments.

32 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Le format MIDI : limitations Utilisable que pour la musique. La qualité de la musique : –Dépend du périphérique utilisé pour la jouer. –(En particulier le nombre de canaux). Le codage des instruments n'est pas normalisé : –Par exemple : un morceau de violon peut être interprété par un saxophone sur un autre synthétiseur. Obligation d'utiliser des sons déjà existants : Impossible d'intégrer un son créé par le musicien (échantillonné ou réellement synthétisé).

33 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Compression des sons Principale méthode de compression de sons : –Retirer des données audio les fréquences inaudibles par l'oreille humaine L'oreille humaine : –Capable de discerner des sons entre 0.20Khz et 20Khz. –Sensibilité est maximale entre 2 et 5Khz.

34 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Méthodes de compression des sons Principale méthode de compression (MPEG, PASC) : –Modèle psycho-acoustique. –Déterminer les sons que nous n'entendons pas. –Les supprimer : "masquage". Mais aussi... Elimination de la redondance : –Utilisation de l'Algorithme de Huffman. Codage paramétrique, par modélisation de la voix (LPC) : –Analyse de la voix. –Codage et transmission des paramètres de modélisation de la cavité acoustique. –Synthèse en réception

35 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Méthodes de compression des sons (2) Autres traitements : –Suppression des silences, Chercher un compromis : –Débit. –Qualité exprimée en MOS (Mean Opinion Score) : 5 : excellent. 4 : bon (dégradation à peine perceptible) 3 : passable (dégradation perceptible, mais on reconnaît son interlocuteur). 2 : médiocre (dégradation considérable, voix synthétique) 1 : mauvais (problèmes d'intelligibilité). –Retard introduit par la compression (peut varier de 0,125 à 30 ms). –Complexité de l'algorithme

36 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Algorithme PASC 2 tâche distinctes : Un rôle filtreur : –Eliminer du signal toutes les fréquences inférieures à 15 Hz et supérieures à 20 KHz. Un rôle échantillonneur : –Diviser le spectre audible en 32 bandes de 720 Hz chacunes. –Comparer la valeur moyenne de chaque bande à la valeur correspondant sur la courbe de réponse de l'oreille. –Toute bande en dessous de la courbe de réponse est éliminée. –Chaque bande retenue est divisée en 12 sous-bandes échantillonées sur 16 bits. –On compare encore une fois la valeur des sous-bandes à la courbe de référence. –On quantifie les différences à la courbe, et on code ces différences sur un nombre minimum de bits. –Ces opérations sont renouvelées tous les 8 millièmes de seconde.

37 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Algorithme PASC (2)

38 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Algorithme PASC (3) 6 bandes (traits verticaux) : –Traversent ou non la zone de masquage. –2 restent sous la courbes : rejetées. –Les 4 autres sont échantillonnées en 12 autres sous-bandes. –Pour chaque sous-bande : un nombre de bits. Taux de compression : ~ 25 %.

39 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ MPEG Audio MPEG (Moving Picture Experts Group). –Echantillonnage à 32, 44.1 ou 48 kHz. –Précision équivalant à une quantification à 16 bits par échantillon. 3 niveaux de compression possibles : –Layer 1 : 192 kbit/s (compression 4:1). –Layer 2 : 128 kbit/s (compression 6:1). –Layer 3 : 64 kbit/s (compression 12:1) (le célèbre MP3!!!). Spectre divisé en 32 sous-bandes. Application du modèle psycho-acoustique : –Calcul des masquages (ne conserver que les sons audibles). –Allocation du nombre de bits. –Quantification.

40 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Codage PCM PCM (pulse code modulation) : –Sans compression. –Stockage des échantillons tels quels dans un fichier. –Taille varie avec le temps, le nombre de bit d'échantillonnage et la fréquence d'échantillonnage. Variantes de PCM : u-law PCM et A-law PCM : –Utilisent une valeur du signal espacée selon une échelle logarithmique. –Taux de compression de 1.75 pour 1. –Stocke les échantillons sur 8 bits au lieu de 14 bits.

41 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Compression ADPCM ADPCM (Adaptative Differential Pulse Code Modulation) : –Se base sur une suite d'échantillons pour prédire le prochain échantillon. –Stocke l'erreur de prédiction à l'aide d'une valeur de 4 bits. L'algorithme de prediction peut être complexe ou très simple : –Ex. : prédiction : "la prochaine valeur du signal est égale à la valeur actuelle". –Dans ce cas, on stocke les différences entre les signaux :

42 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Compression ADPCM (2)

43 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Compression ADPCM (3) 4 bits sont utilisé pour la prédiction au lieu de 16 en PCM : –Taux de compression de 4 pour 1. –La qualité du signal à la sortie est de très bonne qualité. Il existe plusieurs variances de ADPCM : ADPCM G.721 : –Débit : 32 kbit/s. –Echantillons codés sur 4 bits. –Très bonne qualité (MOS 4,4). –Retard négligeable (0,125 ms). –Complexité : 6,5 MIPS.

44 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Compression ADPCM (4) ADPCM G.726 : –Débit 40/32/24/16 kbit/s. –Echantillons codés sur 5/4/3/2 bits. –Qualité : MOS de 4,5 à 2. –Mêmes principes que G.721. ADPCM G.722 : –Spectre : Hz. –Echantillonnage à 16 kHz. –Codage ADPCM appliqué à deux sous-bandes ( et Hz). –Débit 64/56/48 kbit/s. –Excellente qualité. –Technique utilisée pour la visioconférence sur RNIS (H.320)

45 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Compression LPC et CELP LPC et CELP : –Spécialisés pour la parole, –Mauvais resultats pour les autres sons (musique, bruit...). LPC (Linear Predictive Coding) : –Code la parole en se basant sur un modèle analytique simple des cordes vocales. Ex. d'algorithme LPC : norme GSM. –Téléphonie cellulaire numérique en Europe. –Taux de compression : 8 pour 1. CELP (Code Exited Linear Prediction) : –Même modèle que LPC –Stocke en plus l'erreur entre le modèle et la vrai parole. –Qualité supérieure mais demande un débit plus grand.

46 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Récapitulatif Real Audio : –Format propriétaire. –Qualité inférieure à MPEG. –Fichiers de tailles réduites. –Idéal pour le son en direct sur Internet.

47 Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/ Audio format 16-bit PCM 32Kbps MPEG-1 ADPC M RealAudio v1.0 File extension.wav or.aiff.mpa or.mp2.wav.ra Data rate128Kbps32Kbps 8Kbps File size per minute 960K240K 59K Compression factor 1:14:1 16:1 Sound quality KHz mono audio formats


Télécharger ppt "Université de Technologie de Belfort Montbéliard par Sid-Ahmed Lamrous Le 26/04/2006 1 Son : codage et compression."

Présentations similaires


Annonces Google