S.S.I., ESSI1, le 8 février 2004 Page 1 Numériser le signal audio Séance 2, cours, 1 heure auteur : Jean-Paul Stromboni Idées clefs de la séance De nombreuses applications utilisent les sons numériques, téléphone, CD audio, ordinateur multimédia, radio,... Lobjectif ici est dintroduire le concept de signal numérique, expliquer comment un ordinateur numérise un son, définir la qualité de numérisation donner des conséquences. Savez vous répondre aux questions suivantes ? Où trouve ton un CAN dans un ordinateur ? Le bruit de quantification est-il un bruit audible ? Pourquoi respecter la contrainte de Shannon ? Que signifie PCM ? Comment échantillonner un son de fréquence 10kHz ? On numérise un signal sur 8bit, en monophonie, à 8kHz, durant 180s. Taille du fichier PCM nécessaire? Combien de pas de quantification avec B=12 bits ? Si B=8 bit, quelle est la taille du pas de quantification ? Sur la carte son Oui, il peut être gênant même Pour ne pas perdre dinformation Pulse Coded Modulation, Format non compressé Il faut une fréquence déchantillonnage dau moins 20000Hz 8x1x8000x180 bit 4096 pas soit 2 12 Cest 2/ 2 8 = à peu près
S.S.I., ESSI1, le 8 février 2004 Page 2 Les objets traités par l'ordinateur multimédia et le web sont numériques Numérique s'oppose à analogique multimédia numérique égale son et/ou images (=> vidéo) son : illustration de ce cours, les domaines d'application sont la musique et la parole traiter: enregistrer ou jouer, stocker, analyser, télécharger, filtrer, etc... par programmation « one, two, three, four »Guitare LA3
S.S.I., ESSI1, le 8 février 2004 Page 3 Numériser un son, c'est échantillonner et quantifier le signal audio signal : mesure d'une grandeur physique par un capteur –signal audio : mesure par un microphone de la pression de l'air fonction du temps. –microphone : capteur transformant en tension électrique la vibration de l'air propageant le son échantillonner = prendre des mesures ou échantillons périodiques –on note Te la période d'échantillonnage (seconde) –on note fe= 1/Te la fréquence d'échantillonnage, fe (s'exprime en Hertz ou Hz). t s(t) Te
S.S.I., ESSI1, le 8 février 2004 Page 4 Numériser un son, c'est échantillonner et quantifier le signal audio quantifier = coder en binaire les échantillons –on note B le nombre de bits dun échantillon Lintervalle [-1,1] des valeurs possibles du signal audio est découpé en 2 B pas de quantification égaux (cas dune loi de quantification uniforme). on associe à léchantillon s(nTe) le niveau de quantification s i, valeur choisie dans le pas : 1.la valeur centrale du pas (cas étudié, tracer en bleu) 2.la valeur minimum (cas du C.A.N. tracer en rouge) 1 t s(t)
S.S.I., ESSI1, le 8 février 2004 Page 5 une carte son contient un CAN et un CNA [plus parfois un DSP] le CAN (Convertisseur Analogique Numérique) numérise l'entrée micro de la carte son. le CNA (Convertisseur Numérique Analogique) réalise l'opération inverse pour jouer en temps réel un son numérique sur la sortie haut-parleur de la carte son haut-parleur = actionneur transformant une tension électrique en vibrations de l'air (ou sons) [le DSP (Digital Signal Processor) est un micropro- cesseur spécialisé dans le traitement du signal Digital signifie numérique en anglais et Signal Processing signifie traitement du signal] L'ordinateur utilise sa carte son pour enregistrer et pour jouer les sons numériques stockés dans sa mémoire. micro HP CAN CNA Son, vibration de lair son s(t) signal électrique rbl(t) bloqué s(nTe) B bit r(nTe) Carte son microproc Mémoire, Traitement, Filtre … DSP
S.S.I., ESSI1, le 8 février 2004 Page 6 L'ordinateur utilise sa carte son pour enregistrer et pour jouer les sons numériques stockés dans sa mémoire. Compléter le schéma ci-dessous, après avoir mémorisé la feuille précédente. Préciser la nature et les propriétés de temps et damplitude des signaux. Allure de r bl (t) ?
S.S.I., ESSI1, le 8 février 2004 Page 7 La qualité de numérisation d'un son croît avec fe et B contrainte de Shannon : la fréquence d'échantillonnage fe doit être au moins deux fois la largeur du spectre du signal à échantillonner –le spectre est la composition fréquencielle du signal (voir le chapitre Spectre et TFD) –par exemple, le signal s(t)=cos(2*440*pi*t) contient la seule fréquence 440 Hz (ou LA3 musical) et doit être échantillonné à fe= 880 Hz au moins. Hertz (Hz) : unité de fréquence, comme radian par seconde (rd/s), on a : 1 rd/s = 2*pi Hz. Application de Shannon : –comment faut-il échantillonner le signal x(t)=cos(2*880*pi*t) (LA4) ? –Lappareil auditif humain sait percevoir des fréquences allant au mieux de 20Hz à 20kHz. Justifier en conséquence la fréquence déchantillonnage de 44100Hz des CD audios. –Le téléphone grand public transmet sur la bande de fréquence 300 Hz, 3300Hz, proposer une fréquence déchantillonnage en conséquence Au moins à 1760Hz On prend au moins 2 fois 20kHz, plus une marge de sécurité Même raisonnement, 2 fois 3300 Hz plus une marge
S.S.I., ESSI1, le 8 février 2004 Page 8 La qualité de numérisation d'un son croît avec fe et B l'erreur de quantification croît quand B décroît et peut créer un bruit audible –erreur de quantification = signal - signal quantifié le rapport signal sur bruit (anglais SNR pour Signal to Noise Ratio) mesure l'importance relative du signal et de l'erreur Questions : 1. si B= 8bits, quelle est la hauteur du pas de quantification ? 2. si on utilise la valeur centrale du pas pour quantifier, quelles sont alors les bornes de lerreur ? 3. SNR = 72dB, quelles sont les importances relatives du signal et de lerreur ? 72 cest 6 fois 12, le signal est 2 12 fois plus grand que lerreur Le pas valant 2/2 B, lerreur varie Entre -1/2 B et 1/2 B
S.S.I., ESSI1, le 8 février 2004 Page 9 La qualité de numérisation d'un son croît avec fe et B Ordres de grandeurs utiles –l'audition humaine s'étend sur trois décades, de 20 Hz à 20 kHz décade = intervalle de fréquences [f0, 10*f0] octave = intervalle de fréquence [f0, 2*f0] –la phonation (spectre de la voix humaine) sétend de 50 Hz à 7 kHz (bande élargie) –La bande téléphonique grand public de 300 Hz à 3300 Hz –qualité téléphonique : B = 8 bits, fe = 8000 Hz, monophonie, soit bits par seconde (bps) –qualité CD audio: 16 bits, Hz, stéréo –entrée micro de la carte son : entre -1 et 1, Question: on souhaite télécharger un air de musique de durée 3 mn et qualité CD : – Prévoir la taille du fichier à télécharger – La durée du téléchargement sur une ligne téléphonique grand public sans compression – le taux de compression à atteindre pour télécharger et jouer en temps réel.
S.S.I., ESSI1, le 8 février 2004 Page 10 L'ordinateur utilise sa carte son pour enregistrer et pour jouer les sons numériques stockés dans sa mémoire. pour stocker un son numérique dans un fichier, on adopte un format, règle de rangement à respecter pour récupérer les données ultérieurement –le format PCM (pour Pulse Coded Modulation) est non compressé –le format mp3 (MPEG audio Layer 3) est compressé, comme au, ogg, … la mémoire occupée par un son numérique non compressé est donnée par la formule le débit à soutenir pour alimenter la carte son est donné en bit par seconde (bps) par