Le signal audio numérique Jean-Paul Stromboni, Polytech'Nice-Sophia, Département Sciences Informatiques, SI3 durée 55 mn, nécessite un vidéo projecteur et un haut parleur Voici ce que vous devez savoir après cette séance : définir et représenter un signal audio et analyser son chronogramme différencier analogique et numérique, temps continu et temps discret évaluer taille et débit binaire (ou bit rate) décrire les effets d’un échantillonnage lent et d’une quantification large interpréter les infos de l’en-tête d'un fichier au format wave En travaux dirigés : analyse de signaux audio numériques avec Audacity à découvrir.
Son, microphone, signal audio, chronogramme l'oreille détecte les sons (les vibrations de l’air par exemple) dans les conditions suivantes : Le niveau sonore (en dB) est supérieur au seuil d’audition (0dB) et inférieur au seuil de douleur (120dB) ! Le seuil d’audition (0dB) vaut 2-12 W/m2 Les fréquences composant le son sont comprises entre 20 Hz et 20 kHz le microphone traduit à tout instant t la vibration en tension électrique proportionnelle s(t) s(t) est un signal audio Le chronogramme est une représentation temporelle du signal. s(t) t Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 2
Analyse d’un signal audio vocal, musical ou autre Nous différencions les sons à l'oreille entre autres par : L’enveloppe (chronogramme) La composition fréquentielle : Fréquence fondamentale et harmoniques (spectre) Évolution du spectre, mélodie, intonation (spectrogramme) La qualité de numérisation: bande passante élevée, rapport signal sur bruit élevé Exemple avec Audacity (fichier pianoC3.wav): Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 3
Enveloppe d’un signal audio : intensité, durée, quasi périodicité Signal s(t) max decay attack sustain fort release faible silence t faible fort max Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 4
Quasi périodicité ou pitch (zoom entre 0.3 et 0.4 s) 6 quasi périodes égale environ 90ms, pitch = 15 ms Fréquence du fondamental égale 1000/15 Hz soit f1= 66.7 Hz … Fenêtre FFT: Hamming Taille FFT: 4096 points Composantes 130Hz ~2*f1 200Hz ~3*f1 270Hz ~4*f1 340Hz … Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 5
Numérique ou analogique, et continu ou discret période d’échantillonnage : Te=1ms fréquence d'échantillonnage fe =1kHz nombre de bits par échantillon : B = 3 niveaux de quantification : 8 pas de quantification : Q=2/8 = 0.25 erreur de quantification 0 < e < 0.25 Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 6
Échantillonner Échantillonner s(t), c’est prélever des mesures périodiques. 1. La période d’échantillonnage est Te, la fréquence d’échantillonnage fe, le signal discret se 2. Pour bien échantillonner, il faut respecter la contrainte de Shannon : par exemple, un signal s(t) sinusoïdal de fréquence f0 doit être échantillonné avec fe > 2*f0 3. On sait récupérer le signal s(t) à partir des échantillons sn avec la formule de Shannon si et seulement si la contrainte de Shannon a été respectée. 4. Formule de Shannon : Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 7
Quantifier sb sq 3 0.75 2 0.5 1 0.25 -1 -0.25 -2 -0.5 -3 -0.75 -4 -1 -1 -2 -3 -4 sq 0.75 0.5 0.25 -0.25 -0.5 -0.75 -1 coder se sur B bits, c’est découper l’intervalle[-1,1[ en 2B intervalles: signal codé sb signal quantifié sq Erreur ou bruit de quantification : Rapport signal sur bruit (en dB) :
Numériser sur le papier le signal audio ci-dessous Numériser v(t), sachant que fe=10Hz et B=4 bits ; on reportera Te, Q, les valeurs binaires 1000 et 1111, et on indiquera l'erreur de quantification. v(t) 1 1111 Erreur de quantification Erreur de quantification Q t (s) 1000 Te 2 0010 0001 0000 -1 Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 9
Voici l'effet d'une fréquence d'échantillonnage trop faible Contrainte de Shannon : pour échantillonner un signal, on examine sa composition fréquentielle ou spectre; s’il existe une fréquence maximale fmax au-delà de laquelle le spectre est vide, il faut choisir une fréquence d’échantillonnage au moins double, soit fe > 2*fmax La contrainte de Shannon est elle respectée ci-dessus ? À droite ? À gauche ? Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 10
Voici l'effet d'un pas de quantification trop grand Le signal tiré de ‘piano.wav’ est quantifié sur 16 bits à gauche, sur 4 bits à droite écouter le bruit de quantification, Comment calculer le bruit de quantification ? Le rapport signal sur bruit (SNR pour Signal to Noise Ratio) compare les écarts types du signal et du bruit de quantification : Pour B=4 ci dessus, SNR calculé par Scilab vaut 12.52 dB, comparer signal et bruit : un signal à peu près 4 fois plus intense que le bruit de quantification Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 11
Sauver un signal audio numérique dans un fichier wave On trouve dans le fichier ‘la3.wav’ les trois blocs de données : RIFF, fmt et data. Les données sont disposées comme suit : on lit l’octet de poids faible d’abord, puis les autres en allant vers l’octet de poids fort (format little endian ou ‘petit-boutien’ ) 52 49 46 46, signifie RIFF 24 53 07 00, lire 00 07 53 24, soit 7*65536+83*256+36=480036 bytes 66 6D 74 signifie fmt en ASCII format PCM (code 01 00) monophonie (01 00) une voie 40 1F 00 00, soit fe=8 kHz 40 1F 00 00 est le byte rate en octets par seconde 01 00 indique qu’un échantillon est codé sur un octet 08 00, lire 00 08, un échantillon occupe 8 bits __________________________________ L’en tête du fichier la3.wav précise donc : 8kHz, mono, 8 bits/échantillon, format PCM, taille 480 044 octets, bit rate 8000 octets par seconde, ... Comment doubler fe ? Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 12
Évaluer taille, bit rate et taux de compression D : durée du signal (en seconde) fe : fréquence d'échantillonnage (en Hz) B : nombre de bits pour coder chaque échantillon (en bit) NombreVoies = 1 (monophonie), 2 (stéréophonie), … Taille exprimée ici en bits d’un signal audio numérique : Bit rate (ou débit binaire) exprimé en bits par seconde (ou bps) Compresser : réduire D, fe, ou B, ou encore NombreVoies Taux de compression = taille avant / taille après compression Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 13
Lire les paramètres de numérisation avec Audacity Noter : l'amplitude varie entre -1 et 1 ! Lire : fichier audio, fe, durée, on ne lit pas B directement, comment faire ? Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 14
La carte son numérise le signal issu du microphone Le signal audio analogique présenté à l’entrée micro de la carte son devient un signal audio numérique : c’est une suite d’échantillons v(nTe), n entier, Te période d'échantillonnage codés en binaire, sur B bits, par exemple v(0)=0110 0010 (ici B=8). DAC: Digital to Analog Converter en français CNA hauts-parleurs microphone Digital Signal Processor ADC: Analog to Digital Converter en français CAN ADC univers analogique temps continu Liaison par bus avec le microprocesseur numérique temps discret Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 15
Savez vous répondre aux questions suivantes ? Comment transformer un son en signal audio ? Comment créer un signal audio numérique ? Justifier la fréquence d’échantillonnage de 44100 Hz des CD audio Combien de pas de quantification si B = 12 bits ? Calculer la taille et le bit rate associés à un signal de durée 3mn échantillonné à 8kHz sur 8 bits en stéréophonie : Comment échantillonner un signal de fréquence 440Hz (LA3) ? Quel est le pas de quantification si B=10 bits ? Que signifie le rapport signal sur bruit de 72 dB sur une ligne téléphonique ? Cours S.S.I.I., 2015-2016, séance 2 : le signal audio numérique Page 16