7 - Son
Plan Définition du Son Numérisation du Son Formats des fichiers de sons Son et Multimédia
Définition du Son
Définition du Son Pression -> Onde Mécanisme de l’audition Grandeurs associées Analyse du Son Perception Conséquences Effet de masquage Effet de précédence Application à la sonorisation
Transformation d’une pression en onde
Mécanisme de l’audition
Grandeurs associées Grandeurs Physiques Attributs perceptifs fréquence hauteur (pitch) intensité force (volume) spectre timbre (couleur tonale)
Exemple d'analyse d'un son Diagramme amplitude / temps :
Perception de la hauteur d'un son, de la fréquence unité Hertz (Hz) Perception similaire pour un rapport d'une octave perception logarithmique de la hauteur des notes clavier de piano logarithmique : 27,5 Hz - 55 - 110 - 220 - 440 (note référence) - 880 - 1760 - 3520 perception plus fine dans les basses fréquences
Perception de l'intensité d'un son son = pression (unité Pascal) Pr = 2 . 10-5 Pa (seuil d'audition pour un son pur de 1 kHz) Seuil de douleur = 10 Pa => adoption d'une échelle logarithmique SPL = 20 log10 [ P / Pr ] mesure de rendement de puissance acoustique Unité : le décibel (dB) est l'unité de mesure relative de la puissance sonore (double tous les 3 dB)
Diagramme de Fletcher
Perception des timbres Définition de l'American Standard Association (ASA) : "Le timbre est l'attribut perceptif permettant de distinguer deux sons de hauteurs et d'intensités égales" Il permet de discerner les instruments, les voix... Physiquement : timbre = enveloppe spectrale + évolution de cette enveloppe au cours du temps Connaissance des timbres : perception de fréquences absentes produites par les harmoniques (téléphone, radio...)
Conséquences Effet de masquage Effet de précédence
Application à la sonorisation
Numérisation du Son
Echantillonnage Théorème d'échantillonnage de Nyquist/Shannon : « signal correctement reconstruit si fréquence d'échantillonnage > 2 * plus grande fréquence du signal échantillonné » Filtrage préalable préférable plage audible 20 - 20 000 Hz, d’où échantillonnage des CD audio à 44 kHz téléphone : échantillonnage à 11 kHz Connaissance de la plage de fréquence permet réduction du débit
Quantification Passage d'un domaine continu à un domaine discret Valeur continue - Valeur quantifiée = erreur de quantification (bruit) But d'un bon codage : réduire le bruit Attention : complexité du quantificateur augmente son coût Différentes stratégies de quantifications (adaptées au type d'entrée) : quantification scalaire linéaire logarithmique quantification vectorielle : sur blocs de N échantillons, opération dans espace de dimension N
Quantification (2) Plusieurs types de quantification : Linéaire (uniforme) Distance identique entre chaque niveau de reconstruction. Pas les meilleurs résultats (car indépendante de la nature de l'entrée) mais facile à implémenter. Pour conversation téléphonique : 13 bits, soit 8192 niveaux de reconstruction. Logarithmique Adaptée au codage de la parole : dynamique du langage peut atteindre 60 db mais résolution plus importante dans les faibles amplitudes Idée : distance entre niveaux de reconstruction augmente avec l'amplitude Principe : passer signal d'entrée par compresseur à caractéristique logarithmique
Formats des fichiers de sons
Formats des fichiers de sons Nombreux formats : principaux formats avant le mp3 au : format des premières stations Unix (Sun, NeXT...) très compressé en u-law ou a-law.. compact, mais dégradé aiff : format développé par Apple à partir d'un compresseur propriétaire MACE. Meilleure qualité que au, mais plus lourd. dvi ADPCM : développé par Intel pour les CDI.. Compression avec perte dans un ratio de 4 pour laisser de la place aux vidéo sur le CDI
Formats des fichiers de sons (2) mid MIDI (Musical Instrument Digitial Interface) codage des partitions. Très compact (une symphonie en 40 Ko !), mais nécessite un synthétiseur hard (meilleur) ou soft : très adapté aux musiques sur le Web wav Windows Wave : développé à l'origine par IBM, est devenu un standard de fait bien que pas très bon. Comporte beaucoup de formats de compression possibles. succès du mp3 tardif, car défini dès 1993 dans le format audio layer 3 du MPEG 1 (d'où le nom mp3) compression fréquentielle avec quantification comme le JPEG, mais tenant aussi compte des l'effet de masquage pour diminuer l'information à coder format de compression avec perte avec possibilité de réglages pour limiter la compression avant l'audition des défauts format de qualité, mais encore lourd pour le Web
Formats des fichiers de sons (3) Cas particulier du format Realaudio (.ra) Propriété de Real Networks (ex Progressive Networks) Limité à la transmission de son par flux avec limitation des conséquences de perte de paquets (transmission en "peigne") Format permettant plusieurs niveaux de compression avec choix et changement de taux de compression suivant dégradation du réseau
Formats des fichiers de sons (4) Principe du format Realaudio (.ra) Sans multiplexage Avec
Son et réseau
Son et réseau Deux méthodes pour accéder un son sur un serveur distant : charger le fichier, puis jouer (trop longue attente) ou liaison par flux tendu (son joué au fur et à mesure de la réception) Pb due à la liaison asynchrone : coupures Solutions : tampon local multiplexage des échantillons (ex : Real Audio)
Son et réseau (2) Possibilité de jouer un son directement dans une page Web : Avec un plugin QT ou Flash Player Par une balise spéciale <embed> <embed SRC="wheels.mid" PLUGINSPAGE="http://www.yamaha.co.jp/english/xg/html/mplug.html" WIDTH=200 HEIGHT=55 CONTROLLER=TRUE LOOP=FALSE AUTOPLAY=TRUE autostart=false></embed> ou flash <object type="application/x-shockwave-flash" data="dewplayer.swf?essai.mp3 width="200" height="20"> <param name="movie" value="dewplayer.swf?essai.mp3"> </object>
Démonstrations