Juillet 2001  Les organes Cavité nasale Cavité buccale Langue Épiglotte et cordes vocales Trachée Voile du palais.

Slides:



Advertisements
Présentations similaires
Propagation dans les gaz
Advertisements

Pr Anne Charloux Institut de Physiologie ULP, Strasbourg
PRINCIPE SIMPLIFIE DE LA COMPRESSION MP3
Le Signal Vocal Notions sur l’audition Allure temporelle
Le Signal Vocal 1. Production du signal ; Modèles de production
Comment on filtre un signal audio
Comment calculer le spectre d’un signal audio
Comment décimer les sons numériques
Calcul de la composition fréquentielle du signal audio
Mesures dans le domaine fréquentiel
En quoi consiste la modulation d’amplitude ?
INTRODUCTION 1. Une représentation du signal où le bruit est isolé
 Quelques rappels théoriques.
Colloque GRETSI, Paris, 8-11 septembre 2003 Sur la Décomposition Modale Empirique P. Flandrin (Cnrs - Éns Lyon) et P. Gonçalvès (Inrialpes)
Cours S.S.I., SI1, avril 2007 – Comment utiliser les outils déjà présentés. Page 1 Comment utiliser les outils déjà présentés dans le cours S.S.I. et pourquoi.
SON COMPLEXE - SPECTRE Le son pur est un modèle mathématique (sinusoïde…) Un son complexe peut être décomposé en une sommes de sinusoïdes (Théorème de.
Acoustique fondamentale
FILTRAGE A. Objectifs de la séquence:
Ondes acoustiques Nature de l’onde sonore Vitesse du son
Présenté par Martine Toda
Synthèse de filtres numériques
Le système respiratoire Le système respiratoire Nadia Morin Enseignante en santé, assistance et soins infirmiers École Professionnelle de Saint-Hyacinthe.
Cours d’Automatique MASTER OIV
LE SON & L’ AUDITION Dr CHAKOURI M.
Guy Gauthier, ing., Ph.D. Session été 2013.
Propriétés et Classification
IV Ondes sonores Les ondes sonores sont des ondes longitudinales mais à quel phénomène physique sont-elles dues? Si on alimente un haut-parleur par un.
Chapitre 6 : Restauration d’images
SSII : séance finale , lundi 9/01/2012 Page 1 Voici quelques questions pour assimiler la seconde partie du cours S.S.I.I., spectre, filtrage, banc.
Traitement du signal TD0 : Introduction.
Le cahier de charge d'un système de RAP
Techniques d’optimisation
Introduction à l’acoustique
Dynamique des Systèmes Asservis
S.S.I., ESSI1, le 8 février 2004 Page 1 Numériser le signal audio Séance 2, cours, 1 heure auteur : Jean-Paul Stromboni Idées clefs de la séance De nombreuses.
Jeopardy - Révision Final Jeopardy $100 $100 $100 $100 $100 $200 $200
Jeopardy - Révision Final Jeopardy Phonèmes Traits Règles Syllabe
Jeopardy $100 ArticulationVoyelles 1Voyelles 2Acoustique 1Acoustique 2 $200 $300 $400 $500 $400 $300 $200 $100 $500 $400 $300 $200 $100 $500 $400 $300.
États du larynx Phonologie Théories et traits Règles phonologiques
Jeopardy - Révision Final Jeopardy Articulation Voyelles Consonnes
Consonnes Transcription Norme et variation Mécanique phonatoire
L'audition.
Intensité – Ondes sonores
Physique 3 Vibrations et ondes mécaniques
Le français dans tous les sens
Les algorithmes de découplage vitesse-pression
Traitement de la parole : Synthèse et reconnaissance
D’ UN CIRCUIT RLC DEGRADE
Le système respiratoire des mammifères
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
L ’apport du son gt/isac_9920_04. Son/image L ’appréhension du phénomène auditif est plus abstrait que le phénomène visuel. Ex : le son d ’un galop de.
Guy Gauthier, ing., Ph.D. 6 janvier 2015
Reconnaissance automatique de la parole
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
TNS et Analyse Spectrale
Classe 1 Phonétique - phonologie
Ch2 Caractéristiques des ondes
Post-optimisation, analyse de sensibilité et paramétrage
ANALYSE DES SERIES CHRONOLOGIQUES METHODES ET APPLICATIONS EN HYDROLOGIE Danièle VALDES-LAO
Les contributions à la croissance du PIB et les points de pourcentage
Chapitre 6 : Acoustique musicale Les objectifs de connaissance :
Acoustique musicale.
Emetteurs et récepteurs sonores
Ondes Sonores et ultrasons
Les ondes.
Comment mon Iphone peut-il reconnaître mes paroles?
Qu'est-ce que le son ? Le son est une vibration de l'air, c'est-à-dire une suite de surpressions et de dépressions de l'air par rapport à une moyenne,
Brève révision de la terminologie articulatoire
Transcription de la présentation:

Juillet 2001

 Les organes Cavité nasale Cavité buccale Langue Épiglotte et cordes vocales Trachée Voile du palais

 Coopération de plusieurs organes: ◦ Les poumons produisent une pression d’air. ◦ Cet air circule au travers de l’épiglotte. ◦ Les cordes vocales vibrent et interrompent ainsi le débit d’air provoquant une variation de pression quasi-périodique.

 Coopération de plusieurs organes: ◦ Pour certains sons dits voisés, vos cordes vocales vibrent (ouverture et fermeture). La vitesse à laquelle les cordes vocales vibrent détermine le ton de votre voix.  Les femmes et les jeunes enfants ont tendance à avoir une grande hauteur (vibration rapide) tandis que les mâles adultes ont tendance à avoir une faible hauteur (de vibration lente). ◦ Pour certains sons fricatifs (ou non voisés), les cordes vocales ne vibrent pas mais restent constamment ouvertes.

 Coopération de plusieurs organes: ◦ La forme de votre conduit vocal détermine le son que vous faites. ◦ Tandis que vous parlez, votre appareil vocal change de forme pour produire un son différent. ◦ Les modifications du conduit vocal sont relativement lentes (sur l'échelle de 10 ms à 100 ms). ◦ La quantité d'air provenant de vos poumons détermine le volume de votre voix.

 Impulsions de pression: ◦ Impulsions de tonalité (pitch impulses).  Fréquence du signal de pression: ◦ Fréquence de tonalité ou fondamentale. ◦ Fréquence constante = son monotone.

 En pratique, la tonalité varie constamment.

 L’impulsion de tonalité déplace l’air dans la cavité buccale (bouche). ◦ Pour certains sons, la cavité nasale est mise à contribution. ◦ La résonance de ces cavités entraîne la création d’une onde de son qui est le signal de la parole. ◦ Comme la langue et le palais permettent de modifier les cavités, cela nous permet de prononcer plusieurs sons.

 Fréquence de résonance des cavités: ◦ Fréquence du formant.  Que désigne formant ? ◦ Une des composantes qui permettent de distinguer un son complexe d'un autre, et par exemple un son vocal d'un autre son vocal; les formants sont les fréquences (ou les bandes de fréquence) les plus intenses; on les obtient en faisant l'analyse du son. Réf.: Grand Dictionnaire Terminologique

 Production de « M » et de « T ».

 Schéma bloc:

 Paramètres d’un Vocoder: ◦ Articulations : H(z) – Filtre LPC; ◦ Air : u(n) ◦ Vibrations des cordes vocales : V (voisé) ◦ Période de vibration des cordes vocales : T ◦ Consonnes fricatives et plosives : UV (non voisé) ◦ Volume d’air expulsé : G - Gain

 Filtre LPC:  Signal de la parole s(n):

 Vecteur du modèle LPC:  Ce vecteur change à tous les 20 msec.  Si l’échantillonnage est de 8 kH, cela représente 160 échantillons du signal s(n).

 On transmet ce vecteur de 13 valeurs:  Au lieu de ce vecteur de 160 valeurs:  Donc 12.3 X moins de données…

 160 valeurs de 8 bits à tout les 20 msec donne une cadence de 1280 bits/20 ms ou encore de 64 kbits/sec.  Les paramètres a sont ramenés sur un total de 34 bits. Le gain G est sur 7 bits et le code U/UV,T est sur 7 bits. Donc 48 bits transmit à tous les 20 msec, ce qui donne une cadence de 2.4 kbits/sec.  Compression de x…

 Aucune différence perçue: ◦ Si le son est une voyelle ou une consonne non fricative ou non-plosive:  Phase sans importance. ◦ Si le son est une consonne fricative ou plosive:  Séquence de bruit blanc utilisé,

 Pour un vecteur S donné, déduire le vecteur A.  Soit S:  Sachant que :  On calcule alors l’innovation u(n)

 Il faut trouver les a i. On va trouver les coefficients qui vont minimiser l’énergie contenue dans l’innovation u(n).  Calcul de l’énergie contenue dans l’innovation:

 L’énergie sera minimale si:

 Cette dernière opération donne 10 équations à résoudre:

 Fonction d’autocorrélation du signal s(n):

 L’inversion de la matrice 10 X 10 peut être longue à faire (sauf dans MATLAB).  L’algorithme récursif de Levinson-Durbin est plus rapide.

 Les équations à traiter pour i allant de 1 à 10 inclusivement: i=i+1

 Soit R(0)=2.4470x10 8, R(1)=2.2466x10 8 et R(2) = x10 8 : ◦ Itération #1:

◦ Itération #2:  … et ainsi de suite …

 Une fois cette série de calculs faits on pose:  Reste à calculer les trois autres paramètres V/UV, G et T.

 Équation proposée par Levinson-Durbin:  Variante:

 Résoudre cette équation:  Et faire l’autocorrélation de u(n):

 Spectre de l’autocorrélation: Son non voisé Son voisé

 La structure en échelle du filtre IIR peut s’appliquer: ◦ Utilisation directe des coefficients k i calculés lors de l’algorithme précédent.

 Oreille humaine – échelle logarithmique

 La plage dynamique de l’oreille (inaudible à intolérable) est d’environ 20 bits. ◦ De 1 à  En pratique, stocké sur 16 bits, dont 12 sont significatifs.  Qualité téléphonique : ◦ 8 kHz et 12 bits.

 Exemple: ◦ Fonction sinusoïdale échantillonnée. ◦ Fenêtre rectangulaire.

 Exemple: ◦ Fonction sinusoïdale échantillonnée. ◦ Fenêtre de Hamming.