Modélisation articulatoire Formants et articulation
Bibliographie Keith Johnson Acoustic and Auditory Phonetics. 2e édition. Oxford: Blackwell, 2002. Philippe Martin Phonétique Acoustique - Introduction À L'analyse Acoustique De La Parole, Armand Colin, 2008 Ken Stevens Acoustic phonetics. Cambridge,MA:MITPress, 1998. Jacqueline Vaissière http://www.personnels.univ-paris3.fr/users/vaissier/pub/ARTICLES/vaissiere2007berkeley.pdf
Un spectrogramme ? 2 visualisations principales Répartition de l'énergie sur les différentes fréquences (spectre) et en fonction du temps 2 visualisations principales Formants qui caractérisent les voyelles. Harmoniques /a/ F3 ~ labialité F2 ~ antériorité F1 ~ aperture
spectrogramme à bandes larges Cédric Gendrot - Ecole d'été SCIENCES et VOIX CHANTEE - 4 septembre 2009
spectrogramme à bandes étroites Cédric Gendrot - Ecole d'été SCIENCES et VOIX CHANTEE - 4 septembre 2009
Les origines Théorie acoustique de la parole (Chiba and Kajiyama 1958; Fant 1960; Stevens 1998).
modéliser ? le rôle de la modélisation : combler le fossé entre les déformations du conduit vocal et les patterns acoustiques, puis la perception … La représentation du conduit vocal par 1 tube droit ou 2 à 4 tubes uniformes connectés permet de prédire les caractéristiques acoustiques essentielles des voyelles et des consonnes (Fant 1960)
Le tuyau sonore est le principe de tous les instruments à vent Le tuyau sonore est le principe de tous les instruments à vent. La fréquence de vibration de l'air, donc la hauteur de la note, dépend de la pression de l'air et de la longueur du tuyau, selon le principe de l'onde stationnaire dans un tuyau. Le conduit vocal est assimilé à un tuyau, un tube … pour un [œ], un tube droit
Les deux paramètres des fluides — air dans le cas des instruments de musique et de la parole — qui nous intéressent ici sont : la pression : c'est la force qu'exerce le fluide sur son environnement : les parois du tuyau, mais aussi le fluide voisin ; la vitesse du courant, du vent.
Prenons une seringue en plastique (sans aiguille). Si le bout est ouvert et que l'on enfonce le piston, on crée un courant d'air sortant ; si on le tire, on crée un courant d'air entrant ; dans les deux cas, la pression reste la même dans la seringue. (vitesse ++ pression ==) Si on bouche l'extrémité avec le doigt et que l'on enfonce le piston, on ne crée plus de courant d'air (la vitesse est nulle), mais on augmente la pression ; si on tire le piston, on ne crée toujours pas de courant, mais on diminue la pression. (vitesse == pression ++)
Si le bout est ouvert et que l'on donne un coup brusque sur le piston avec la paume, on sent une résistance, comme si l'embout était fermé. En effet, lorsque l'on pousse le piston, on crée localement une surpression, et cet excès de pression pousse l'air de la seringue et crée le courant d'air (l'écoulement d'air empêche la pression de rester élevée), mais si le mouvement du piston est trop rapide, alors la surpression n'a pas le temps de mettre en mouvement l'air. (pression ++ …. puis … vitesse ++)
Création de l'onde L'onde peut être créée de deux manières : par des turbulences, des tourbillons, créés par un courant d'air qui rencontre un obstacle ; c'est le cas des tuyaux d'orgue à bouche, des sifflets … des dents … par une membrane qui vibre au passage de l'air : cela peut être les lèvres dans le cas des cuivres … ou les plis vocaux …
Ventres et nœuds Comme dans toutes les ondes stationnaires, on a donc des ventres et des nœuds : pression : à un nœud de pression, la pression ne varie pas ; à un ventre de pression, la variation est d'amplitude maximale ; vitesse : à un nœud de vitesse, la vitesse ne varie pas à un ventre de vitesse, la variation est d'amplitude maximale Un nœud de pression est un ventre de vitesse ; un ventre de pression est un nœud de vitesse.
Ventres et nœuds Aux extrémités du tube, deux cas se présentent : si le tube est fermé, alors la vitesse de l'air y est nécessairement nulle ; on a un nœud de vitesse ; si le tube est ouvert, alors la pression de l'air est constante, égale à la pression extérieure ; on a un nœud de pression. Si le tube présente un trou à un endroit, alors cela impose un nœud de pression.
mode de vibration … les extrémités imposent donc un nœud de pression (tuyau ouvert) ou un nœud de vitesse (tuyau fermé). Partant de là, l'onde stationnaire peut prendre plusieurs régimes, ou « modes » : mode fondamental ou mode I : l'onde ne présente qu'un seul ventre de pression, au milieu dans le cas d'un tuyau ouvert, à l'extrémité dans le cas d'un tuyau fermé ; mode II : l'onde présente deux ventres de pression, au quart et aux trois-quarts du tuyau dans le cas d'un tuyau ouvert, au tiers et à l'extrémité dans le cas d'un tuyau fermé ; … mode n : l'onde présente n ventres de pression répartis régulièrement.
Amplitude de variation des paramètres d'une onde stationnaire mode fondamental (haut), mode II (milieu) et mode III (bas) mode I mode II mode III mode I mode II mode III
« entrer en résonance » Prenez un tube en PVC (par exemple), de deux ou trois centimètres de diamètre maximum, suffisamment long pour pouvoir être raccourci successivement. Munissez-vous d'un diapason qui, frappé d'un coup sec contre un obstacle rigide, produit la note la3, référence musicale, qui vibre à 440 Hz. Première étape: la longueur du tube est assez grande, disons 50 ou 60 cm. Portez une extrémité du tube à votre oreille (mais sans la coller), tapez le diapason et portez-le à l'entrée de l'autre extrémité en prenant soin de ne pas toucher le tube: on entend faiblement la vibration du diapason. source : http://fred.elie.free.fr/tuyaux_sonores.htm
Deuxième étape: raccourcissez le tube à la longueur L = 39 cm, et recommencez comme ci-dessus. Cette fois la vibration du diapason s'entend clairement dans le tube. Troisième étape: raccourcissez encore le tube jusqu'à, par exemple, 30 cm, et recommencez l'opération. De nouveau la vibration du diapason s'entend faiblement dans le tube. source : http://fred.elie.free.fr/tuyaux_sonores.htm
Pour une fréquence de vibration donnée et fixée de l'excitation de l'air par le diapason, donc 440 Hz, le tube permet de l'entendre avec une intensité maximale pour une longueur particulière et privilégiée: L = 39 cm. Pour des longueurs plus grandes ou plus petites, le tube transmet très mal cette excitation. Pour cette valeur particulière de la longueur on dit qu'il y a résonance, c'est-à-dire accord entre la fréquence d'excitation et une fréquence propre à celle de l'air contenue dans le tube. source : http://fred.elie.free.fr/tuyaux_sonores.htm
Ce qu'il faut comprendre par "excitation de l'air" c'est la variation très rapide de la pression dynamique de l'air Mais selon la position qu'occupent les particules dans le tube, l'amplitude instantanée de leur pression dynamique ne sera pas la même: elle varie aussi dans l'espace, donc avec l'abscisse sur l'axe du tube.
Pour la propagation du son dans l'air cette célérité (encore appelée "vitesse du son") vaut environ c = 347 m/s aux conditions standard de l'atmosphère ( 1 atm et 25°C). Plus précisément, la célérité du son dans l'air change avec la température 350 m/s (le son se propage plus vite dans l'air chaud que dans l'air froid).
loi de la perturbation
Les gestes basiques pour manipuler les formants sont (pour un adulte) globalement : 1 geste pour manipuler F1, 2 pour F2, 3 pour F3.
Vaissière, 2007
Delattre, 1955
La protrusion des lèvres et l’arrondissement abaisse tous les formants, particulièrement ceux affiliés à la cavité antérieure. (F3 de /i/) L’abaissement du larynx a le même effet que l’arrondissement/protrusion, mais a un effet + important sur les formants affiliés à la cavité postérieure
modèle à 1 tube : le /œ/ tube fermé ouvert : résonance (quart d’onde) de type f = (2n - 1) c/4l. En adoptant les valeurs de c =350 m/s (vitesse du son dans l'air à 35 degrés), et 1 = 0,175 m (17,5cm) comme longueur d'un conduit vocal masculin moyen, on trouve donc une série de valeurs de résonance, donc de formants: 500 Hz, 1500 Hz, 2500 Hz, 3500 Hz, etc. donc pas 1 formant pour ce modèle à 1 tube correspondant à l'articulation du schwa, mais une infinité. Certes 1 approximation puisque l'on a négligé les pertes acoustiques et l'amortissement dus à la viscosité des parois du conduit vocal, à la forme et à la section non cylindrique du conduit, etc
modèle à plusieurs tubes 1 tube fermé fermé 1 tube ouvert ouvert 1 résonance de Helmoltz 2 tubes fermé ouvert plusieurs types de tubes … plusieurs types de résonances …
l a V pour un tube fermé-ouvert (déjà vu) (quart d’onde) pour un tube ouvert-ouvert ou fermé-fermé (demi-onde) nc/2*l F = c/2*pi * sqrt(a/(l*v)) résonance Helmoltz l a V
modèle à plusieurs tubes On peut ainsi obtenir les fréquences des formants et leur affiliations aux cavités de résonance
Exercices …
Modèle articulatoire de Maeda Comme la plupart des modèles, est basé sur tracés rayons-X et une série d’ACP (guidées) (Maeda 1979).
Un modèle avec 7 facteurs explique plus de 90% de la variance position de la mâchoire position du dos de la langue forme du dos de la langue position de l’apex de la langue ouverture des lèvres protrusion des lèvres hauteur du larynx
ce que peut montrer la modélisation … Le français (contrairement à l’anglais ou l’allemand par ex.) semble favoriser les voyelles ayant une forte concentration d’énergie dans une région spécifique du spectre. La saillance spectrale relative à la proximité des formants est une des deux composantes de la théorie de la dispersion-focalisation (Schwartz et al. 1997b) pour prédire les systèmes vocaliques. Quand 2 formants sont proches l’un de l’autre, ils sont groupés en un seul pic et leur amplitude commune en est renforcée ; ils sont perceptivement intégrés en un seul pic (si l’écart entre les 2 est inférieur à 3.5 Bark) (Chistovich and Lublinskaja 1979) F3 et F4 pour /i/ F2 et F3 pour /y/ F1 et F2 for /u/, /ɑ/ et les voyelles nasales postérieures
Un branchement peut également être connecté à la fonction d’aire Un branchement peut également être connecté à la fonction d’aire. Par défaut, il correspond à la cavité nasale mais peut également simuler la cavité sublinguale
Les voyelles nasales posent des problèmes supplémentaires Les voyelles nasales posent des problèmes supplémentaires. Concernant les voyelles orales, l’amplitude des formants et la forme globale du spectre sont prédictibles à partir des fréquences de formants et de leur largeur de bande. L’amplitude des formants constitue ainsi une information redondante (Fant, 1960) Pour les voyelles nasales, l’amplitude des pics spectraux ne peut être prédit depuis les fréquences formantiques