Pour finir sur la modélisation … - Les nasales … - (et latérales)
Comme vu au précédent cours, les occlusives sont + complexes à modéliser car leur production implique plusieurs étapes et plusieurs types de sources. Les nasales (et les latérales) sont également + complexes que les voyelles ou les fricatives, mais d’une façon différente : leurs propriétés de filtrage du conduit vocal sont + complexes.
Largeur de bande Une des caractéristiques des nasales : la largeur du pic de résonance (largeur de bande : ‘bandwidth’) du 1er formant est + large pour les nasales Cela est dû à la fonction de filtrage du conduit vocal Qu’est ce que la largeur de bande et à quoi est-elle due ?
amortissement (‘damping’) La figure suivante montre une onde sinusoïdale non amortie et 2 autres qui sont amorties. Dans le cas des ondes amorties, l’amplitude décroit avec le temps. par ex : une balançoire … sur la terre, la balançoire s’arrête plus vite que sur la lune, amortissement + important
Puisque chaque onde a son spectre (Fourier), l’onde sinusoïdale amortie n’aura pas le même spectre que l’onde sinusoïdale non amortie.
onde sinusoïdales amorties et non amorties de fréquence et phase identique Spectres des signaux montrés ci-dessus. Un amortissement + fort correspond à moins d’amplitude et une largeur de bande + importante
Puisque les parois du conduit vocal sont souples, elles absorbent une partie de l’énergie produite à la glotte. (l’inertie de l’air également). Les ondes qui résonnent dans le conduit vocal pourraient continuer à vibrer indéfiniment, mais en réalité finissent par s’amortir.
Les formants ont donc nécessairement une certaine largeur de bande Les formants ont donc nécessairement une certaine largeur de bande. Si les parois du conduit vocal étaient dures, les largeurs de bande des formants seraient bien moindres. Les largeurs de bande des formants pendant les voyelles nasales sont plus larges encore, car le conduit vocal avec la cavité nasale a plus de surface et plus de volume encore + d’amortissement … mais ce n’est pas tout …
L’augmentation de la largeur de bande tend également à diminuer l’amplitude des formants. Sur un spectrogramme, les sons nasals sont ainsi plus « clairs » que les voyelles orales.
La nasale uvulaire /N/ Quand le contact entre la luette et le dos de la langue se fait, le conduit vocal peut être décrit (par approximation) comme un tube uniforme fermé à la glotte et ouvert aux narines. Ce sera donc une résonance ¼ d’onde, il suffit de connaître la longueur du tube. 12.5 cm de la luette aux narines, et 9 cm de la luette à la glotte selon Fant (1960). 21.5 cm au total
Les 4 premières résonances sont donc : 407 Hz, 1221 Hz, 2035 Hz, 2849 Hz Evidemment l’appromixation en un tube uniforme est inexacte … on peut l’améliorer en considérant qu’il y a une constriction aux narines (comme un arrondissement permanent), et donc en abaissant la valeur de chacune de ces résonances selon la théorie de la perturbation.
Il est difficile d’être plus précis car les variations inter et intra locuteurs du conduit nasal sont importantes, mais on peut déjà observer que les formants sont moins espacés que pour un schwa par ex. (800 Hz au lieu de 1000 Hz)
Sur les figures suivantes : la faible amplitude de F3 (et du 8ème harmonique) Les 2 premiers formants de /ŋ/ sont plus bas que ceux de /ɑ/ Formants au-delà de 3 kHz trop faibles pour apparaître. les consonnes nasales sont généralement de + faible amplitude que les voyelles (cavités supplémentaires + constriction)
Spectre LPC et FFT du murmure nasal de /ŋ/ produit par une femme Notez qu’il y a 4 formants en dessous de 3 kHz Spectrogramme d’un mot produit avec le même /ŋ/
Passons à /m/ Les fréquences de résonance de la cavité buccale des nasales sont différentes des résonances vues jusqu’à présent, parce que la cavité buccale est ici un branchement latéral et ne s’ouvre pas directement dans l’air extérieur. Sur la figure, on peut observer que la cavité buccale peut être modélisée comme un tube fermé (aux lèvres) – ouvert (la luette) avec une longueur d’environ 8 cm.
On peut donc calculer ses résonances comme pour /N/ (ou /ə/). 1094 Hz, 3281 Hz, etc. Cependant, ces résonances ne sortent pas dans l’atmosphère … Les résonances de cette cavité sont en fait absorbées et deviennent des anti-résonances (des « anti-formants ») dans le résultat acoustique
Les formants apparaissent dans le spectre comme des pics d’énergie, et les anti-formants comme des « vallées ». Les anti-formants sont différents de l’absence de résonance. Par exemple, dans le schwa, on observe des vallées entre les formants, mais celles-ci sont dues à l’absence de résonance. Certaines fréquences sont simplement non renforcées.
Par contre pour la nasale /m/, il y a des zones de fréquence qui sont clairement/activement soustraites du spectre. Un autre effet des anti-formants est que l’amplitude de tous les formants au dessus de ces anti-formants est clairement réduite. Fant (1960) estimait que l’amplitude de tous les formants au dessus d’un anti-formant était réduite de 1.6 dB par octave.
Spectre LPC et FFT du murmure nasal de /m/ produit par une femme Les fréquences supposées des anti-formants sont indiquées par des flèches Spectrogramme d’un mot produit avec le même /m/
Spectre LPC et FFT du murmure nasal de /n/ produit par une femme Les fréquences supposées des anti-formants sont indiquées par des flèches Spectrogramme d’un mot produit avec le même /n/
L’augmentation de la largeur de bande tend également à diminuer l’amplitude des formants. Sur un spectrogramme, les sons nasals sont ainsi plus « clairs » que les voyelles orales.
La fréquence des ces anti-formants dans le spectre d’une nasale dépend de la longueur de la cavité buccale. Pour /n/, elle fait environ 5.5 cm (pour un tube fermé-ouvert de cette taille, les 2 premières résonances sont de 1590 Hz et 4770 Hz) On s’attend donc pour /n/ à avoir des anti-formants dans ces zones.
Pour /m/, la taille de la cavité buccale est d’environ 8 cm, les anti-formants seraient approx. à 1100 Hz et 3300 Hz. La fréquence des anti-formants est ainsi un indice du lieu d’articulation pour ces nasales. En pratique, les anti-formants peuvent dévier de ces valeurs …
En effet, l’ouverture vers les sinus fonctionnent comme des résonateurs de Helmoltz. Leur volume ainsi que la taille de leur ouverture déterminera également la fréquence des anti-formants. variation inter-locuteurs difficile à prédire variation intra-locuteur également
Dans les figures précédentes, il y a discordance entre le spectre LPC et le spectre FFT car l’analyse LPC fait l’hypothèse que la fonction de filtre du conduit vocal n’a pas d’anti-formants. Les prédictions sur les fréquences des anti-formants sont tout de même avérées ici.
Notons qu’un anti-formant peut apparaitre comme une bande blanche (« œil nasal ») sur le spectrogramme, mais pas nécessairement S’il n’y a pas de formant près de l’anti-formant, alors la zone sera effectivement très claire (blanche). Sinon, on observera une réduction importante , mais pas totale, de l’énergie.
Les analyses des nasales sont donc parfois approximatives, mais le schéma général est respecté, à savoir : un F1 bas (parfois appelé le « formant nasal ») un espacement rapproché entre les formants la présence d’anti-formants (dont la fréquence est déterminée par le lieu d’articulation)
perception des anti-formants Repp (1986) a montré que les auditeurs pouvaient identifier le murmure nasal extrait de syllabes commençant par /m/ ou /n/ dans 72% des cas. Quand les transitions formantiques étaient comprises, la performance dépassait les 95%. Avec seulement 10ms de la voyelle suivant le murmure nasal, la performance atteignait les 94%.
Ces résultats suggèrent que la fréquence des anti-formants de /m/ et /n/ pourraient des indices importants pour la perception de ces consonnes. Encore que 72 % … Dans le bruit ambiant, il n’est pas certain que cette information soit si pertinente …
Les latérales Principe similaire aux consonnes nasales Une autre fois …
Voyelles nasales Phénomène encore plus complexe à modéliser que les consonnes nasales. Deux systèmes de résonance simultanés (cavité buccale + cavité nasale ; pharynx+ cavité nasale ) Le 1er a des résonances à 500, 1500 et 2500 Hz Le 2ème (le conduit nasal) a des résonances à 400, 1200 et 2000 Hz Toutes ces résonances sont présents dans le spectre des voyelles nasalises
Anti-formants comme pour les consonnes nasales sauf que cette fois, ils proviennent de la cavité nasale En effet, la bouche est ouverte, et + ouverte que le nez. Le couplage entre la cavité buccale et l’air est + important que le couplage entre la cavité nasale et l’air. La cavité nasale pourra être considérée comme un tube ouvert (velum) – fermé (narines) d’env. 12.5 cm.
En considérant la région sous les 1000 Hz, où les voyelles non nasales ont (en général) une seule résonance, F1, les voyelles nasales en ont 3, un formant oral, un formant nasal et un anti-formant
Les fréquences des anti-formants dépendent tout de même du degré de nasalité à cause du couplage entre le pharynx et la cavité nasale.
… peut-être la raison pour laquelle il y a toujours peu de voyelles nasales dans une langue. elles ne sont pas forcément difficiles à produire, mais difficiles à distinguer acoustiquement
interférences entre formants de la cavité orale et les anti-formants provoquent un abaissement de l’amplitude des formants, ainsi qu’un accroissement de la largeur de bande.
Comme pour les voyelles (pharynx + cavité buccale), les résonances du conduit nasal peuvent être modifiées par des changements dans la cavité pharyngale. On s’attend à ce que les résonances du conduit nasal soient plus basses par rapport à un tube uniforme à cause des constrictions aux narines (« nares »).
patterns phonologiques dûs à l’acoustique des voyelles nasalisées tendance à la neutralisation (perte de distinctivité) pour les voyelles nasalisées. Par exemple, dans certains dialectes de l’anglais américain, « pin » et « pen » ont fusionné. Selon Wright (1986), la nasalisation des voyelles a pour effet un rétrécissement de l’espace acoustique (comme les voyelles + courtes)
Certaines spéculations à propos des changements vocaliques en chaine (les voyelles montent d’un cran à un autre, les voyelles les plus hautes se diphtonguent) trouvent leurs origines dans la nasalisation des voyelles. Les voyelles basses sont souvent sujettes à une nasalisation passive, en effet le velum est tiré vers le bas par le muscle palato-glosse quand la langue est abaissée (Moll, 1962 ; Lubker, 1968) Une voyelle basse nasalisée serait ainsi perçue comme plus haute qu’elle ne l’est …
en pratique … quelques essais … étudiante de Stevens moi marche à peu près mais probablement un grand nombre de stratégies, et de variation physiologique. l’acoustique des nasales n’est pas encore totalement comprise …