La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Étude acoustique et perceptive Vasilescu I., Candea M. & Adda-Decker M. Colloque MIDL 29-30 nov. 2004 MIDL - projet STIC-SHS du CNRS Programme Société

Présentations similaires


Présentation au sujet: "Étude acoustique et perceptive Vasilescu I., Candea M. & Adda-Decker M. Colloque MIDL 29-30 nov. 2004 MIDL - projet STIC-SHS du CNRS Programme Société"— Transcription de la présentation:

1 étude acoustique et perceptive Vasilescu I., Candea M. & Adda-Decker M. Colloque MIDL nov MIDL - projet STIC-SHS du CNRS Programme Société de lInformation Hésitations autonomes en 8 langues :

2 Hésitations autonomes en 8 langues : objet détude Phénomènes dits dhésitation ou de formulation : grande diversité. Hésitations autonomes : Segment vocalique allongé placé entre deux pauses ou bien à la suite dun mot mais ne constituant pas un allongement de celui-ci ( pauses remplies, fillers). Occurrences: ~5% dans les corpus spontanés < 0.5% dans les corpus de parole lue/préparée. Caractéristique principale: très longues (jusquà 1 seconde, voire +). En français et en anglais : il sagit dune voyelle centrale.

3 Hésitations autonomes en 8 langues : questions Hésitations autonomes : porteuses dinformation spécifique à la langue ? Faut-il prévoir des modèles différents pour chaque langue ? Les éventuelles différences sont-elles perceptibles à loreille ? Timbre des voyelles support : toujours central ? toujours une voyelle du système vocalique de la langue ? Paramètres (autres que la durée) permettant de différencier la voyelle dhésitation de son homologue intra-lexicale (F0, qualité de voix, timbre…) ? Remarque : peu détudes sur les langues autre que anglais et français ; pas détudes comparatives multilingues à notre connaissance

4 CORPORA Corpus multilingue Émissions journalistiques en 8 langues (2 heures / langue) (français, espagnol, italien, portugais, anglais, allemand, arabe moyen- oriental, chinois mandarin ) Corpus français Émissions journalistiques diverses (env. 6 heures) Etude plus approfondie

5 CORPUS MULTILINGUE Corpus initial Émissions journalistiques en 8 langues (français, espagnol, italien, portugais, anglais, allemand, arabe moyen-oriental, chinois mandarin). Sous-corpus hésitations Extraction semi-automatique 30 à 200 occurrences par langue, locuteurs h/f. Critères : durée > 200 ms. Contrôle Nous avons retenu uniquement les hésitations autonomes (voyelles support extra-lexicales) et nous avons écarté les mots outils vocaliques allongés.

6 Analyse acoustique (1) Analyse acoustique Distribution des voyelles support dans un espace F1/F2 Dispersion inter-langues > dispersion intra-langues. Qualité vocalique différente français [ə] anglais [a], [ə] et [æ], espagnol [e] et [ ɛ ], italien [ ɛ ] et [ə]. De manière générale : voyelle support appartient au système vocalique de la langue. Voyelle support hors système de la langue : italien [ə].

7 Distribution des valeurs moyennes (hommes et femmes) : voyelles centrales et antérieures Analyse acoustique (2)

8 Etude perceptive Français/L2 (1) Hésitations isolées; diverses qualités de voix, timbre +/- central de la voyelle support, sélection de stimuli représentatifs pour chaque langue Discrimination moyenne : 75%. – : français vs arabe, portugais, allemand voyelle support centrale + : français vs italien, espagnol, anglais voyelle centrale vs [ε], [e], [æ] français vs chinois hauteur F0,qualité de voix 6 stimuli par langue(x 2) 20 auditeurs français Tâche : Français / L2, après une phase de familiarisation avec L2

9 Étude perceptive Français/L2 (2) L2 mieux dans : FR/Arabe, FR/Chinois, FR/Allemand. Stratégie: les auditeurs ont recherché ce qui est DIFFERENT par rapport à un prototype dhésitation du français. Ce résultat soulève des questions sur le rôle de la langue maternelle et du protocole de test dans les tâches de discrimination.

10 Etude perceptive Français/L2 (3) Effet L1 vs L2 : ANOVA deux facteurs (« langue de test » et « langue maternelle », i.e. comparer L1 vs L2). Effet significatif du facteur « condition de test/langue de test » (p<0.0001). L2 est mieux reconnu que L1 (PLSD de Fisher, p=0.0198) Effet L2 par rapport au Français (L1): t-test appariés. Les sujets ont significativement (p<0.0001) mieux reconnu langlais, lespagnol, litalien, le chinois que larabe, le portugais et lallemand par rapport au français.

11 Étude sur le français Analyse acoustique des occurrences des voyelles dhésitations vs des occurrences de [ø] (eu-fermé) et de [ə] (schwa) intra-lexicaux. Critère de sélection Segments de durée > 40ms extraits automatiquement par le système dalignement du LIMSI. CORPUS Français Étude acoustique comparative : voyelle dhésitation vs voyelle intra-lexicale de timbre similaire. H F hésitations schwa [ ə - œ] eu-fermé [ ø ] % locuteurs Hommes vs. 30% locuteurs Femmes.

12 Durée Timbre de la voyelle : F1, F2, F3 Hauteur & contour de la fréquence fondamentale F0 Qualité de voix Paramètres étudiés : voyelle dhésitation vs voyelle intra-lexicale de timbre similaire

13 Paramètres étudiés : la durée Fig. 3a– Distribution des hésitations en fonction de la durée (hommes+femmes). Fig. 3b&c – Distribution des schwa & eu-fermés en fonction de la durée (hommes+femmes). Hésitations >200ms ( ms) Voy. Intra-lexicales <100ms (40-150/200ms) hésit.schwa Eu-fermé

14 Fréquence fondamentale: Distribution des moyennes similaire pour voyelles dhésitation/voyelles du système. Distribution plus étendue avec plus de valeurs extrêmes pour les voyelles dhésitation. Non détection avec PRAAT: 11,5 (hésitations) vs 3% (intra-lexicales) – Hommes 8,2 (hésitations) vs 0,5% (intra-lexicales) – Femmes Hypothèse: Les hésitations sont produites avec un contrôle réduit de la phonation, et sujettes à une production non modale (creaky, breathy). Paramètres étudiés : la fréquence fondamentale F0 F0MoyE-Type Hésitations hommes 15597,3 femmes17968,5 Schwa hommes11448,6 femmes19238,3 Eu-fermé hommes14445,4 femmes21956

15 Paramètres étudiés : le timbre Hésitations H / F [ ə - œ] H / F réf. Calliope - Fant [ ø ] H / F réf. Calliope - Fant F1F2 470/ / / / / / / / / /1650 F1, F2, F3 : Ouvert/fermé (F1) : les hésitations sont plus ouvertes (mais il faut tenir compte des effets liés à la durée – cf. communication de C. Gendrot & M. Adda-Decker). Antérieur/postérieur (F2) : Distribution des moyennes similaire pour voyelles dhésitation/voyelles du système. Étiré/arrondi (F3) : moyennes de 2500Hz pour les hésitations et les voyelles intra lexicales (cf. C. Gendrot & M. Adda-Decker).

16 Conclusions Observations acoustiques Plaident en faveur de lexistence dinformations spécifiques à la langue dans les hésitations autonomes. Tests de perception Confirment que les différences acoustiques observées sont perçues par les auditeurs. Par conséquent : Approfondir la modélisation de ces phénomènes pour chaque langue Exploiter ces indices dans lidentification automatique de la langue

17 Perspectives Acoustique comparer voyelle dhésitation vs voyelle du système vocalique (intra- lexicale) rapport hésitation autonome / hésitations « mots outils figés » (roumain, japonais, etc.) hésitations autonomes vs allongements vocaliques dune voyelle finale Perception L2/L2 pour des locuteurs de langue L1.


Télécharger ppt "Étude acoustique et perceptive Vasilescu I., Candea M. & Adda-Decker M. Colloque MIDL 29-30 nov. 2004 MIDL - projet STIC-SHS du CNRS Programme Société"

Présentations similaires


Annonces Google