Hésitations autonomes en 8 langues :

Slides:



Advertisements
Présentations similaires
Programme Voltaire.
Advertisements

Comparaison d’une moyenne observée à une moyenne théorique
Module 1- Séance introductive. 2 Contenu du module Ouverture / introduction L'évaluation et WBI Présentations/attentes Questionnaire/test individuel Objectifs.
Saviez-vous que… les activités doral les plus pratiquées en classe sont : 1- Exposés: individuels (100%) équipe (92,3%) 2- Échange en grand groupe (92,3%)
Laboratoire dacoustique musicale. UPMC, CNRS, Ministère de la culture N. Henrich, M. Castellengo, D. Dubois, J. Poitevineau M. Garnier Approche de la qualité
Espaces perceptif et acoustique de voix des services telecoms
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole par indexation indépendant du locuteur Dijana PETROVSKA-DELACRETAZ.
Reconnaissance de la parole
Reconnaissance Automatique de la Parole
Épreuve pratique en Terminale Mercatique
L’Université Paris-Est Marne-la-Vallée
Le projet course en cours
Les TESTS STATISTIQUES
Effets de la compression temporelle dindices acoustiques sur la perception de la parole C. Jacquier & F. Meunier Laboratoire Dynamique Du Langage. CNRS.
Séjour à létranger et Insertion professionnelle 1 Séjour détudes à létranger et Insertion professionnelle ourip.org.
Page : 1 / 7 Conduite de projet Examen du 17 mai 2000 Durée : 3 heures Le support de cours et les notes sont nécessaires La notation tiendra compte très.
Page : 1 / 6 Conduite de projet Examen du 6 mai 1999 Durée : 4 heures Le support de cours est toléré La notation tiendra compte très significativement.
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Directeur de thèse : Régine André-Obrecht
18-19 novembre 2010 Centre denseignement à distance Témoignage sur la mise en place progressive de tutorat au CEAD de Clermont-Ferrand.
Traitement des sons de parole (4)
Master of Science en Technologie de l'Information.
Reconnaissance de la parole
Les sections européennes et de langues orientales
Alexandria, cest quoi ?. Des mots aux idées… Voici un dictionnaire multilingue pour votre site web. Il s'appelle Alexandria. C'est le premier du genre.
Analyses formantiques automatiques de voyelles orales : évidence de la réduction vocalique en langues française et allemande Cédric Gendrot 1 et.
Statistiques Séance 9 – 6 décembre 2005 N. Yamaguchi.
Section Allemand échange avec Ditzingen, dans le Bade-Wurtemberg. Section Espagnol échange avec Almeria, en Andalousie.
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Déploiement de la démarche « mon projet stratégique de plateforme »
La communication de ce document est soumise à autorisation de France Télécom R&D (Nom du fichier) - D1 - 01/03/2000 France Télécom R&D Énoncé Représentation.
Conscience phonologique
Reconnaissance Vocale
Jeopardy - Révision Final Jeopardy Phonèmes Traits Règles Syllabe
Jeopardy $100 ArticulationVoyelles 1Voyelles 2Acoustique 1Acoustique 2 $200 $300 $400 $500 $400 $300 $200 $100 $500 $400 $300 $200 $100 $500 $400 $300.
LA LIAISON.
Jeopardy - Révision Final Jeopardy Articulation Voyelles Consonnes
LIN 1720 DGD 9 Traits phonologiques
LIN 1720 DGD 2 Voyelles University of Ottawa.
LIN 1720 DGD 2 Voyelles University of Ottawa.
L'audition.
La méthodologie expérimentale Fondements et bases d’application
Quelle est la langue officielle de ce pays? japonais.
AIDE A LA MOBILITE DES ETUDIANTS DE LULg Dominique FRERE Anne-Françoise ROGISTER Journée Thématique – 17 novembre 2009.
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires - Démonstration : quel imitateur êtes vous ? Plateau Traitement du son.
Pourquoi apprendre le francais?
Philippe Boula de Mareüil LIMSI-CNRS
Master 1 – Sciences du Langage –
Rôle de la L1 dans l’apprentissage de la L2
SEQUENCE THEATRE Objectifs: donner / assister à une représentation bilingue espagnol-français. Accompagner les apprentissages de la langue en classe,
La perception de la parole
Traitement de la parole : Synthèse et reconnaissance
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
LYCÉE MOLIÈRE. LE LYCÉE MOLIÈRE est un établissement centenaire qui propose - Une offre diversifiée d'enseignement de langues : Allemand, Anglais, Espagnol,
Agenda de la présentation
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
Master HTTP Créator LARNS Corporation Membres : ALFOSEAJean-FabienChef de Projet LEROGNONRenaudDesigner N'DOYEAssaneWebmestre RONCAGLIAThomasRelation Publique.
Séance 8 30 novembre 2005 N. Yamaguchi
La politique linguistique en France
Evaluation automatique du débit de la parole sur des données multilingues spontanées Jean-Luc Rouas, Jérôme Farinas, François Pellegrino.
Fusion de paramètres rythmiques et segmentaux pour l’Identification Automatique des Langues Jean-Luc Rouas1, Jérôme Farinas1, François Pellegrino2 & Régine.
Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil
Catherine Torres Wolf Halberstadt IA- IPR Allemand Novembre 2006
Video.
Études de Marché MBA Hiver 2006 SÉANCE 3: LES DONNÉES PRIMAIRES: MÉTHODES QUALITATIVES.
Présentation du système
Claude Matricon ("le marketing du réel") propose une classification qui permet de distinguer les 4 différents marchés dont dépend l'entreprise :  marché.
Journées PFC 2008 Une étude de corpus de français de Suisse, Belgique, Alsace, Nord et Sud de la France Cécile Woehrling Philippe Boula de Mareüil Martine.
Contribution du traitement automatique de la parole à l’étude de la variation diatopique en français Martine Adda-Decker Philippe Boula de Mareüil LIMSI-CNRS.
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Transcription de la présentation:

Hésitations autonomes en 8 langues : étude acoustique et perceptive Vasilescu I., Candea M. & Adda-Decker M. Hésitations autonomes en 8 langues : Colloque MIDL 29-30 nov. 2004 MIDL - projet STIC-SHS du CNRS Programme Société de l’Information 2001-2004

Hésitations autonomes en 8 langues : objet d’étude Phénomènes dits d’hésitation ou de formulation : grande diversité. Hésitations autonomes : Segment vocalique allongé placé entre deux pauses ou bien à la suite d’un mot mais ne constituant pas un allongement de celui-ci ( pauses remplies, fillers). Occurrences: ~5% dans les corpus spontanés < 0.5% dans les corpus de parole lue/préparée. Caractéristique principale: très longues (jusqu’à 1 seconde, voire +). En français et en anglais : il s’agit d’une voyelle centrale.

Hésitations autonomes en 8 langues : questions Hésitations autonomes : porteuses d’information spécifique à la langue ? Faut-il prévoir des modèles différents pour chaque langue ? Les éventuelles différences sont-elles perceptibles à l’oreille ? Timbre des voyelles support : toujours central ? toujours une voyelle du système vocalique de la langue ? Paramètres (autres que la durée) permettant de différencier la voyelle d’hésitation de son homologue intra-lexicale (F0, qualité de voix, timbre…) ? Remarque : peu d’études sur les langues autre que anglais et français ; pas d’études comparatives multilingues à notre connaissance

CORPORA Corpus multilingue Corpus français Émissions journalistiques en 8 langues (2 heures / langue) (français, espagnol, italien, portugais, anglais, allemand, arabe moyen-oriental, chinois mandarin) Corpus français Émissions journalistiques diverses (env. 6 heures) Etude plus approfondie 1e et 2e hesitation : allemand (voyelle, voyelle + coda nasale) 3e et 4e hesitation : francaise (f, h 0.6 sec 100Hz modale fmfrance3_980204_1200_1300-291-354.1.wav) 5e anglais americain femme efee970722_2728_2746 6e anglais americain homme emew970708_632-556.1 7e espagnol femme sfse96C27-185-567.1 8e espagnol homme smse96C24-013-887.3 9e italien femme ifGRR940406_1700_126_13262

CORPUS MULTILINGUE Corpus initial Émissions journalistiques en 8 langues (français, espagnol, italien, portugais, anglais, allemand, arabe moyen-oriental, chinois mandarin). Sous-corpus hésitations Extraction semi-automatique 30 à 200 occurrences par langue, locuteurs h/f. Critères : durée > 200 ms. Contrôle Nous avons retenu uniquement les hésitations autonomes (voyelles support extra-lexicales) et nous avons écarté les mots outils vocaliques allongés. 1e et 2e hesitation : allemand (voyelle, voyelle + coda nasale) 3e et 4e hesitation : francaise (f, h 0.6 sec 100Hz modale fmfrance3_980204_1200_1300-291-354.1.wav) 5e anglais americain femme efee970722_2728_2746 6e anglais americain homme emew970708_632-556.1 7e espagnol femme sfse96C27-185-567.1 8e espagnol homme smse96C24-013-887.3 9e italien femme ifGRR940406_1700_126_13262

Analyse acoustique (1) Analyse acoustique français [ə] Distribution des voyelles support dans un espace F1/F2 Dispersion inter-langues > dispersion intra-langues. Qualité vocalique différente français [ə] anglais [a], [ə] et [æ], espagnol [e] et [ɛ], italien [ɛ] et [ə] . De manière générale : voyelle support appartient au système vocalique de la langue. Voyelle support hors système de la langue : italien [ə] .

Analyse acoustique (2) Distribution des valeurs moyennes (hommes et femmes) : voyelles centrales et antérieures

Etude perceptive Français/L2 (1) 6 stimuli par langue(x 2) 20 auditeurs français Tâche : Français / L2, après une phase de familiarisation avec L2 Hésitations isolées; diverses qualités de voix, timbre +/- central de la voyelle support, sélection de stimuli représentatifs pour chaque langue Discrimination moyenne : 75%. – : français vs arabe, portugais, allemand → voyelle support centrale + : français vs italien, espagnol, anglais → voyelle centrale vs [ε], [e], [æ] français vs chinois → hauteur F0,qualité de voix

Étude perceptive Français/L2 (2) L2 mieux dans : FR/Arabe, FR/Chinois, FR/Allemand. Stratégie: les auditeurs ont recherché ce qui est DIFFERENT par rapport à un prototype d’hésitation du français. Ce résultat soulève des questions sur le rôle de la langue maternelle et du protocole de test dans les tâches de discrimination.

Etude perceptive Français/L2 (3) Effet L1 vs L2 : ANOVA deux facteurs (« langue de test » et « langue maternelle », i.e. comparer L1 vs L2). Effet significatif du facteur « condition de test/langue de test » (p<0.0001). L2 est mieux reconnu que L1 (PLSD de Fisher, p=0.0198) Effet L2 par rapport au Français (L1): t-test appariés. Les sujets ont significativement (p<0.0001) mieux reconnu l’anglais, l’espagnol, l’italien, le chinois que l’arabe, le portugais et l’allemand par rapport au français.

CORPUS Français Étude acoustique comparative : voyelle d’hésitation vs voyelle intra-lexicale de timbre similaire Étude sur le français Analyse acoustique des occurrences des voyelles d’hésitations vs des occurrences de [ø] (eu-fermé) et de [ə] (schwa) intra-lexicaux. Critère de sélection Segments de durée > 40ms extraits automatiquement par le système d’alignement du LIMSI. . H F hésitations 1484 378 schwa [ə - œ] 964 754 eu-fermé [ø] 923 291 70% locuteurs Hommes vs. 30% locuteurs Femmes.

Paramètres étudiés : voyelle d’hésitation vs voyelle intra-lexicale de timbre similaire Durée Timbre de la voyelle : F1, F2, F3 Hauteur & contour de la fréquence fondamentale F0 Qualité de voix

Paramètres étudiés : la durée hésit. schwa Fig. 3a– Distribution des hésitations en fonction de la durée (hommes+femmes). Eu-fermé Hésitations >200ms (200-650ms) Voy. Intra-lexicales <100ms (40-150/200ms) Fig. 3b&c – Distribution des schwa & eu-fermés en fonction de la durée (hommes+femmes).

Paramètres étudiés : la fréquence fondamentale F0 Distribution des moyennes similaire pour voyelles d’hésitation/voyelles du système. Distribution plus étendue avec plus de valeurs extrêmes pour les voyelles d’hésitation. Non détection avec PRAAT: 11,5 (hésitations) vs 3% (intra-lexicales) – Hommes 8,2 (hésitations) vs 0,5% (intra-lexicales) – Femmes Hypothèse: Les hésitations sont produites avec un contrôle réduit de la phonation, et sujettes à une production non modale (creaky, breathy). F0Moy E-Type Hésitations hommes 155 97,3 femmes 179 68,5 Schwa hommes 114 48,6 femmes 192 38,3 Eu-fermé hommes 144 45,4 femmes 219 56

Paramètres étudiés : le timbre F1, F2, F3 : Ouvert/fermé (F1) : les hésitations sont plus ouvertes (mais il faut tenir compte des effets liés à la durée – cf. communication de C. Gendrot & M. Adda-Decker). Antérieur/postérieur (F2) : Distribution des moyennes similaire pour voyelles d’hésitation/voyelles du système. Étiré/arrondi (F3) : moyennes de 2500Hz pour les hésitations et les voyelles intra lexicales (cf. C. Gendrot & M. Adda-Decker). Hésitations H / F [ə - œ] H / F réf. Calliope - Fant [ø] H / F F1 F2 470/523 1464/1659 404/523 500/550 1421/1659 1450/1650 382/430 400/450 1465/1666

Conclusions Observations acoustiques Tests de perception Plaident en faveur de l’existence d’informations spécifiques à la langue dans les hésitations autonomes. Tests de perception Confirment que les différences acoustiques observées sont perçues par les auditeurs. Par conséquent : Approfondir la modélisation de ces phénomènes pour chaque langue Exploiter ces indices dans l’identification automatique de la langue

Perspectives Acoustique Perception comparer voyelle d’hésitation vs voyelle du système vocalique (intra-lexicale) rapport hésitation autonome / hésitations « mots outils figés » (roumain, japonais, etc.) hésitations autonomes vs allongements vocaliques d’une voyelle finale Perception L2’/L2 pour des locuteurs de langue L1.