Evaluation automatique du débit de la parole sur des données multilingues spontanées Jean-Luc Rouas, Jérôme Farinas, François Pellegrino.

Slides:



Advertisements
Présentations similaires
APPRENDRE A LIRE Présentation par : Marie-Christine Ratez CPC Chauny Roselyne Cail CPC Guise.
Advertisements

Identification automatique des langue
Traitement automatique de la parole hiver
Reconnaissance Automatique de la Parole
Codage de la parole à très bas débit avec des unités ALISP
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Acquisition automatique de «morphèmes acoustiques» pour la compréhension langagière en collaboration avec Allen Gorin Giuseppe Riccardi Jerry Wright.
Codage de la parole à très bas débit: passage du cas dépendant vers le cas indépendant du locuteur 6-ème réunion d'avancement SYMPATEX : ENST, 19 Septembre.
ENQUETE ANNUELLE DENTREPRISES DANS LE SECTEUR DU COMMERCE (EXERCICE 2004) ROYAUME DU MAROC HAUT COMMISSARIAT AU PLAN DIRECTION DE LA STATISTIQUE.
Indexation vidéo Indexation multimédia
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Par Aline Mahot et Charlyne Routier
Un questionnement nécessaire pour progresser .
Directeur de thèse : Régine André-Obrecht
Reconnaissance de la parole
Traitement Automatique de la Langue:
Typologies linguistiques et identification automatique des langues : vers des typologies automatiques ? François Pellegrino
Décodage des informations
Hésitations autonomes en 8 langues :
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Iryna Lehka, David Le Gac Laboratoire DYALANG, Université de Rouen
Le cahier de charge d'un système de RAP
La communication de ce document est soumise à autorisation de France Télécom R&D (Nom du fichier) - D1 - 01/03/2000 France Télécom R&D Énoncé Représentation.
COMMUNICATION INTERPERSONNELLE
Reconnaissance de la parole Difficultés Modèles
METHODOLOGIE Analyse & PRISE DE NOTES méthodes M1S10 (D. BUSNEL)
Conscience phonologique
Reconnaissance Vocale
Algorithme pour le web Géraldine Schneider
LIN 1720 DGD 9 Traits phonologiques
L'audition.
Cours Environnements Informatisés dApprentissage - 16/05/ M. Bétrancourt Mireille Bétrancourt Les Hypertextes et hypermédia TECFA Technologies pour.
‘The Voice Company’ Du texte à la Parole
Chapitre 2 La description du langage
L’enseignement des compétences grammaticales
L’approche du code au cycle 2
Master 1 – Sciences du Langage –
A. E. ARCHAKIAN Université Linguisitique V. Brioussov Chaire de pédagogie et de méthodolgie de l’enseignement des langues étrangères Erévan 2010.
Plan cours parole 29 Octobre 2003  1. Applications et démos (appli) voir feuilles distribués + démos  2. Fondements théoriques (theorie)  2.1 voir cours.
La perception de la parole
Traitement de la parole : Synthèse et reconnaissance
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
La conscience phonologique : « Distinguer les sons de la parole »
1 Management des unités commerciales Management des unités commerciales LANGUE VIVANTE ÉTRANGÈRE I - coefficient 3 L’usage d’un dictionnaire bilingue est.
Segmentation morphologique à partir de corpus Delphine Bernhard Laboratoire TIMC-IMAG, Grenoble
Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.
Présentation RFIA janvier 2002
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
Sémiologie Pour comprendre les processus de construction du sens
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
Fusion de paramètres en classification Parole/Musique Julie Mauclair – Equipe Parole Julien Pinquier – Equipe SAMoVA.
La prosodie pour l’Identification Automatique des Langues
Exploration de l’écart-type : La mesure/résumé de la dispersion la plus souvent utilisée.
Fusion de paramètres rythmiques et segmentaux pour l’Identification Automatique des Langues Jean-Luc Rouas1, Jérôme Farinas1, François Pellegrino2 & Régine.
TEXT MINING Fouille de textes
Le Traitement Automatique des Langues (TAL)
Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil
Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu.
Journée Des Doctorants 2004
Le lexique mental Mme. MEDANE
La perception de la parole
LA PHONÉTIQUE FRANÇAISE Conférence nr. 2 La théorie du phonème
Journées PFC 2008 Une étude de corpus de français de Suisse, Belgique, Alsace, Nord et Sud de la France Cécile Woehrling Philippe Boula de Mareüil Martine.
Bienvenue au cours MAT-350 Probabilités et statistiques.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
RelEx STANDARDISATION ET CALIBRAGE DE PRODUCTIONS ORALES Projet «relier les examens au CECRL » 24 Au 26 novembre 2010 Gilles Breton Expert associé CIEP.
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Transcription de la présentation:

Evaluation automatique du débit de la parole sur des données multilingues spontanées Jean-Luc Rouas, Jérôme Farinas, François Pellegrino

2 Plan  Introduction  Identification des langues et débit  Mesure du débit (Manuel / Perceptif)  Statistiques interlangues  Estimation du débit (automatique)  Conclusions

3 Introduction  Débit = nombre “d’unités” par seconde  Quelles unités sont pertinentes ? phonèmes, syllabes…  Pourquoi s’intéresser au débit ? Comprendre son impact sur les caractéristiques de l’énoncé Normaliser des durées (unités rythmiques, etc.) Synthétiser de la parole à plusieurs débits Utiliser ses caractéristiques pour différencier des locuteurs, etc. Applications en Linguistique et en Traitement Automatique de la Parole

4  Résultats sur de la parole lue (débit peu variable) :  Résultats sur de la parole spontanée (débit fortement variable) Identification des langues et débit (1) Corpus : MULTEXT Tâche : Choix parmi 5 langues ~70% correct en moyenne Corpus : OGI MLTS Tâche : Choix parmi 2 langues ~66% correct en moyenne (Détails dans Icassp 2003)

5  Dellwo & Wagner, 2003 Identification des langues et débit (2)  Ramus, 2002

6 Mesure manuelle du débit  Choix de l’unité pertinente Mots / seconde  Relié à la quantité d’information sémantique  Peu pertinent dans des langues ayant des mots polysyllabiques Débit syllabique : Syllabes / seconde  Cohérent avec plusieurs théories d’accès lexical et d’acquisition Débit phonémique : Phonèmes / seconde  Relié à la quantité d’information phonétique Étude perceptive

7 Et le débit perçu ?  Pfitzinger, 1998 Allemand, PhonDat II (informations ferroviaires) Dsyl = 5.44 ; Dphon = R(Dsyl, Dper) = 0.81 ; R(Dphon, Dper) = 0.73 ; R(Dcombin, Dper) = 0.88 (combinaison linéaire des débits syllabique & phonémique)

8 Étude interlangue : Les données  Corpus OGI Multilingual Telephone Speech (8kHz)  11 langues dont 6 avec étiquetage phonémique manuel  Mesures :

9 Étude interlangue: Statistiques  Débit syllabique (vocalique) moyen  Débit phonémique moyen (Toutes les stats sont significatives à p<.001)

10 Étude interlangue : L’espace DS/DP 11, , , , ,5 44,555,56 Ma Ge En Ja Sp Hi Débit syllabique Débit phonémique -DSyl -DPhon DEBIT LENT +DSyl +DPhon DEBIT RAPIDE -DSyl +DPhon SYLLABES COMPLEXES +DSyl -DPhon SYLLABES SIMPLES

11 Étude interlangue : Corrélations entre DS/DP Longueur syllabique moyenne interlangue= 2,8 phonèmes Longueur syllabique moyenne maximale = 3,1 phonèmes (GE) Longueur syllabique moyenne minimale = 2,4 phonèmes (SP)

12 Mesure automatique du débit (1) Frequency (kHz) Time (s) Amplitude Time (s) NonVowelPause Vowel  Segmentation automatique : (André-Obrecht, 1988) Segments courts (parties transitoires des phonèmes) Segments longs (parties stables des phonèmes) Détection d’activité vocale : Analyse spectrale du signal Détection automatiques des voyelles : (Pellegrino & Obrecht, 2000) Algorithme indépendant des locuteurs et des langues Segmentation infra-phonémique Erreurs de classification parole/bruit Détection de noyaux vocaliques + Erreurs de classification C/V

13 Mesure automatique du débit (2) RéférenceCorpusLangueVER Pfitzinger et al., 1996(*) PhonDatII (parole lue) Verbmobil (parole spontanée) Allemand 12.9% 21.0% Fakotakis et al., 1997TIMIT (parole lue) Anglais32.0% Pfau & Ruske, 1998 Verbmobil (parole spontanée) Allemand22.7% Howitt, 2000TIMIT (parole lue) Anglais29.5% Pellegrino & André-Obrecht, 1999 OGI MLTS (parole spontanée) Français Japonais Coréen Espagnol Vietnamien 19.5% 16.3% 28.5% 19.2% 31.1% Moyenne22.9% VER = Vowel Error Rate = (omissions + insertions)/Nb voyelles

14 Les pauses sont conservées Estimation du débit syllabique  Utilisation de la détection de noyau vocalique comme prédicteur du débit syllabique  R moyen = 0,86 (R² = 0,74)

15 Estimation du débit phonémique  Utilisation de la segmentation comme prédicteur du débit phonémique  R moyen = 0,72 (R² = 0,52)  Pente moyenne = 0,55 (infra-phonémique)

16 Conclusions  Comparaison interlangue Le débit est fonction du locuteur et de la langue Débit et rythme interagissent et sont intimement liés à la structure syllabique des langues Débits phonémiques et syllabiques sont fortement corrélés En terme de débit d’informations segmentales, il existe des différences interlangues (intéressant à corréler aux niveaux morphologique et syntaxique)  Prédiction automatique La détection des voyelles est un estimateur efficace du débit syllabique (R=0,86) La segmentation est un estimateur relativement efficace du débit phonémique (R=0.72)

17 Quelques extensions  La question de la détection des pauses Pauses silencieuses (bruitées !) Pauses remplies  Modification nette de l’estimation du débit moyen… Temps (s) Nombre de voyelles Nb de voyelles réel Nb de voyelles estimé

18 Quelques extensions (2)  Prise en compte des variations de débit

19 Et après ? Que faire une fois le débit estimé ? Normaliser les durées en fonction du débit syllabique ? Adapter les modèles au débit de l’énoncé étudié ? Traiter de manière différenciée les consonnes et les voyelles ? Traiter de manière différenciée les attaques/noyaux/coda ? Traiter de manière différenciée les syllabes (non) accentuées ? …