La prosodie pour l’Identification Automatique des Langues

Slides:



Advertisements
Présentations similaires
IREMIA : Institut de REcherche en Mathématiques et Informatique Appliquées Université de la Réunion Uniformisation des mécanismes de conception de SMA.
Advertisements

10/31/02 Leïla Merghem - LIP6 Une approche Multi-Agents pour la Simulation de Réseaux de Télécommunications Leïla Merghem (LIP 6) Dominique Gaïti (LIP.
Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Indexation Parole / Musique / Bruit
Une approche informationnelle de la restauration d’images
SP1 : Transfert de technologie
Identification automatique des langue
Reconnaissance de la parole
Analyse de la parole Ivan Magrin-Chagnolleau, CNRS
Reconnaissance Automatique de la Parole
Codage de la parole à très bas débit avec des unités ALISP
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Indexation vidéo Indexation multimédia
Apprentissage continué de la lecture au Cycle 2
Directeur de thèse : Régine André-Obrecht
Reconnaissance de la parole
Traitement Automatique de la Langue:
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
INTERVENTION SUR UN SYSTEME TECHNIQUE
Décodage des informations
La perception du langage parlé
Hésitations autonomes en 8 langues :
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Le cahier de charge d'un système de RAP
Reconnaissance Vocale
Présentation du mémoire
Sylvain Daudé DEA ATIAM
‘The Voice Company’ Du texte à la Parole
Chapitre 2 La description du langage
Modélisation de la lecture grâce à un modèle connexionniste
LA DIFFÉRENCE ENTRE L’ÉTUDE D’UNE PHRASE ET D’UN ENONCÉ
Avignon, 14 novembre 2006http://biobimo.eurecom.fr Sous-Projet 4 : Segmentation et Authentification conjointes de la voix et du visage Etat de l’art -
Résultats (2) Si l'on compare les résultats obtenus pour les classes où l'on ne prend pas en compte le voisement (ensembles #C2, #C3, #C4, #C5) à ceux.
Plan cours parole 29 Octobre 2003  1. Applications et démos (appli) voir feuilles distribués + démos  2. Fondements théoriques (theorie)  2.1 voir cours.
Traitement de la parole : Synthèse et reconnaissance
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Indexation sonore : recherche des composantes Parole et Musique Julien PINQUIER Institut de Recherche en Informatique de Toulouse – Equipe ART.ps 118,
Analyse spectrale Raphaël ARROUAS Etienne OUSS
Segmentation morphologique à partir de corpus Delphine Bernhard Laboratoire TIMC-IMAG, Grenoble
Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.
Dominique LAURENT Patrick SEGUELA
Présentation RFIA janvier 2002
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
TNS et Analyse Spectrale
Etat des lieux et perspectives
Fusion de paramètres en classification Parole/Musique Julie Mauclair – Equipe Parole Julien Pinquier – Equipe SAMoVA.
Extraction des paramètres cosmologiques par une approche multisonde
Evaluation automatique du débit de la parole sur des données multilingues spontanées Jean-Luc Rouas, Jérôme Farinas, François Pellegrino.
Du discours aux modèles… Une tentative d’articulation
L’enseignement de spécialité SLAM
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Synthèse de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage
Fusion de paramètres rythmiques et segmentaux pour l’Identification Automatique des Langues Jean-Luc Rouas1, Jérôme Farinas1, François Pellegrino2 & Régine.
Vers une intégration plus poussée de la recherche Web avec les Systèmes d’Information Géographiques Adapté de «Toward Tighter Integration of Web Search.
La formation en éducation thérapeutique du patient : résultats d`une enquête nationale Jérôme Foucaud, Institut National de Prévention et d’Éducation pour.
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
Réunion GafoDonnées: Equipe SIG/IRIT 24/25 janvier 2002
Le Traitement Automatique des Langues (TAL)
Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil
Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu.
Journée Des Doctorants 2004
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
14/10/2004 Parcours et unités d’enseignement du domaine : Signal et Images Isabelle Bloch, Bertrand David, Yves Grenier.
Modélisation des Actions Mécaniques Première sti2d
Transmodalité – Multimodalité Fabrice Maurel IRIT – Toulouse Directeur : Luis Fariñas Del Cerro Équipe DIAMANT – Nadine Vigouroux Concours CNRS CR
NEDERLEX : un outil en ligne d'aide à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP) L. Dumortier.
Algorithmes d’analyse spectrale en spectrométrie gamma embarquée
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Transcription de la présentation:

La prosodie pour l’Identification Automatique des Langues DEA IIL - IRIT - équipe IHM-PT Directeur de recherche: Régine ANDRE-OBRECHT Responsable de stage : François PELLEGRINO Jérôme FARINAS

Plan de l’exposé Cadre de l’étude La prosodie Evaluation des algorithmes d’extraction de la fréquence fondamentale Une modélisation de la prosodie pour l’IAL Conclusions et perspectives

1 Cadre de l’étude Identification Automatique des Langues (IAL) Projet de recherche de l’équipe : projet Discrimination Automatique Multilingue système complet d’IAL : un module de décodage acoustico-phonétique un modèle de langage un module prosodique Sujet de DEA : recherche des algorithmes d’extraction de la fréquence fondamentale, étude multilingue de la structure prosodique suprasegmentale (recherche d’unités prosodiques et modélisation)

2 La prosodie définitions quelques fonctions difficultés liés à l’extraction de paramètres et à la modélisation

2 La prosodie : définitions Au niveau acoustique : Hauteur (fréquence fondamentale F0) intensité (énergie) durée Au niveau perceptuel : rythme mélodie accentuation

2 La prosodie : quelques fonctions Distinction entre homonymes a segment  to segment plátano  platano Structuration de l’énoncé L’instituteur dit le directeur est un incapable Modalité Il va venir ? Il va venir. Il va venir ! Fonctions non linguistiques calme ou énervé, triste ou gai, enthousiaste, surpris...

2 La prosodie : difficultés Au niveau de la modélisation : nombreux modèles, pas de théorie unifiée apprentissage implicite : enseignement implicite pour la langue naturelle prise en compte récente lors de l’apprentissage de langues étrangères [Bagshaw 94] Au niveau de l’extraction de paramètres : détection voisement confusion entre harmoniques signal téléphonique (F0 manquant, variabilité)

Autocorrélation

Peigne spectral

Évaluation algorithmes... Comment évaluer un algorithme ? Difficultés dues aux erreurs de détections Autre source d’information pour évaluer Bases de référence [Bagshaw 94] Intérêt de la combinaison d’algorithmes d’extraction de la fréquence fondamentale [Hess 83]

Méthode combinatoire

4 Une modélisation de la prosodie pour l’IAL Corpus utilisé Système général Extraction de paramètres Modélisation des unités prosodiques Modèle de langage résultats

4 Une modélisation… : corpus utilisé OGI-MLTS (Oregon Graduate Institute - Multi Lingual Téléphone Speech Corpus) corpus développé pour l’IAL 11 langues (Français et Japonais utilisés) Fichiers de parole non-contrainte : htl, htc, meal, room, story-at, story-bt Divisé en corpus APP et TST

4 Une modélisation… : système général Modélisations existantes : approche classique adaptée à la prosodie [Muthusamy 93] [Hazen 97] approche basée sur F0 [Itahashi 95] Vue générale du module prosodique : Signal Segmentation Paramétrisation Modèle prosodique Modèle de langage Langue

4 Une modélisation... : extraction de paramètres Dénivelé de E et de F0 Dérivée première de E et de F0 Dérivée seconde de E et de F0 Ecart-type de E et de F0 Skewness de E et de F0 Kurtosis de E et de F0

4 Une modélisation… : modèle prosodique Unité : segment voisé 10 formes prosodiques : ST, BU, TR, UPlo, UPmi, UPhi, UPen, DWlo, DWmi, DWhi une forme = un Modèle de Markov Caché 1 état 3 états

4 Une modélisation… : modèle de langage But : modéliser les enchaînements entre les formes contenues dans les «phrases» Modèle langage bigramme (en utilisant le système multigramme [Deligne 96]) øi : Forme prosodique

4 Une modélisation… : résultats Modélisation des unités prosodiques : Identification des langues :

5 Conclusion et perspectives Recherche d’unités prosodiques spécifiques à chaque langue Essayer d’autres modélisations des unités prosodiques Modélisation de la durée pour prendre en compte le rythme de la parole