La prosodie pour l’Identification Automatique des Langues

Slides:

Advertisements

Présentations similaires

IREMIA : Institut de REcherche en Mathématiques et Informatique Appliquées Université de la Réunion Uniformisation des mécanismes de conception de SMA.

Advertisements

10/31/02 Leïla Merghem - LIP6 Une approche Multi-Agents pour la Simulation de Réseaux de Télécommunications Leïla Merghem (LIP 6) Dominique Gaïti (LIP.

Sandrine Peraldi (ISIT) Jean-Philippe KOTOWICZ (INSA Rouen)

Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.

Indexation Parole / Musique / Bruit

Une approche informationnelle de la restauration d’images

SP1 : Transfert de technologie

Identification automatique des langue

Reconnaissance de la parole

Analyse de la parole Ivan Magrin-Chagnolleau, CNRS

Reconnaissance Automatique de la Parole

Codage de la parole à très bas débit avec des unités ALISP

Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.

Indexation vidéo Indexation multimédia

Apprentissage continué de la lecture au Cycle 2

Directeur de thèse : Régine André-Obrecht

Reconnaissance de la parole

Traitement Automatique de la Langue:

Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)

INTERVENTION SUR UN SYSTEME TECHNIQUE

Décodage des informations

La perception du langage parlé

Hésitations autonomes en 8 langues :

Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.

Le cahier de charge d'un système de RAP

Reconnaissance Vocale

Présentation du mémoire

Sylvain Daudé DEA ATIAM

‘The Voice Company’ Du texte à la Parole

Chapitre 2 La description du langage

Modélisation de la lecture grâce à un modèle connexionniste

LA DIFFÉRENCE ENTRE L’ÉTUDE D’UNE PHRASE ET D’UN ENONCÉ

Avignon, 14 novembre 2006http://biobimo.eurecom.fr Sous-Projet 4 : Segmentation et Authentification conjointes de la voix et du visage Etat de l’art -

Résultats (2) Si l'on compare les résultats obtenus pour les classes où l'on ne prend pas en compte le voisement (ensembles #C2, #C3, #C4, #C5) à ceux.

Plan cours parole 29 Octobre 2003  1. Applications et démos (appli) voir feuilles distribués + démos  2. Fondements théoriques (theorie)  2.1 voir cours.

Traitement de la parole : Synthèse et reconnaissance

Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.

Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.

Indexation sonore : recherche des composantes Parole et Musique Julien PINQUIER Institut de Recherche en Informatique de Toulouse – Equipe ART.ps 118,

Analyse spectrale Raphaël ARROUAS Etienne OUSS

Segmentation morphologique à partir de corpus Delphine Bernhard Laboratoire TIMC-IMAG, Grenoble

Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.

Dominique LAURENT Patrick SEGUELA

Présentation RFIA janvier 2002

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,

TNS et Analyse Spectrale

Etat des lieux et perspectives

Fusion de paramètres en classification Parole/Musique Julie Mauclair – Equipe Parole Julien Pinquier – Equipe SAMoVA.

Extraction des paramètres cosmologiques par une approche multisonde

Evaluation automatique du débit de la parole sur des données multilingues spontanées Jean-Luc Rouas, Jérôme Farinas, François Pellegrino.

Du discours aux modèles… Une tentative d’articulation

L’enseignement de spécialité SLAM

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Synthèse de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage

Fusion de paramètres rythmiques et segmentaux pour l’Identification Automatique des Langues Jean-Luc Rouas1, Jérôme Farinas1, François Pellegrino2 & Régine.

Vers une intégration plus poussée de la recherche Web avec les Systèmes d’Information Géographiques Adapté de «Toward Tighter Integration of Web Search.

La formation en éducation thérapeutique du patient : résultats d`une enquête nationale Jérôme Foucaud, Institut National de Prévention et d’Éducation pour.

20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.

Réunion GafoDonnées: Equipe SIG/IRIT 24/25 janvier 2002

Le Traitement Automatique des Langues (TAL)

Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil

Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu.

Journée Des Doctorants 2004

Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.

14/10/2004 Parcours et unités d’enseignement du domaine : Signal et Images Isabelle Bloch, Bertrand David, Yves Grenier.

Modélisation des Actions Mécaniques Première sti2d

Transmodalité – Multimodalité Fabrice Maurel IRIT – Toulouse Directeur : Luis Fariñas Del Cerro Équipe DIAMANT – Nadine Vigouroux Concours CNRS CR

NEDERLEX : un outil en ligne d'aide à la lecture de textes en langue étrangère. G. Deville - M. Miceli (Ecole des Langues Vivantes - FUNDP) L. Dumortier.

Algorithmes d’analyse spectrale en spectrométrie gamma embarquée

À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.

Transcription de la présentation:

La prosodie pour l’Identification Automatique des Langues DEA IIL - IRIT - équipe IHM-PT Directeur de recherche: Régine ANDRE-OBRECHT Responsable de stage : François PELLEGRINO Jérôme FARINAS

Plan de l’exposé Cadre de l’étude La prosodie Evaluation des algorithmes d’extraction de la fréquence fondamentale Une modélisation de la prosodie pour l’IAL Conclusions et perspectives

1 Cadre de l’étude Identification Automatique des Langues (IAL) Projet de recherche de l’équipe : projet Discrimination Automatique Multilingue système complet d’IAL : un module de décodage acoustico-phonétique un modèle de langage un module prosodique Sujet de DEA : recherche des algorithmes d’extraction de la fréquence fondamentale, étude multilingue de la structure prosodique suprasegmentale (recherche d’unités prosodiques et modélisation)

2 La prosodie définitions quelques fonctions difficultés liés à l’extraction de paramètres et à la modélisation

2 La prosodie : définitions Au niveau acoustique : Hauteur (fréquence fondamentale F0) intensité (énergie) durée Au niveau perceptuel : rythme mélodie accentuation

2 La prosodie : quelques fonctions Distinction entre homonymes a segment  to segment plátano  platano Structuration de l’énoncé L’instituteur dit le directeur est un incapable Modalité Il va venir ? Il va venir. Il va venir ! Fonctions non linguistiques calme ou énervé, triste ou gai, enthousiaste, surpris...

2 La prosodie : difficultés Au niveau de la modélisation : nombreux modèles, pas de théorie unifiée apprentissage implicite : enseignement implicite pour la langue naturelle prise en compte récente lors de l’apprentissage de langues étrangères [Bagshaw 94] Au niveau de l’extraction de paramètres : détection voisement confusion entre harmoniques signal téléphonique (F0 manquant, variabilité)

Autocorrélation

Peigne spectral

Évaluation algorithmes... Comment évaluer un algorithme ? Difficultés dues aux erreurs de détections Autre source d’information pour évaluer Bases de référence [Bagshaw 94] Intérêt de la combinaison d’algorithmes d’extraction de la fréquence fondamentale [Hess 83]

Méthode combinatoire

4 Une modélisation de la prosodie pour l’IAL Corpus utilisé Système général Extraction de paramètres Modélisation des unités prosodiques Modèle de langage résultats

4 Une modélisation… : corpus utilisé OGI-MLTS (Oregon Graduate Institute - Multi Lingual Téléphone Speech Corpus) corpus développé pour l’IAL 11 langues (Français et Japonais utilisés) Fichiers de parole non-contrainte : htl, htc, meal, room, story-at, story-bt Divisé en corpus APP et TST

4 Une modélisation… : système général Modélisations existantes : approche classique adaptée à la prosodie [Muthusamy 93] [Hazen 97] approche basée sur F0 [Itahashi 95] Vue générale du module prosodique : Signal Segmentation Paramétrisation Modèle prosodique Modèle de langage Langue

4 Une modélisation... : extraction de paramètres Dénivelé de E et de F0 Dérivée première de E et de F0 Dérivée seconde de E et de F0 Ecart-type de E et de F0 Skewness de E et de F0 Kurtosis de E et de F0

4 Une modélisation… : modèle prosodique Unité : segment voisé 10 formes prosodiques : ST, BU, TR, UPlo, UPmi, UPhi, UPen, DWlo, DWmi, DWhi une forme = un Modèle de Markov Caché 1 état 3 états

4 Une modélisation… : modèle de langage But : modéliser les enchaînements entre les formes contenues dans les «phrases» Modèle langage bigramme (en utilisant le système multigramme [Deligne 96]) øi : Forme prosodique

4 Une modélisation… : résultats Modélisation des unités prosodiques : Identification des langues :

5 Conclusion et perspectives Recherche d’unités prosodiques spécifiques à chaque langue Essayer d’autres modélisations des unités prosodiques Modélisation de la durée pour prendre en compte le rythme de la parole