La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu.

Présentations similaires


Présentation au sujet: "Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu."— Transcription de la présentation:

1

2 Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu LIMSI – CNRS Traitement du Langage Parlé École doctorale d’Informatique de Paris XI 27 mars 2008 Journée Des Doctorants du LIMSI

3 2 Problématiques Variation des prononciations des mots en fonction du contexte communicatif  Style de parole (spontanée, lue), accents, etc. Cette variation se manifeste aux niveaux acoustique, phonétique et prosodique.  Prosodie : durée, pitch, intensité, etc. Mais la modélisation acoustique ne tient pas compte d’informations prosodiques relatives à la syntaxe et au focus de l’énoncé.

4 3 Introduction Lien entre prononciations, prosodie et syntaxe Projet AMADEO par DIGITEO avec le CEA fin 2007-fin2010

5 4 Démarche A partir des erreurs de transcription automatique Questions :  La modélisation est-elle en cause ? Paramètres acoustiques extraits ? Représentation choisie ? Pour éclairer ces questions  Analyse de grands corpus (pour généraliser)

6 5 Prononciations (1) Mots fréquents  Monophones, monosyllabes, homophones...  Détail phonétique, prosodique Exemple des mots homophones /E/ : et (conjonction) vs. est (verbe)

7 6 Prononciations (2) Travail de Master Recherche 2007 Conjonction/Verbe : et/est, Pr é position/Verbe : à/a  Mesures acoustiques Comportement différent des prépositions, conjonctions Importance des durées, des taux de voisement  Classification automatique 60-80% de classification correcte Confirme les mesures acoustiques: prosodie

8 7 Prononciations (3) Mots rares  Mots polysyllabiques (ex. désoxyribonucléique) Question :  Comment estimer des variantes à partir de peu/pas d’observations? Définir des classes d’équivalence  longueur syllabique du mot  structure syllabique (ex. CV, CCV, etc.)  phonotactique  groupes prosodiques  classes syntaxiques

9 8 Merci de votre attention !


Télécharger ppt "Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu."

Présentations similaires


Annonces Google