Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parMartine Bénard Modifié depuis plus de 6 années
1
L’analyse morpho-syntaxique dans un synthétiseur de parole.
Sophie Roekhaut – TTS Group – Multitel ASBL Séminaire du CENTAL : 22 octobre 2007
2
PLAN PLAN Architecture du synthétiseur de parole eLite
Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
3
PLAN PLAN Architecture du synthétiseur de parole eLite
Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
4
1) Architecture du synthétiseur de parole eLite
PLAN 1) Architecture du synthétiseur de parole eLite Qu’est-ce que la synthèse de la parole? TTS Text Types d’application : GPS, applications pour aveugles, répondeur téléphonique, lecture de SMS,… Multitel TTS Team 08/11/2018
5
1) Architecture du synthétiseur de parole eLite
PLAN 1) Architecture du synthétiseur de parole eLite NLP synthesis preprocessing morpho-syntactic analysis Ling. Info Phonemes Prosody Text phonetization prosody generation Multitel TTS Team 08/11/2018
6
1) Architecture du synthétiseur de parole eLite
PLAN 1) Architecture du synthétiseur de parole eLite NLP NUU+DSP LiONS preprocessing morpho-syntactic analysis Ling. Info Phonemes Prosody Text DSP MBROLA phonetization prosody generation Multitel TTS Team 08/11/2018
7
1) Architecture du synthétiseur de parole eLite
PLAN 1) Architecture du synthétiseur de parole eLite La synthèse NUU (Non Uniform Unit) BUT : rendre le signal de parole plus naturel L’unité de base : le diphone « unité acoustique qui démarre au milieu d’un phonème et se termine au milieu du phonème suivant ». Non-uniforme signifie : Durée variable (un ou plusieurs diphones, une syllabe, un mot, un groupe de mots). Possibilité d’avoir plusieurs exemplaires pour chaque unité. Multitel TTS Team 08/11/2018
8
1) Architecture du synthétiseur de parole eLite
PLAN 1) Architecture du synthétiseur de parole eLite Le NLP : définition Désambiguïsation du texte Le pré-traitement L’analyse morpho-syntaxique Génération des phonèmes à partir des graphèmes Le phonétiseur Le post-phonétiseur Génération d’informations prosodiques Le prosodieur Multitel TTS Team 08/11/2018
9
1) Architecture du synthétiseur de parole eLite
PLAN 1) Architecture du synthétiseur de parole eLite Le NLP : exemples de performances Lecture d’URL, de dates, de nombres,… - - 30/06/1945 ,62825e-02 Gestion des liaisons - Les oiseaux - Six amis, six personnes, six - Quelque ami, quelques incroyables personnes Multitel TTS Team 08/11/2018
10
PLAN PLAN Architecture du synthétiseur de parole eLite
Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
11
2) Le module d’analyse morpho-syntaxique
PLAN 2) Le module d’analyse morpho-syntaxique Objectif : Désambiguïser le texte en attribuant à chaque mot/groupe de mot sa catégorie grammaticale. Exemples d’ambiguïtés : Les poules du couvent couvent. LES ELEVES SONT BIEN ELEVES. Un bon argument. J’ai un bon à faire valoir. Deux niveaux d’analyse : - Le mot (Word) → phonétisation - L’unité grammaticale (Grammar Unit) → analyse syntaxique Ex : pomme de terre : Word - pomme [NOUN] de [PREP] terre [NOUN] Grammar Unit - pomme de terre [NOUN] Multitel TTS Team 08/11/2018
12
2) Le module d’analyse morpho-syntaxique
PLAN 2) Le module d’analyse morpho-syntaxique 2.1) L’analyse morphologique Multitel TTS Team 08/11/2018
13
2) Le module d’analyse morpho-syntaxique
PLAN 2) Le module d’analyse morpho-syntaxique 2.2) L’analyse syntaxique Objectif : Pour une suite de mots donnée, retrouver la meilleure suite de catégories TMAX = arg max P(T|W) T = arg max P(W|T) P(T) T P(W) → Règle de Bayes P(W) → constante P(T) → N-grammes de catégories P(W|T) → Classes d’ambiguïtés lexicales Multitel TTS Team 08/11/2018
14
2) Le module d’analyse morpho-syntaxique
PLAN 2) Le module d’analyse morpho-syntaxique 2.2) L’analyse syntaxique Modèle n-gramme de catégories P(T) estimé sur corpus - Modèle trigramme lissé par interpolation linéaire : Ex : DET ADJ NOUN P(NOUN|<DET,ADJ>) . P(NOUN|ADJ) . P(NOUN) Définition de classes d’ambiguïtés lexicales P(W|T) Ex : couvent, président {NOUN,VERB} ferme {NOUN,ADJ,VERB} Multitel TTS Team 08/11/2018
15
2) Le module d’analyse morpho-syntaxique
PLAN 2) Le module d’analyse morpho-syntaxique 2.2) L’analyse syntaxique Multitel TTS Team 08/11/2018
16
PLAN PLAN Architecture du synthétiseur de parole eLite
Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
17
3) La représentation des données (les FSMs)
3.1) Définition Les machines à états finis permettent de décrire des langages du plus linguistique au plus mathématique. Quatre catégories : Les automates (FSA) : vérification de l’appartenance d’un mot au langage : reconnaisseur ou accepteur. Les transducteurs (FST) : validation d’un mot reçu en entrée et traduction en un mot de sortie. Le FST travaille sur deux alphabets. Les machines pondérées (WFSA, WFST) : ajout de poids sur les transitions pour permettre les opérations du type recherche du meilleur chemin. Multitel TTS Team 08/11/2018
18
3) La représentation des données (les FSMs)
3.2) Avantages Opérations (union, intersection, différence, composition) permettant la modélisation de machines complexes à partir de machines plus simples. Description de langages à partir d’expressions régulières : représentation aisée et condensée du langage. Condensation de l’information grâce aux opérations de minimisation, de déterminisation, de compaction. Multitel TTS Team 08/11/2018
19
3) La représentation des données (les FSMs)
PLAN 3) La représentation des données (les FSMs) 3.3) Quelques exemples de FSMs Représentation du mot ELEVES (FSA) WORDFSA Multitel TTS Team 08/11/2018
20
3) La représentation des données (les FSMs)
PLAN 3) La représentation des données (les FSMs) 3.3) Quelques exemples de FSMs Filtre de réaccentuation (WFST) FILTERWFST Multitel TTS Team 08/11/2018
21
3) La représentation des données (les FSMs)
PLAN 3) La représentation des données (les FSMs) 3.3) Quelques exemples de FSMs Composition du mot (FSA) avec le filtre (WFST) WORDFSA o FILTERWFST Multitel TTS Team 08/11/2018
22
3) La représentation des données (les FSMs)
PLAN 3) La représentation des données (les FSMs) 3.3) Quelques exemples de FSMs Composition du résultat (WFST) avec la machine de recherche de catégories grammaticales (FST) RESWFST o NATUREWFST Multitel TTS Team 08/11/2018
23
3) La représentation des données (les FSMs)
PLAN 3) La représentation des données (les FSMs) 3.4) Le compilateur d’expressions régulières : exemples de règles (filtre de réaccentuation) [INFO] ALPHAIN = ASCII WEIGHT = DEFINE [CLASSIN] E_acc [éèêëe] E [eE] [RULE] E → <E_acc> / 1 e → <E_acc> / 2 <E_acc> → [<E_acc> e] / 2 Multitel TTS Team 08/11/2018
24
PLAN PLAN Architecture du synthétiseur de parole eLite
Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
25
CONCLUSION ET PERSPECTIVES
PLAN CONCLUSION ET PERSPECTIVES Amélioration de la qualité des bases de données Génération du système pour d’autres langues Ajout de correction orthographique (thèse en cours). Multitel TTS Team 08/11/2018
26
PLAN MERCI. DES QUESTIONS? Multitel TTS Team 08/11/2018
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.