L’analyse morpho-syntaxique dans un synthétiseur de parole. Sophie Roekhaut – TTS Group – Multitel ASBL Séminaire du CENTAL : 22 octobre 2007
PLAN PLAN Architecture du synthétiseur de parole eLite Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
PLAN PLAN Architecture du synthétiseur de parole eLite Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
1) Architecture du synthétiseur de parole eLite PLAN 1) Architecture du synthétiseur de parole eLite Qu’est-ce que la synthèse de la parole? TTS Text Types d’application : GPS, applications pour aveugles, répondeur téléphonique, lecture de SMS,… Multitel TTS Team 08/11/2018
1) Architecture du synthétiseur de parole eLite PLAN 1) Architecture du synthétiseur de parole eLite NLP synthesis preprocessing morpho-syntactic analysis Ling. Info Phonemes Prosody Text phonetization prosody generation Multitel TTS Team 08/11/2018
1) Architecture du synthétiseur de parole eLite PLAN 1) Architecture du synthétiseur de parole eLite NLP NUU+DSP LiONS preprocessing morpho-syntactic analysis Ling. Info Phonemes Prosody Text DSP MBROLA phonetization prosody generation Multitel TTS Team 08/11/2018
1) Architecture du synthétiseur de parole eLite PLAN 1) Architecture du synthétiseur de parole eLite La synthèse NUU (Non Uniform Unit) BUT : rendre le signal de parole plus naturel L’unité de base : le diphone « unité acoustique qui démarre au milieu d’un phonème et se termine au milieu du phonème suivant ». Non-uniforme signifie : Durée variable (un ou plusieurs diphones, une syllabe, un mot, un groupe de mots). Possibilité d’avoir plusieurs exemplaires pour chaque unité. Multitel TTS Team 08/11/2018
1) Architecture du synthétiseur de parole eLite PLAN 1) Architecture du synthétiseur de parole eLite Le NLP : définition Désambiguïsation du texte Le pré-traitement L’analyse morpho-syntaxique Génération des phonèmes à partir des graphèmes Le phonétiseur Le post-phonétiseur Génération d’informations prosodiques Le prosodieur Multitel TTS Team 08/11/2018
1) Architecture du synthétiseur de parole eLite PLAN 1) Architecture du synthétiseur de parole eLite Le NLP : exemples de performances Lecture d’URL, de dates, de nombres,… - http://www.multitel.be/tts - 30/06/1945 - 453.556,62825e-02 Gestion des liaisons - Les oiseaux - Six amis, six personnes, six - Quelque ami, quelques incroyables personnes Multitel TTS Team 08/11/2018
PLAN PLAN Architecture du synthétiseur de parole eLite Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
2) Le module d’analyse morpho-syntaxique PLAN 2) Le module d’analyse morpho-syntaxique Objectif : Désambiguïser le texte en attribuant à chaque mot/groupe de mot sa catégorie grammaticale. Exemples d’ambiguïtés : Les poules du couvent couvent. LES ELEVES SONT BIEN ELEVES. Un bon argument. J’ai un bon à faire valoir. Deux niveaux d’analyse : - Le mot (Word) → phonétisation - L’unité grammaticale (Grammar Unit) → analyse syntaxique Ex : pomme de terre : Word - pomme [NOUN] de [PREP] terre [NOUN] Grammar Unit - pomme de terre [NOUN] Multitel TTS Team 08/11/2018
2) Le module d’analyse morpho-syntaxique PLAN 2) Le module d’analyse morpho-syntaxique 2.1) L’analyse morphologique Multitel TTS Team 08/11/2018
2) Le module d’analyse morpho-syntaxique PLAN 2) Le module d’analyse morpho-syntaxique 2.2) L’analyse syntaxique Objectif : Pour une suite de mots donnée, retrouver la meilleure suite de catégories TMAX = arg max P(T|W) T = arg max P(W|T) P(T) T P(W) → Règle de Bayes P(W) → constante P(T) → N-grammes de catégories P(W|T) → Classes d’ambiguïtés lexicales Multitel TTS Team 08/11/2018
2) Le module d’analyse morpho-syntaxique PLAN 2) Le module d’analyse morpho-syntaxique 2.2) L’analyse syntaxique Modèle n-gramme de catégories P(T) estimé sur corpus - Modèle trigramme lissé par interpolation linéaire : Ex : DET ADJ NOUN P(NOUN|<DET,ADJ>) . P(NOUN|ADJ) . P(NOUN) Définition de classes d’ambiguïtés lexicales P(W|T) Ex : couvent, président {NOUN,VERB} ferme {NOUN,ADJ,VERB} Multitel TTS Team 08/11/2018
2) Le module d’analyse morpho-syntaxique PLAN 2) Le module d’analyse morpho-syntaxique 2.2) L’analyse syntaxique Multitel TTS Team 08/11/2018
PLAN PLAN Architecture du synthétiseur de parole eLite Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
3) La représentation des données (les FSMs) 3.1) Définition Les machines à états finis permettent de décrire des langages du plus linguistique au plus mathématique. Quatre catégories : Les automates (FSA) : vérification de l’appartenance d’un mot au langage : reconnaisseur ou accepteur. Les transducteurs (FST) : validation d’un mot reçu en entrée et traduction en un mot de sortie. Le FST travaille sur deux alphabets. Les machines pondérées (WFSA, WFST) : ajout de poids sur les transitions pour permettre les opérations du type recherche du meilleur chemin. Multitel TTS Team 08/11/2018
3) La représentation des données (les FSMs) 3.2) Avantages Opérations (union, intersection, différence, composition) permettant la modélisation de machines complexes à partir de machines plus simples. Description de langages à partir d’expressions régulières : représentation aisée et condensée du langage. Condensation de l’information grâce aux opérations de minimisation, de déterminisation, de compaction. Multitel TTS Team 08/11/2018
3) La représentation des données (les FSMs) PLAN 3) La représentation des données (les FSMs) 3.3) Quelques exemples de FSMs Représentation du mot ELEVES (FSA) WORDFSA Multitel TTS Team 08/11/2018
3) La représentation des données (les FSMs) PLAN 3) La représentation des données (les FSMs) 3.3) Quelques exemples de FSMs Filtre de réaccentuation (WFST) FILTERWFST Multitel TTS Team 08/11/2018
3) La représentation des données (les FSMs) PLAN 3) La représentation des données (les FSMs) 3.3) Quelques exemples de FSMs Composition du mot (FSA) avec le filtre (WFST) WORDFSA o FILTERWFST Multitel TTS Team 08/11/2018
3) La représentation des données (les FSMs) PLAN 3) La représentation des données (les FSMs) 3.3) Quelques exemples de FSMs Composition du résultat (WFST) avec la machine de recherche de catégories grammaticales (FST) RESWFST o NATUREWFST Multitel TTS Team 08/11/2018
3) La représentation des données (les FSMs) PLAN 3) La représentation des données (les FSMs) 3.4) Le compilateur d’expressions régulières : exemples de règles (filtre de réaccentuation) [INFO] ALPHAIN = ASCII WEIGHT = DEFINE [CLASSIN] E_acc [éèêëe] E [eE] [RULE] E → <E_acc> / 1 e → <E_acc> / 2 <E_acc> → [<E_acc> e] / 2 Multitel TTS Team 08/11/2018
PLAN PLAN Architecture du synthétiseur de parole eLite Le module d’analyse morpho-syntaxique 3) La représentation des données : les machines à états finis (FSMs) 4) Conclusion et perspectives Multitel TTS Team 08/11/2018
CONCLUSION ET PERSPECTIVES PLAN CONCLUSION ET PERSPECTIVES Amélioration de la qualité des bases de données Génération du système pour d’autres langues Ajout de correction orthographique (thèse en cours). Multitel TTS Team 08/11/2018
PLAN MERCI. DES QUESTIONS? Multitel TTS Team 08/11/2018