‘The Voice Company’ Du texte à la Parole 1
La synthèse de la parole permet de convertir un texte écrit en parole. Du texte à la parole La synthèse de la parole permet de convertir un texte écrit en parole. Comment cela se passe-t-il ?
Synthèse de la parole à partir du texte = Traitement de la langue + Traitement du signal
Acapela Core Text To Speech Engine 4
Traitement de la langue
Traitement de la langue Nous sommes le 17/03/2010. Preprocessing Nous sommes le dix-sept mars deux mille dix.
Traitement de la langue Nous sommes le dix-sept mars deux mille dix. Analyse Morpho-Syntaxique Nous PRONOM sommes AUXILIAIRE le DETERMINANT “Les poules du couvent couvent.”
Traitement de la langue Nous PRONOM sommes AUXILIAIRE le DETERMINANT Découpage Rythmique/Prosodique (Nous sommes le 7 mars) (2010).
Traitement de la langue (Nous sommes le 7 mars) (2010). Transcription Phonétique (Mot/Phrase) Exemples de particularités du Français Liaison: les enfants Gestion des e muets Dénasalisation: un bon ami / n u s O m l @ s E t m a R s d 2 m i l d i s /
Traitement de la langue / n u s O m l @ s E t m a R s d 2 m i l d i s / Décomposition en Syllabes / n u - s O m - l @ - s E t - m a R s - d 2 - m i l - d i s /
Traitement de la langue / n u - s O m - l @ - s E t - m a R s - d 2 - m i l - d i s / Marquage Prosodique Marquer les syllabes qui sont mises en relief / n u <l> - s O m <l> - l @ <l> - s E t <l> - m a R s <HH> - d 2<l> - m i l<l> - d i s<L-L-> /
Qu’est ce que la prosodie Définition: -poésie: ensemble des règles de versification relatives aux voyelles -phonétique: étude de certains caractères phonétiques tels que l'intonation, l'accentuation, la durée -musique: règles organisant les rapports entre le texte et la musique Synthèse Synthèse sans Prosodie avec Prosodie
Synthèse du signal Synthèse du signal
Diphone ? Phoneme vs. Diphone
Synthèse vocale – un peu d’histoire Synthèse par formant: Fin des années 70 Modélisations des formants et de leur évolutions Synthèse par diphones Fin des années 80 Concaténation de sons ‘uniques’ + adaptation par traitement du signal MBROLA Synthèse par sélection d’unités Fin des années 90 Concaténation de sons en contexte (+ traitement du signal) Synthèse par modélisation HMM 2004 Modélisation paramétrique par entrainement sur base de données
Synthèse par sélection d’unités Principe: Dans une grande base de données, choisir les meilleurs sons afin de les modifier le moins possible Comment choisir les sons ? coût cible (contexte phonétique, contexte prosodique, …) + coût de concaténation (spectre, F0, … les sons qui se ‘collent’ bien ensemble)
Synthèse par sélection d’unités TEXTE Cible 1 Cible 2 … Cible N Ct Ct Ct Ct Cc Cc Cc Candidat 1 Candidat 2 . Candidat X Candidat 1 Candidat 2 . Candidat X Candidat 1 Candidat 2 . Candidat X Candidat 1 Candidat 2 . Candidat X
Synthèse par sélection d’unités Importance de la base de données enregistrée Bonne couverture des sons dans différents contextes Qualité de l’enregistrement ~= qualité du système Facilité/rapidité d’enregistrement (phrases simples,…) Professionnalisme/Coaching Enregistrement - Synthèse
Synthèse vocale - Applications Accessibilité: accès à l’information écrite, lecteur d’écran, outil d’aide à la parole Mobilité: GPS, Téléphone portable, dictionnaires parlant … Télécommunication: services d’information/commerciaux téléphoniques, SMS to Voice, … Multimedia: e-learning , marketing (ecard), translation (www.reverso.net)
Synthèse vocale - Quelques exemples
Synthèse le parole – Recherche Personalisation Expressivité
Merci pour votre attention 22