Synthèse par di-phones MBROLA Synthèse par di-phones
Sommaire 1- Principes de la synthèse MBROLA 2- Comment utiliser MBROLA 3- Exploitations possibles de MBROLA a- synthèse de qualité à partir d'une phrase réelle b- modifications à partir d'une phrase réelle
Sommaire 1- Principes de la synthèse MBROLA 2- Comment utiliser MBROLA 3- Exploitations possibles de MBROLA a- synthèse de qualité à partir d'une phrase réelle b- modifications à partir d'une phrase réelle
"deux-cents" : _d dø øs sã ã_ Attention! C’est une synthèse qui fonctionne à partir d’une base de données de demi phonèmes dans diverses langues plusieurs locuteurs pré-enregistrés (m+f) pour chaque langue!
Mbrola Ce n’est pas une synthèse par formants, c’est à dire que les seuls paramètres que l’on peut modifier sont : la Fo et la Durée
Mbrola Tout cela est fait grâce à la méthode PSOLA « pitch synchronous overlap analysis » On ne peut pas modifier l’intensité… l’intensité globale en tout cas
Quel est le principe ? Il s’agit d’écrire une phrase en symboles phonétiques (Sampa) et de fournir les informations suivantes pauses durée de chaque phonème mouvements de Fo (jusqu’à une 15aine par phonème)
voyelles consonnes autres
Pour obtenir une nouvelle feuille Ctrl + N Pour ouvrir un fichier Mbrola extension .pho Ctrl + O Pour enregistrer Ctrl + S Quelles sont les fonctions importantes?
Pour écouter la synthèse Ctrl + P Pour arrêter la lecture Ctrl + P
« Phoneme substitution » Changer un phonème dans tout le fichier « No errors » la lecture « plante » quand il y a 1 erreur si cette touche n’est pas enfoncée
Permet de changer de base de données ...si vous les avez téléchargées!! Les symboles phonétiques de votre base de données... se trouvent ici...
Permet d’exporter votre travail en un fichier .wav
Un petit exemple... En téléchargeant une base de données (une langue)… … vous avez quelques exemples tout prêts!
Où se trouvent-ils? Dans le fichier « Mbrola tools » qui s’est installé pendant l’installation si vous avez choisi d’installer Mbrola dans C:\Program Files\ le dossier se trouvera sous C:\Program Files\Mbrola Tools
Commencer une ligne par « ; » permet d’insérer un commentaire
Commencer une ligne par « _ » permet d’insérer un silence ici de 51ms
Le premier élément après chaque symbole indique sa durée
Les deux suivants permettent de régler la Fo… ou bien à diverses reprises pour le même phonème Il est aussi possible de jouer avec la Fo pendant les silences … pour modifier l’attaque du son suivant Les deux suivants permettent de régler la Fo… le 1er : à quel pourcentage du phonème? le 2ème : la valeur de Fo
Il est important de commencer et finir par une pause!
sur les symboles à utiliser! Si vous avez un doute sur les symboles à utiliser!
vous pouvez sauver votre fichier ……. en .pho …... Quand vous avez fini… vous pouvez sauver votre fichier ……. en .pho …... si vous ne l’ouvrez qu’avec Mbrola
… ou alors le sauvegarder en .wav
Les paramètres sont finalement assez longs à implémenter. D’où l’utilité de partir d’une version préparée depuis une phrase réelle…quitte à la modifier ensuite! Une fois de plus, Praat s’avère indispensable
Sommaire 1- Principes de la synthèse MBROLA 2- Comment utiliser MBROLA 3- Exploitations possibles de MBROLA a- synthèse de qualité à partir d'une phrase réelle b- modifications à partir d'une phrase réelle
a- synthèse de qualité à partir d'une phrase réelle
Comment alors ?? 1- Annoter en phonèmes une phrase sur Praat 2- Lancer un script pour obtenir un fichier .pho que l'on pourra lire avec MBROLA. L’étiquetage et donc la segmentation auront ont été réalisées auparavant!
Ici seront stockés temporairement les (noms des) fichiers lus ou crées pendant la session de travail. Temporairement parce qu’ils ne sont pas encore enregistrés (menu Write) On ne voit que les noms des fichiers, il faut cliquer sur un bouton pour les visionner. 1er principe
maintenant qu’un nom de fichier est inscrit dans la liste, il faut le visionner. Dans tous les cas.... ...cliquez sur Edit
Cette fenêtre est très riche en renseignements et possibilités divers notez le curseur qui indique le temps en secondes par rapport au début du fichier Cette fenêtre est très riche en renseignements et possibilités divers et enfin...les 4 boutons archi-classiques de tout logiciel d’analyse de son all : pour voir tout le fichier in : pour zoomer out : pour dé-zoomer sel : pour zoomer sur la sélection L’axe à gauche correspond aux valeurs du spectrogramme (en Hz) Les trois barres ci-dessous sont indispensables 1. elle se découpe en fonction du curseur ou de la sélection 2. elle permet de lire la fenêtre présente 3. pour lire tout le fichier L’axe à droite indique les valeurs de Fo (en Hz)
Les affichages de durée et les possibilités de lectures Ici on a non plus un curseur mais une sélection. Les affichages de durée et les possibilités de lectures se sont adaptés...
Voici comment faire apparaître ou disparaître les « décorations »...
L’analyse des durées... Elle a plus ou moins été abordée… …grâce aux barres en haut et en bas qui découpent le signal
ces 4 fonctions permettent d’obtenir différentes durées notez le raccourci
Les valeurs de Fo Même principe… …méthode avec la souris… …méthode avec « Query » Attention aux résultats aberrants validité des résultats surtout pour les segments non voisés
ces 3 fonctions permettent d’obtenir différentes valeurs notez le raccourci
Les valeurs d’intensité Toujours pareil……. Mesure visuelle ou bien « Query > Get intensity » (F11) Il faut que le contour d’intensité soit visible (« View > Show analyses > Intensity ») pas des mesures physiologiques validité des résultats précautions d’enregistrement
… sur le spectrogramme Toujours pareil ….
1 vérification visuelle s’impose détection de formants... validité des résultats 1 vérification visuelle s’impose
Et une nouvelle fois… En cliquant sur le nom de l’analyse, ici « Formant », on peut obtenir différentes valeurs.
Pour obtenir des valeurs individuelles de formants et leurs largeurs de bandes (raccourcis)
…..Notez que le principe est identique pour toutes les prises de mesures …. En voici un autre… …..les valeurs moyennes
Fo Intensité
Étape 3 L’étiquetage Retournez sur « Praat Objects » Sélectionnez PraatDemo Dans le menu dynamique (à droite): « Label & Segment > To textgrid »
Voici donc ce qui apparaît par défaut Pour + de simplicité, choisissons d’étiqueter sur un seul niveau
...puis cliquez «Edit» Grâce à la touche « Control » sélectionnez en même temps «Sound» et «TextGrid»... ...puis cliquez «Edit»
1 couche intitulée...
….Point important... Il est souvent pratique de s’appuyer sur la Fo, le spectrogramme…pour étiqueter précisément. Comme d’habitude il suffit de cliquer « View > Show analyses » pour (dé) sélectionner ce qu’on veut...
Créer des séparations et écrire Cliquez sur le signal ou le spectrogramme pour faire apparaître une possible séparation. Puis cliquez à l’intérieur du cercle pour créer une séparation. Penser aux touches de raccourcis dans «Point/Boundary »
N’oubliez pas d’enregistrer !! Sélectionnez « textGrid Praatdemo », cliquez sur « Write > Write to textfile »
dans Praat, ouvrez un fichier son et sa grille d'étiquetage Read > Read from file
Control > Open script Puis ouvrez le script "script_mbrola" fourni… Control > Open script
Pour faire "tourner" un script, Run > Run script
Mais … … avant tout …
il faut sélectionner la grille et le son simultanément
Pour lancer le script, Run > Run script
Et une boîte de dialogue apparaît!
vos créations seront enregistrées ici vos créations seront enregistrées
Cliquez sur "OK" ou "Return" pour une copie conforme
Que manque-t-il ? Il faudra pouvoir « créer » les informations prosodiques : analyse syntaxique informations ajoutées au moyen de balises …
il faudrait pouvoir obtenir les phonèmes automatiquement … Le phonétiseur