Sylvain Daudé DEA ATIAM Modèle statistique de la voix à structure optimisée pour la caractérisation des phénomènes dynamiques Sylvain Daudé DEA ATIAM Stage réalisé au LIA sous la direction de MM. Bonastre et Linarès
Contexte Traitement automatique de la parole Modélisation statistique de la parole MMG en R.A.L. MMC en R.A.P Dynamique de la parole durée, séquentialité, synchronie variations spectrales importance dans le signal de parole
Objectif : prendre en compte les infos dynamiques dans le modèle Problématique Apprentissage du modèle MMG : peu d'information dynamique MMC : de l'information dynamique dans les transitions, mais… peu prise en compte lors de l'apprentissage modèles de durée infructueux Objectif : prendre en compte les infos dynamiques dans le modèle
Méthode : des données au modèle Caractères statistiques + infos dynamiques Analyse Données + d’infos Interprétation ? Modèle Correspondance
Construction du modèle ... Diminution du nombre d’états MMG MMC
Info dynamique dans les MMC ? transitions : séquentialité, durée regroupement d’états : synchronie : « vraie » distribution d’un caractère acoustique Vrais. t Etat 1 Etat 2 Etat 1+2 « vraie » distribution
Stratégies de regroupement Similarité des entrées-sorties : séquentialité, synchronie des chemins parallèles Eloignement des entrées-sorties : bifurcations, asynchronie des chemins parallèles Information mutuelle : synchronie Transitions mutuelles : linéaire, séquentialité
Les résultats 128 127 117 107 97 87 77 67 57 47 37 27 17 7 1 Nombre d'états du modèle -0,5 -0,4 -0,3 -0,2 -0,1 0,1 0,2 0,3 0,4 Ecart p/r au hasard (logV) Transitions mutuelles Information mutuelle Eloignement de profils Proximité de profils
Conclusion Meilleurs modèles : Gain en complexité séquentialité ou synchronie portées par le modèle réestimation des transitions Gain en complexité Meilleure modélisation de l’information dynamique
Perspectives Améliorations Estimation de la qualité Concilier synchronie et séquentialité Modèles de durée Estimation de la qualité Application musicale
Des questions ? (1) å × = log p I Information mutuelle : D E A Trame 1 Trame 2 Trames 3, 4, 5 Vraisemblance du MMC Meilleur chemin Vraisemblances trame / état Trame 9 Trame 8 Trames 6, 7 å × = ) , ( log b a j i ij p I Information mutuelle :
Des questions ? (2) Vrais. t Etat 1 Etat 2 Etat 1+2 « vraie » distribution