CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole par indexation indépendant du locuteur Dijana PETROVSKA-DELACRETAZ Gérard CHOLLET (petrovsk, ENST/CNRS-LTCI 46 rue Barrault PARIS cedex 13 (petrovsk,
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Plan Situer le problème de la dépendance au locuteur Passage dépendant => indépendant du locuteur Choix et caractéristiques de la base de données utilisée Protocole expérimental Rappel des étapes principales du codage Premiers résultats du codage par indexation ALISP indépendant du locuteur Conclusions et perspectives
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Situer le problème A létat actuel le codage avec des unités ALISP nest fonctionnel que pour un locuteur prédéfini Situation peu réaliste Cas idéal : codage de nimporte quel locuteur, parlant nimporte quelle langue Cas intermédiaire : codage des locuteurs masculins, parlant français de la base de donnés BREF
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Comment réaliser le passage dépendant => indépendant au locuteur Cas locuteur unique L : données parole ( env. 1 heure entraînement et 10 min test) Cas indépendant du locuteur : suffisamment (?) de données parole dun échantillon représentatif pour les données d entraînement et dun autre ensemble de locuteurs disjoints pour le test
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Base de données BREF et ses caractéristiques Caractéristiques principales : * corpus français * composé de textes lus, extraits du journal « Le Monde » * 120 locuteurs, avec en moyenne min de parole par loc. * Séparés en 80 locuteurs pour lentraînement, 40 de développement et 20 de test, avec des textes différents * Enregistrement qualité studio, échantillonné à 16kHz
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Protocole expérimental Cas indépendant du locuteur : - 33 locuteurs masculins pour lentraînement (env. 30 heures de parole) et - 3 locuteurs pour le test Comparaison avec cas dépendant du locuteur : - les données des 3 locuteurs de test sont subdivisées en env min pour lentraînement dépendant du loc. Et env. 10 min pour les tests communs
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Rappel des étapes principales de codage Phase dentraînement : * Acquisition automatique des unités ALISP * Entraînement dun reconnaisseur HMM pour ces unités * Sélection des représentants des HMMs pour la synthèse Phase de codage - décodage : * Reconnaissance des unités ALISP * Sélection du meilleur représentant par unité * Transmission des indices * Synthèse
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Résultats pour le codage indépendant du locuteur Caractéristique des unités ALISP, longueur moyenne de 66 ms Longueur moyenne des phones est de ms == unités ALISP plus courtes que les phones Débit moyen denviron 140 bps Spectrogrammes * original * synthèse LPC * cas dépendant du locuteur (synthèse LPC) * cas indépendant du locuteur (synthèse LPC) Fichiers sonores
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Influence de la synthèse LPC Original Synthèse LPC
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage dépendant et indépendant du locuteur (synthèse LPC ) dépendant du locuteur Indépendant du locuteur
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Perspectives Relation entre la taille du dictionnaire et la qualité de parole le codeur reconnaît til le timbre de la voix ? Peut ton lutiliser pour vérifier lidentité du locuteur ? Diminution de la taille mémoire et du débit par des techniques de transformation vers des locuteurs canoniques