CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole par indexation indépendant du locuteur Dijana PETROVSKA-DELACRETAZ.

Slides:



Advertisements
Présentations similaires
Distance inter-locuteur
Advertisements

COMMON TECHNIQUES AND TECHNOLOGIES UNIT 09/ Avancement SYMPATEX T C O M M U N I C A T I O N S HOMSON-CSF Projet RNRT SYMPATEX 3 ème réunion.
Le double d’un multiple de opérations en 5 minutes Per1_6
Indexation Parole / Musique / Bruit
« Guerres et Batailles »
Évaluation de la qualité d'une clusterisation
Gérard CHOLLET Fusion Gérard CHOLLET GET-ENST/CNRS-LTCI 46 rue Barrault PARIS cedex 13
SP1 : Transfert de technologie
RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours -
SYstème de Messagerie Unifiée PArole et TEXte Revue de Projet RNRT Mardi 10 décembre 2002.
Reconnaissance du locuteur
Proposition Projet RNRT 2002
Reconnaissance de la parole
THALES COMMUNICATIONS Projet RNRT SYMPATEX 14 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 01 octobre 2002.
NOLISP, Paris, March 23rd 2007 Audio-Visual Speech Processing Gérard Chollet, Hervé Bredin, Thomas Hueber, Rémi Landais, Leila Zouari.
THALES COMMUNICATIONS Projet RNRT SYMPATEX 16 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 10 décembre 2002.
Interactions langagières et parolières dans une société de l’information Gérard CHOLLET ENST/CNRS-LTCI 46 rue Barrault PARIS.
THALES COMMUNICATIONS Projet RNRT SYMPATEX 11 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 13 juin Avril 2002.
Reconnaissance Automatique de la Parole
Reconnaissance Automatique de la Parole
L&H Confidential Sympatex Codeur/Décodeur Harmonique plus bruit September 2000.
1 plan Besoins État de lart Assistant électronique unique pour la personne indépendante dans la maison intelligente Reconnaissance par unités segmentales.
Codage de la parole à très bas débit avec des unités ALISP
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Du codage par indexation vers la vérification de locuteur Réunion davancement SYMPATEX ENST: Dijana Petrovska-Delacrétaz, Gérard Chollet 6 Juin 2001, Thales.
Dijana PETROVSKA-DELACRETAZ travail en commun avec
Codage de la parole à très bas débit: passage du cas dépendant vers le cas indépendant du locuteur 6-ème réunion d'avancement SYMPATEX : ENST, 19 Septembre.
La méthode expérimentale TD 2 - Licence Laure Fernandez
La reconnaissance vocale
Extraction dInformations Spatiales et Linguistiques dans les Documents Laurence Likforman, Pascal Vaillant, G. Chollet ENST/TSI et CNRS-LTCI.
Intervalle unitaire : 4h
Reconnaissance de la parole
Projet Technique Un PDA multimodal au service des situation de handicap… DESS HANDI Université Paris XIII Introduction & Disclaimer This presentation.
d’un article scientifique
PHYSIOLOGIE DE L ’AUDITION
BENABEN, PEREZ Mini projet: Détection d’obstacle.
Plans à groupes indépendants: organisation
Hésitations autonomes en 8 langues :
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Réponse fréquentielle de la FTBO H(p)
Comment analyser un graphique ?
Reconnaissance Vocale
Rides de sable en canal continu
L'audition.
Caractérisation d’une fibre microstructurée
Relations et fonctions
3. Théorie de la production (offre) (suite)
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Exercice 11-1.
En-tête: Ne pas modifier le style !
La fonction inversement proportionnelle
Introduction à l’algèbre
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires - Démonstration : quel imitateur êtes vous ? Plateau Traitement du son.
NG NM NG NM X X X X X X X X X X.
Master 1 – Sciences du Langage –
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
Optimisation de requêtes
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
Ségrégation de voix concurrentes par des sujets normo et malentendants
Indexation sonore : recherche des composantes Parole et Musique Julien PINQUIER Institut de Recherche en Informatique de Toulouse – Equipe ART.ps 118,
Les technologies xDSL: Enjeux, techniques et protocoles
Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.
Dominique LAURENT Patrick SEGUELA
Présentation RFIA janvier 2002
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Transcription de la présentation:

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole par indexation indépendant du locuteur Dijana PETROVSKA-DELACRETAZ Gérard CHOLLET (petrovsk, ENST/CNRS-LTCI 46 rue Barrault PARIS cedex 13 (petrovsk,

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Plan Situer le problème de la dépendance au locuteur Passage dépendant => indépendant du locuteur Choix et caractéristiques de la base de données utilisée Protocole expérimental Rappel des étapes principales du codage Premiers résultats du codage par indexation ALISP indépendant du locuteur Conclusions et perspectives

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Situer le problème A létat actuel le codage avec des unités ALISP nest fonctionnel que pour un locuteur prédéfini Situation peu réaliste Cas idéal : codage de nimporte quel locuteur, parlant nimporte quelle langue Cas intermédiaire : codage des locuteurs masculins, parlant français de la base de donnés BREF

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Comment réaliser le passage dépendant => indépendant au locuteur Cas locuteur unique L : données parole ( env. 1 heure entraînement et 10 min test) Cas indépendant du locuteur : suffisamment (?) de données parole dun échantillon représentatif pour les données d entraînement et dun autre ensemble de locuteurs disjoints pour le test

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Base de données BREF et ses caractéristiques Caractéristiques principales : * corpus français * composé de textes lus, extraits du journal « Le Monde » * 120 locuteurs, avec en moyenne min de parole par loc. * Séparés en 80 locuteurs pour lentraînement, 40 de développement et 20 de test, avec des textes différents * Enregistrement qualité studio, échantillonné à 16kHz

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Protocole expérimental Cas indépendant du locuteur : - 33 locuteurs masculins pour lentraînement (env. 30 heures de parole) et - 3 locuteurs pour le test Comparaison avec cas dépendant du locuteur : - les données des 3 locuteurs de test sont subdivisées en env min pour lentraînement dépendant du loc. Et env. 10 min pour les tests communs

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Rappel des étapes principales de codage Phase dentraînement : * Acquisition automatique des unités ALISP * Entraînement dun reconnaisseur HMM pour ces unités * Sélection des représentants des HMMs pour la synthèse Phase de codage - décodage : * Reconnaissance des unités ALISP * Sélection du meilleur représentant par unité * Transmission des indices * Synthèse

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Résultats pour le codage indépendant du locuteur Caractéristique des unités ALISP, longueur moyenne de 66 ms Longueur moyenne des phones est de ms == unités ALISP plus courtes que les phones Débit moyen denviron 140 bps Spectrogrammes * original * synthèse LPC * cas dépendant du locuteur (synthèse LPC) * cas indépendant du locuteur (synthèse LPC) Fichiers sonores

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Influence de la synthèse LPC Original Synthèse LPC

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage dépendant et indépendant du locuteur (synthèse LPC ) dépendant du locuteur Indépendant du locuteur

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Perspectives Relation entre la taille du dictionnaire et la qualité de parole le codeur reconnaît til le timbre de la voix ? Peut ton lutiliser pour vérifier lidentité du locuteur ? Diminution de la taille mémoire et du débit par des techniques de transformation vers des locuteurs canoniques