Codage de la parole à très bas débit avec des unités ALISP

Slides:



Advertisements
Présentations similaires
COMMON TECHNIQUES AND TECHNOLOGIES UNIT 09/ Avancement SYMPATEX T C O M M U N I C A T I O N S HOMSON-CSF Projet RNRT SYMPATEX 3 ème réunion.
Advertisements

JJCAAS 03 - Modèles granulaires pour les signaux sonores 1 Modèles granulaires pour les signaux sonores Lorcan Mc Donagh Directeur de thèse: Frédéric.
Évaluation de la qualité d'une clusterisation
SP1 : Transfert de technologie
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole par indexation indépendant du locuteur Dijana PETROVSKA-DELACRETAZ.
Eureka avril MAJORCALL – « Client Relation Management for Call Centers » Eurekâ Project !2990 Corebridge- -ENST-
SYstème de Messagerie Unifiée PArole et TEXte Revue de Projet RNRT Mardi 10 décembre 2002.
Reconnaissance du locuteur
Identification automatique des langue
Proposition Projet RNRT 2002
Reconnaissance de la parole
THALES COMMUNICATIONS Projet RNRT SYMPATEX 14 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 01 octobre 2002.
NOLISP, Paris, March 23rd 2007 Audio-Visual Speech Processing Gérard Chollet, Hervé Bredin, Thomas Hueber, Rémi Landais, Leila Zouari.
THALES COMMUNICATIONS Projet RNRT SYMPATEX 16 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 10 décembre 2002.
Interactions langagières et parolières dans une société de l’information Gérard CHOLLET ENST/CNRS-LTCI 46 rue Barrault PARIS.
THALES COMMUNICATIONS Projet RNRT SYMPATEX 11 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 13 juin Avril 2002.
Reconnaissance Automatique de la Parole
Reconnaissance Automatique de la Parole
L&H Confidential Sympatex Codeur/Décodeur Harmonique plus bruit September 2000.
Cours parole du 26 Janvier 2005 enseignants: Dr
1 plan Besoins État de lart Assistant électronique unique pour la personne indépendante dans la maison intelligente Reconnaissance par unités segmentales.
Le MAJORDOME de la Maison Intelligente
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Du codage par indexation vers la vérification de locuteur Réunion davancement SYMPATEX ENST: Dijana Petrovska-Delacrétaz, Gérard Chollet 6 Juin 2001, Thales.
Codage de la parole à très bas débit: passage du cas dépendant vers le cas indépendant du locuteur 6-ème réunion d'avancement SYMPATEX : ENST, 19 Septembre.
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données.
Construction du nombre au cycle 2
Université Paris 3 La Dictée vocale SLFD Johanna Deron.
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
La reconnaissance vocale
Directeur de thèse : Régine André-Obrecht
Reconnaissance de la parole
Traitement Automatique de la Langue:
Projet Technique Un PDA multimodal au service des situation de handicap… DESS HANDI Université Paris XIII Introduction & Disclaimer This presentation.
La voix IP : Mr.FERGOUGUI Boudouch Ali kmichou Ansar Atrassi Najoua
MODULE ER13 PROJET INFORMATIQUE DEVELOPPEMENT en EQUIPE
Approche critique des produits IdL Master 1 IdL Année
Marketing Engineering
Décodage des informations
Séminaire de lobjectif « forage et production » Beaune, les 26,27 et 28 Avril 2000 Outils danalyse statistiques « programmation par lexemple » S. Canu,
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Le cahier de charge d'un système de RAP
Reconnaissance Vocale
La méthodologie expérimentale Fondements et bases d’application
‘The Voice Company’ Du texte à la Parole
Cours parole du 12 Novembre 2003 enseignante: Dr
Reconnaissance d’image CABRIERE Pierre – ROBERT Bastien.
Plan cours parole 29 Octobre 2003  1. Applications et démos (appli) voir feuilles distribués + démos  2. Fondements théoriques (theorie)  2.1 voir cours.
Traitement de la parole : Synthèse et reconnaissance
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
Travailler la compréhension orale en classe de FLE.
Présentation Commission de qualification et rôle du pré-noteur
Indexation sonore : recherche des composantes Parole et Musique Julien PINQUIER Institut de Recherche en Informatique de Toulouse – Equipe ART.ps 118,
Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.
Présentation RFIA janvier 2002
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
Fusion de paramètres en classification Parole/Musique Julie Mauclair – Equipe Parole Julien Pinquier – Equipe SAMoVA.
Evaluation automatique du débit de la parole sur des données multilingues spontanées Jean-Luc Rouas, Jérôme Farinas, François Pellegrino.
Fusion de paramètres rythmiques et segmentaux pour l’Identification Automatique des Langues Jean-Luc Rouas1, Jérôme Farinas1, François Pellegrino2 & Régine.
Synthèse d’images et Rendu Réaliste Compression Progressive de Modèles 3D DOMENGET Bruno DUMAS Benjamin EISTI.
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil
Journée Des Doctorants 2004
Q-Checker Launching, November 2012E. Zografos1 Lancement de Q-Checker Eleftherios Zografos EN/MEF Novembre 2012.
Programme pour l’amélioration des connaissances géologiques et Hydrogéologiques de l’Oligocène dans le secteur du champ captant des laNdEs du MEdoc PHONEME.
La perception de la parole
Outils Qualité Master 2 TVRAI ACQ ANNEE 2011/2012
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
MOMAS - DS/SR - GO © GDR MOMAS 16 & 17 janvier Lyon Réunion de lancement du GDR MOMAS La modélisation et la simulation pour les études du stockage.
Transcription de la présentation:

Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales

1.3 Pourquoi développer des codeurs à très bas débit Trouver les limites de la compression de la parole (sans sa compréhension) Applications pratiques : Répondeurs automatiques sans bandes magnétiques Archivage et «boîtes noires » Communication sur des canaux à bas débits Codage redondant en télédiffusion But à atteindre : Débit moyen de 100-500 bps Indépendant du locuteur, de la langue, de l’environnement

2. Principes généraux des codeurs à très bas débit < 400 bps Nommées aussi codeurs segmentaux ou codeurs par indexation Nécessitent l’utilisation de : Méthodes de reconnaissance Quelles unités de reco utiliser ? Méthodes de synthèse Quelles unités de synthèse utiliser ? Données à transmettre : Indices des unités de parole reconnus Informations prosodique Utiliser des unités ALISP

2. 2 Le prix à payer Complexité croissante Retard au décodage Mémoire plus importante Sensibilité aux erreurs de transmission Sensibilité au bruit ?

3. Motivations pour utiliser ALISP Permet un codage à très bas débit Développement de nouveaux outils pour la recherche en phonétique Intègre le paradigme d’analyse par la synthèse Applications en reconnaissance de la parole indépendante de la langue Identification de la langue Amélioration de la qualité de la parole transmise, débruitage

3.2 Cas idéal versus cas actuel ALISP devrait permettre idéalement un codage Indépendant du locuteur Indépendant de la langue Indépendant de l’environnement Réalité : On commence par résoudre le cas dépendant du locuteur Premiers résultats pour le codage indépendant du locuteur

4. Méthodes de synthèse Cas monolocuteur : commencer avec la LPC => résultats mauvais Nouvelle methode de concatention de segments dans des zones de stabilité spectrale, avec synthèse préalable avec Harmonic Noise Model (HNM) Cas indépendant du locuteur : avec la LPC => résultats comparables au cas mono-locuteur pas encore appliquée des méthodes de synthèse HNM

5. Resultats monolocuteur sur « BU corpus »  codage méthode ALISP (HNM)  unités de synthèse correspondantes aux modèles HMM  synthèse HNM  original  choix des unités de synthèse à partir des transcriptions phonétiques  concaténation des formes d’onde

6. Expériences indépendantes du locuteur sur BREF Cas indépendant du locuteur : suffisamment de données parole d’un échantillon représentatif pour les données d’ entraînement et d’un autre ensemble de locuteurs disjoints pour le test (codage) Exemple mono-locuteur , synthèse LPC, sur Bref Exemple indépendant du locuteur, synthèse LPC

6.3 Correspondance Alisp phones, Bref

Conclusions et perspectives améliorer l’intelligibilité et la qualité choix d’unités compatibles pour le codage et la synthèse à partir du texte rendre le codeur indépendant du locuteur et de la langue restituer l’identité du locuteur

Et à plus longs termes... utiliser la technique ALISP de codage avec des références étiquetées phonétiquement pour faciliter la reconnaissance automatique de la parole expérimenter le codage ALISP en vérification du locuteur