CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,

Slides:



Advertisements
Présentations similaires
COMMON TECHNIQUES AND TECHNOLOGIES UNIT 09/ Avancement SYMPATEX T C O M M U N I C A T I O N S HOMSON-CSF Projet RNRT SYMPATEX 3 ème réunion.
Advertisements

Indexation Parole / Musique / Bruit
Numérisation du signal principes
Le Signal Vocal Notions sur l’audition Allure temporelle
Le Signal Vocal 1. Production du signal ; Modèles de production
JJCAAS 03 - Modèles granulaires pour les signaux sonores 1 Modèles granulaires pour les signaux sonores Lorcan Mc Donagh Directeur de thèse: Frédéric.
Évaluation de la qualité d'une clusterisation
SP1 : Transfert de technologie
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole par indexation indépendant du locuteur Dijana PETROVSKA-DELACRETAZ.
RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours -
SYstème de Messagerie Unifiée PArole et TEXte Revue de Projet RNRT Mardi 10 décembre 2002.
Some activities on Non-linear Speech Processing at ENST/CNRS-LTCI
Reconnaissance du locuteur
Le traitement automatique de la parole Comment reproduire les processus physiologiques et cognitifs humains? Ivan Magrin-Chagnolleau, CNRS Laboratoire.
Reconnaissance de la parole
THALES COMMUNICATIONS Projet RNRT SYMPATEX 14 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 01 octobre 2002.
NOLISP, Paris, March 23rd 2007 Audio-Visual Speech Processing Gérard Chollet, Hervé Bredin, Thomas Hueber, Rémi Landais, Leila Zouari.
THALES COMMUNICATIONS Projet RNRT SYMPATEX 16 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 10 décembre 2002.
Cours parole du 2 Mars 2005 enseignants: Dr
Interactions langagières et parolières dans une société de l’information Gérard CHOLLET ENST/CNRS-LTCI 46 rue Barrault PARIS.
Analyse de la parole Ivan Magrin-Chagnolleau, CNRS
THALES COMMUNICATIONS Projet RNRT SYMPATEX 11 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 13 juin Avril 2002.
Reconnaissance Automatique de la Parole
Reconnaissance Automatique de la Parole
L&H Confidential Sympatex Codeur/Décodeur Harmonique plus bruit September 2000.
Algorithme de Viterbi pour la reconnaissance de la parole
Simulations du VMike et évaluations comparatives.
Cours parole du 26 Janvier 2005 enseignants: Dr
Codage de la parole à très bas débit avec des unités ALISP
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Du codage par indexation vers la vérification de locuteur Réunion davancement SYMPATEX ENST: Dijana Petrovska-Delacrétaz, Gérard Chollet 6 Juin 2001, Thales.
Reconnaissance Automatique de la Parole
Cours parole du 2 Mars 2005 enseignants: Dr
Codage de la parole à très bas débit: passage du cas dépendant vers le cas indépendant du locuteur 6-ème réunion d'avancement SYMPATEX : ENST, 19 Septembre.
Modulation numérique.
Colloque GRETSI, Paris, 8-11 septembre 2003 Sur la Décomposition Modale Empirique P. Flandrin (Cnrs - Éns Lyon) et P. Gonçalvès (Inrialpes)
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
La reconnaissance vocale
SON COMPLEXE - SPECTRE Le son pur est un modèle mathématique (sinusoïde…) Un son complexe peut être décomposé en une sommes de sinusoïdes (Théorème de.
Directeur de thèse : Régine André-Obrecht
Reconnaissance de la parole
Décodage des informations
Indices prosodiques caractérisant un style d'élocution et ses variantes individuelles MIDL nov 2004 Paris Jean-Sylvain Liénard Martine Adda-Decker.
Le cahier de charge d'un système de RAP
‘The Voice Company’ Du texte à la Parole
Cours parole du 12 Novembre 2003 enseignante: Dr
La régression multiple
Caractérisation inverse de sources pour l'interaction du champ électromagnétique avec l'environnement Azeddine GATI Y. ADANE, M.F. Wong, J. Wiart, V. Fouad.
Numérisation et codage de l’information Codage de la parole
Avignon, 14 novembre 2006http://biobimo.eurecom.fr Sous-Projet 4 : Segmentation et Authentification conjointes de la voix et du visage Etat de l’art -
Traitement de la parole : Synthèse et reconnaissance
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
Stratégie de Codage Implant.
Régulation de débit pour MPEG-4 SVC
Physique des Télétransmissions
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
Reconnaissance automatique de la parole
Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.
Juillet 2001  Les organes Cavité nasale Cavité buccale Langue Épiglotte et cordes vocales Trachée Voile du palais.
Présentation RFIA janvier 2002
SURSAUTS RADIO ET INTERACTION IO-JUPITER
Fusion de paramètres en classification Parole/Musique Julie Mauclair – Equipe Parole Julien Pinquier – Equipe SAMoVA.
La prosodie pour l’Identification Automatique des Langues
Modélisation d'un modulateur et démodulateur OFDM
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Synthèse de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage
Fusion de paramètres rythmiques et segmentaux pour l’Identification Automatique des Langues Jean-Luc Rouas1, Jérôme Farinas1, François Pellegrino2 & Régine.
Cours 8 La transmission.
Journée Des Doctorants 2004
Les techniques de transmission
Introduction au traitement numérique du signal
Transcription de la présentation:

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON, Dijana PETROVSKA ENST/CNRS-LTCI 46 rue Barrault PARIS cedex 13

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Plan Quel codeur pour quel débit ? Le compromis espace mémoire / débit Vocodeur phonétique Quantification matricielle, indexation Analyse/Synthèse et modifications prosodiques Perspectives

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Classification des codeurs

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Conserver la qualité en diminuant le débit: Comment est-ce possible ? Exploiter les limites de l’audition, utilisation du modèle source-filtre de production de la parole, quantification vectorielle du signal source, exploiter les contraintes dynamiques des articulateurs, quantification matricielle des séquences de spectres, modèle de langage,...

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Conserver la qualité en diminuant le débit: Le prix à payer Complexité du codeur, retard au décodage, mémoire importante, sensibilité aux erreurs de transmission, sensibilité aux bruits.

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Modèle source-filtre et allocation des bits. SourceFiltre CELP6500 bps1500 bps LPC bps1800 bps ALISP250 bps150 bps

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Améliorations des codeurs ALISP (.4 kb/s)

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Principes de codage à bas et très bas débits Analyse Source + Filtre (LPC, CELP) Reconnaissance de la parole et du locuteur Codage / Décodage Texte et Locuteur ( bit/sec) Synthèse à partir des paramètres Source + Filtre Synthèse à partir du Texte Segmentation et Reconnaissance acoustique Codage / Décodage d’unités segmentales + caract. du locuteur ( bit/sec) Unités de Synthèse Parole à coder (telephone: 64kbit/sec) (PC/MM: 176kbit/sec) Source + Filtre Codage / Décodage (800-16kbit/sec) Parole restituée des paramètres

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage segmental Approche segmentale nécessaire. Pour des débits inférieurs à 500 bps, Il faut prendre en compte les dépendances inter-trames. Ensemble d’unités acoustiques obtenues automatiquement Représentant de manière précise et concise les sons d’une langue. Sans recourir à une base de donnée étiquetée phonétiquement. Unités ALISP Automatic Language Independant Speech Processing.

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codeur segmental Dictionnaire d’unités de synthèse Dictionnaire d’unités de codage Analyse spectrale Analyse prosodique Reconnaissance unité acoustique Indice unité acoustique Paramètres prosodiques Parole originale Synthèse par concaténation HNM, PSOLA parole synthétique CODEURDECODEUR

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX La décomposition temporelle

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Segmentation induite par la décomposition temporelle Segmentation sur des zones spectralement stables

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Topologie des modèles HMM a 22 a 33 a 44 a 12 a 23 a 34 a 25 3 états émetteurs Modèle de langage : unigrammes, facteur de langage . Observation T trames : 3 flux de paramètres indépendants et de mêmes poids : LPCC;  LPCC;  log(E). Pour chaque flux une loi gaussienne simple.

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Segmentation et étiquetage par HMM

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Analyse/Synthèse et modifications prosodiques Les alternatives: PSOLA / MBROLA HSX Harmoniques + Bruit

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Modèle Harmonique + Bruit Objectives: Le modèle: Faciliter les modifications prosodiques Représentation assez simple Basé sur l’acoustique de la parole

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Analyse Harmoniques + Bruit Estimation des harmoniques Estimation de l’enveloppe harmonique Paramètres H+B f A Signal à l ’entréeVoisement Estimation AR du résiduel Détection du pitch, et l’énergie Estimation AR Voisé Non-voisé f A

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Synthèse Harmoniques + Bruit Paramètres H+B Voisement Voisé Non-voisé Synthèse LPC Synthèse LPC Génération des harmoniques Calculer la phase + + Signal resynthetisé

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Modifications prosodiques et spectrales contrôle de l’enveloppe énergétique ajustement de la fréquence fondamentale anamorphose temporelle par DTW adaptation au locuteur par modification spectrale

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Perspectives améliorer l’intelligibilité et la qualité. choix d’unités compatibles pour le codage et la synthèse à partir du texte. rendre le codeur indépendant du locuteur et de la langue. restituer l’identité du locuteur.

CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Et à plus longs termes... utiliser la technique ALISP de codage avec des références étiquetées phonétiquement pour faciliter la reconnaissance automatique de la parole, expérimenter le codage ALISP en vérification du locuteur.