Débruitage perceptuel de la parole

Slides:



Advertisements
Présentations similaires
Reconstitution de l’état d’un micro drone par fusion de données
Advertisements

Approche graphique du nombre dérivé
Indexation Parole / Musique / Bruit
Licence 2 Option de découverte (1L4INJM) APPLICATIONS INFORMATIQUES POUR LINTERACTION HOMME-ROBOT Responsable : Julien PINQUIER
La Cyclostationnarité Aspects théoriques et application au Diagnostic
LIRMM 1 Journée Deuxièmes années Département Microélectronique LIRMM.
PRINCIPE SIMPLIFIE DE LA COMPRESSION MP3
Introduction : plasticité des IHMs – Page 1 IHM et plasticité 1 IHM et Différents supports Différents utilisateurs Différents environnements Problématique.
Laboratoire dacoustique musicale. UPMC, CNRS, Ministère de la culture N. Henrich, M. Castellengo, D. Dubois, J. Poitevineau M. Garnier Approche de la qualité
(1) Laboratoires , Vallauris (06), France (2) Laboratoire , France
Analyse et synthèse de bruits d’habitacle automobile
JJCAAS Octobre 2003 Journées Jeunes Chercheurs en Audition, Acoustique musicale et Signal audio 1 Différenciation de sons de trompette : étude.
Design de l’ambiance sonore dans les gares
Reconnaissance de la parole
Codage de la parole Ivan Magrin-Chagnolleau, CNRS
Reconnaissance Automatique de la Parole
Simulations du VMike et évaluations comparatives.
Codage de la parole à très bas débit avec des unités ALISP
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Caractérisation de la qualité sonore de lenvironnement urbain : Une approche physique et perceptive basée sur lidentification des sources sonores.
Projet n°4 : Objecteering
11ème Rencontre des Electroniciens de Midi-Pyrénées
LAHOUDERE Julien le 23 novembre Contexte Programme spatiale européen AURORA (2002) Première mission ExoMars (départ 2013) Un objectif du Rover PASTEUR.
A Pyramid Approach to Subpixel Registration Based on Intensity
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Défi écriture BEF Couverture. Défi écriture BEF Page 1.
Modélisation et commande hybrides d’un onduleur multiniveaux monophasé
METHODES DE SIMULATION DE LA VITESSE DU VENT
Psychoacoustique seuils de détection
Bouyekhf Rachid-Lyuboumir Gruitch Laboratoire SeT UTBM
Enquête sur les Docteurs 2010 (OPEIP)1 DOCTEURS 2010 des écoles doctorales ALL et SHS Que sont-ils devenus 1 an après leur Doctorat ?
William Francis Amphithéâtre de lISTIL - CAMPUS DE LA DOUA Travailler Ensemble WIKI et BLOG: Outils Collaboratifs.
Analyse de la variance à un facteur
Karel Heurtefeux1, Fabrice Valois2
Transistors J-FET, MES-FET, HEMT
Sélection automatique d’index et de vues matérialisées
Université Paul Sabatier - Toulouse 3 - Département de GMP Enquête Insertion Professionnelle – Promotion
Des RRA à la diagnosticabilité
Interaction Homme Robot Sujet « 16/03/2012 » Réalisé par :
SFA - Journée Description automatique et perception de la musique - 23 Juin 2005 Laboratoire dAcoustique Musicale - CNRS, Université Paris 6, Ministère.
le profil UML en temps réel MARTE
Modélisation d'environnements forestiers
Classification Multi Source En Intégrant La Texture
Capital économique analyse et reporting pour Fortis Assurances
OLAP : Un pas vers la navigation
Thèse de Doctorat Troisième cycle de Physique présentée par Mr NZONZOLO Maître es Science Étude en simulation des effets des paramètres macroscopiques.
Introduction - Modèle Discret – Modèle Continu - Algorithmes - Conclusion
Acoustique musicale Mains dœuvres. Son pur Formule : X = sin ( 2 ft )
SCIENCES DE L ’INGENIEUR
Test bilan de calcul mental N°1 :
Interprétation de séquences dimages pour des applications MédiaSpace Alberto AVANZI François BREMOND Monique THONNAT Projet ORION INRIA de Sophia Antipolis.
Equipe : VAISSET Antoine, MATHEOSSIAN Dimitri
IGL301 - Spécification et vérification des exgiences 1 Chapitre 2 Le processus dingénierie des exigences (ref : Bray chapitre 2)
Courbes de Bézier.
Prédiction multi-step de la volatilité : le modèle ARIMA-GARCH appliqué aux séries temporelles d’affaiblissement par la pluie sur les liaisons Terre-Satellite.
Ecaterina Giacomini Pacurar
MIDI Sans Frontières Analyse des problèmes relatifs à la communication musicale sur IP Mémoire présenté en vue de lobtention du grade de Licencié en informatique.
Conséquences perceptives de lésions cochléaires
Reconnaissance d’empreintes digitales
Filtre de Kalman – Préliminaires (1)
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Décomposer une image sur une base d'ondelettes
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 SysOptim Logiciel de réglage, de modélisation et d’optimisation pour la CPG en tenant compte la totalité du système tout en assurant la cohérence du.
1 28 mai 2002Jean GARNIER CCT Composants Séminaire CAN CARACTERISATION ELECTRIQUE DES CONVERTISSEURS ANALOGIQUE/NUMERIQUE.
Les Codes Spatio-Temporels Correcteurs d’Erreurs
Présentation RFIA janvier 2002
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
La Compression
Transcription de la présentation:

Débruitage perceptuel de la parole Intitulé de la thèse: Débruitage de la parole et ses applications Débruitage perceptuel de la parole Asmaa Amehraye Sous l’encadrement de: Dominique Pastor Journées doctorales du département SC

Plan de la présentation 2/18 Introduction Points durs La perception auditive Le débruitage perceptuel de la parole Résultats Conclusion et perspectives 1 2 3 4 5 6

Objectifs du débruitage de la parole 3/18 Processus du débruitage Restituer le signal de parole dans les environnement bruités Améliorer l’intelligibilité de la parole Le confort d’écoute de l’auditeur Applications: Reconnaissance de la parole Téléphonie mobile Téléphonie main libre…

Les méthodes usuelles Soustraction spectrale Filtrage de Kalman 4/18 Soustraction spectrale Filtrage de Kalman Méthodes à sous-espaces Processus du débruitage Ondelettes Filtrage de Wiener .........etc

2- Décorrélation entre bruit b(n) et parole propre s(n). Système mono capteur 5/18 Hypothèses: 1- Bruit additif 2- Décorrélation entre bruit b(n) et parole propre s(n). s(n) y(n) + b(n)

Points durs Estimation du bruit. Détection de l’activité vocale (DAV). 6/18 Estimation du bruit. Détection de l’activité vocale (DAV). Artéfacts: Bruit musical et Distorsions du signal après débruitage.

Gênant à la perception humaine Bruit musical? 7/18 Bruit musical Gênant à la perception humaine Solution: Tenir compte des propriétés du système auditif humain.

Coupe générale de l’oreille Système auditif 8/18 Coupe générale de l’oreille

L’effet de masquage? 9/18 On parle de masquage quand un son est rendu inaudible par un autre. Image extraite de: http://www.minidisc.org/French_tech/section1.html Le masqueur élève localement le seuil d’audition, le son cible nécessite alors plus d’énergie pour être perçu.

Le débruitage perceptuel de la parole 10/18 Contexte: Prise en compte des propriétés de l’audition humaine via la modélisation de certaines de ces propriétés déterminantes. Astuces : Distinction entre ce qui est audible et ce qu’il ne l’est pas. Outil : Modélisation du phénomène de masquage par le calcul de la courbe de masquage. Objectif: Diminuer les artéfacts (distorsions, bruit musical,…)

11/18 Puissance du signal Courbe de masquage Portions inaudibles

Les distorsions du signal Deux cas limite de l’estimée de la courbe de masquage: 12/18 dB dB DSP du signal bruité Courbe de masquage idéale f(Hz) f(Hz) Le bruit résiduel augmente Les distorsions du signal augmentent Besoin d’un compromis 15

Exemples dans la littérature 13/18 Loizou[2] Lin[4] Tim Haulik[5] (même ordre d’idée que[3]) Détection et réduction des tonales musicales: : à partir du signal débruité : à partir du signal bruité Les composantes spectrales au dessus juste de sont candidates pour être du bruit musical.

Contribution 14/19

Evaluation objective MBSD (Modified Bark Spectral Distorsion) SSNR 15/19 MBSD (Modified Bark Spectral Distorsion) SSNR (Segmental Signal to Noise Ratio)

Evaluation subjective 16/18 Tests audio: Wiener Loizou Lin Méthode proposée -5dB 0dB 5dB 10dB Input-5dB Input0dB Input5dB Input10dB She had your dark suit in greasy wash water all year. Don't ask me to carry an oily rag like that

Conclusion et perspectives 17/18 L’apport de la psycho-acoustique est net. Pour la reconnaissance de la parole, on veut montrer que ce n’est pas juste une question de SNR. L'application de ces approches pour l'amélioration de l'intelligibilité audio et la reconnaissance automatique de la parole pour des applications de téléphonie mobile et de téléphonie main libre.

Merci pour votre attention Bibliographie 18/18 [1] E Zwicker, R. Feldtkeller, Psychoacoustique:L’oreille, récepteur d’information”, Masson, Paris, 1981. [2] Y. Hu and P. Loizou, “Incorporating a psychoacoustic model in frequency domain speech enhancement”, IEEE Signal Processing Letters, 11(2), 2004, pp. 270-273. [3] A.Ben Aicha and S. Ben Jebara, “Utilisation de la courbe de masquage pour la détection des tonales musicales artificielles dans un signal de parole débruité par approche spectrales ”, ISIVC2006, Tunisie. [4] L. Lin,W. H. Holmes and E. Ambikairajah,“Speech denoising using perceptual modification of Wiener filtering”, IEEE Electronic Letters, vol. 38, no. 23, November 2002, pp. 1486-1487. [5] T.Haulik, K.Linhard and P.Schrogmeier, “Residual noise suppression using psychoacoustic criteria”, Eurospeech 1997, pp 1395. Merci pour votre attention