Simulations du VMike et évaluations comparatives.

Slides:



Advertisements
Présentations similaires
Modèles de Markov Cachés (HidenMarkovModel)
Advertisements

Le rendu basé images S. B Kang. A survey of image-based rendering techniques. In Videometrics VI, volume 3641, pages SPIE, 1999 Heung-Yeung Shum.
Page 1 Activités centrées autour de SMOS Eric A NTERRIEU et Bruno P ICARD PLAN La synthèse douverture Léquation de base Les méthodes de régularisation.
COMA : PASSE, PRESENT, FUTUR MINI-PROSPECTIVE SUR LES AMAS DE GALAXIES
(1) Laboratoires , Vallauris (06), France (2) Laboratoire , France
Recent Advances in the Automatic Recognition of Audiovisual Speech
Projet incitatif GET BIOMET : vérification multimodale de l’identité
Gérard CHOLLET Fusion Gérard CHOLLET GET-ENST/CNRS-LTCI 46 rue Barrault PARIS cedex 13
GDR Reconnaissance dobjets en imagerie de télédétection Vendredi 7 mai 2010 Matin : amphi Emeraude Après-midi : E200.
SP1 : Transfert de technologie
MAJORDOME : Assistant personnel et Messagerie unifiée G. Chollet, L
RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours -
Reconnaissance du locuteur
MAJORDOME : Assistant personnel et Messagerie unifiée G. Chollet, L
Reconnaissance de la parole
NOLISP, Paris, March 23rd 2007 Audio-Visual Speech Processing Gérard Chollet, Hervé Bredin, Thomas Hueber, Rémi Landais, Leila Zouari.
June 15th, 2004 BioSecure1 BioSecure : Future of Biometrics and Evaluations Gérard CHOLLET CNRS-LTCI, GET-ENST European Biometric Forum European Biometric.
Audio-Visual Speech Processing Gérard Chollet, Hervé Bredin, Thomas Hueber, Rémi Landais, Patrick Perrot, Leila Zouari NOLISP, Paris, March 23rd 2007.
Reconnaissance Automatique de la Parole
Algorithme de Viterbi pour la reconnaissance de la parole
Contexte scientifique
Indexation vidéo Indexation multimédia
Les technologies 3D appliquées à la formation aéronautique ETAT DE L ART et PERSPECTIVES.
A Pyramid Approach to Subpixel Registration Based on Intensity
Jean-Emmanuel Deschaud Directeur de thèse : François Goulette
Master Informatique 2ème année
Reconnaissance de la parole
Caractérisation de signaux pour l'interaction sociale
Reconstruction de volume 3D
ARC RAPSODIS Reconnaissance Automatique de la Parole Suivie et Orientée par Des Informations Syntaxico-Sémantiques PAROLE – METISS – TALARIS – TEXMEX –
Bao LY VAN Doctorant – INT
Communications optimisées dans un réseau véhiculaire ad-hoc multisauts
Journée Jeunes Chercheurs
Débruitage perceptuel de la parole
Application des HMMs à la reconnaissance vocale
Recherche d’un même objet / scène
Reconnaissance de visages
Reconnaissance de Yes/No à l’aide du HTK
Vancouver, SCÉÉ 1. Raîche et collab. (2008) Lutilisation des simulations informatisées pour la recherche en éducation Gilles Raîche, UQAM Komi Sodoké,
1.
Reconnaissance Vocale
‘The Voice Company’ Du texte à la Parole
Jenny Benois-Pineau Philippe Joly
RECONNAISSANCE DE FORMES
1 SEEDS/M&M - MACS 23 janvier 2007 Groupement de Recherche SEEDS Systèmes d'Énergie Électrique dans leurs Dimensions Sociétales.
Alessandro de Luna Almeida
Introduction à la vision numérique
Application des HMMs à la reconnaissance vocale
Problématique:………………………………
Avignon, 14 novembre 2006http://biobimo.eurecom.fr Sous-Projet 4 : Segmentation et Authentification conjointes de la voix et du visage Etat de l’art -
Monitoring Détection de séquences vidéo en temps réel dans une grande base de données Julien Law-to 23/07/2004.
Plan cours parole 29 Octobre 2003  1. Applications et démos (appli) voir feuilles distribués + démos  2. Fondements théoriques (theorie)  2.1 voir cours.
Le genre musical François Pachet. Sur Amazon ? Pop General Adult Contemporary Britpop Dance Pop Disco Easy Listening Emerging Artists Latin Pop Motown.
Pilotage d’algorithmes
Contrôle du chargement de crayons de combustibles nucléaire par radiographie X 5GE Tdsi Miniprojet Bute Clément Flamary Rémi Ionescu Cristina Vaugon André.
Détection de réflecteurs dans les images sismiques Thésard: Drissi Noomane Encadrants: Thierry Chonavel, Jean Marc Boucher Journées des doctorants
Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.
Application des HMMs à la reconnaissance vocale
Présentation RFIA janvier 2002
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
Reconnaissance de visage par vidéo
Monitoring Détection de séquences vidéo en temps réel dans une grande base de données Julien Law-to 22/06/2004.
Eurecom, 30 June 2008http://biobimo.eurecom.fr BIOBIMO Amel ZNAIDIA.
Dans l’axe Systèmes Sociotechniques Ambiants
Journée Des Doctorants 2004
Traitements d'images et Vision par ordinateur
DYNI DYNamiques de l'Information [DYNI – UMR LSIS] Activité en traitement image resp. Pr. GLOTIN Inst. Univ de France & USTV - Contexte.
EXTRACTION D’ÉLÉMENTS CURVILIGNES GUIDÉE PAR DES MÉCANISMES ATTENTIONNELS POUR DES IMAGES DE TÉLÉDÉTECTION : APPROCHE PAR FUSION DE DONNÉES EXTRACTION.
Les Mondes Virtuels : Au delà des jeux vidéo © Samuel CRUZ-LARA Samuel CRUZ-LARA IUT Nancy-Charlemagne / LORIA (UMR 7503) CNRS.
The consequences of the.
Transcription de la présentation:

Simulations du VMike et évaluations comparatives

Projet de recherche sur crédit incitatif GET 2005 Page 2 Reconnaissance AV de la parole

Projet de recherche sur crédit incitatif GET 2005 Page 3 Traitements audio Extraction du signal audio Détection des chiffres Reconnaissance des chiffres: Paramètres acoustiques : MFCC HMMs indépendants du contexte Décodage : algo. de Viterbi Bruitage de la parole Bruit : Babble Tests de reconnaissance

Projet de recherche sur crédit incitatif GET 2005 Page 4 Traitements Vidéo Extraction des vidéos Localisation des lèvres Interpolation des images (même cadence que la parole) Extraction des paramètres DCT et DCT2 (+LDA) Projections :PRO et PRO2 (+LDA) Tests de reconnaissance

Projet de recherche sur crédit incitatif GET 2005 Page 5 Techniques de fusion Fusion des paramètres : Concaténation Réduction de la dimension : LDA Modélisation HMM classique avec un seul flux Fusion des scores : Multistream HMM

Projet de recherche sur crédit incitatif GET 2005 Page 6 Résultats expérimentaux Fusion des paramètres

Projet de recherche sur crédit incitatif GET 2005 Page 7 Résultats expérimentaux Fusion des scores : -5db

Projet de recherche sur crédit incitatif GET 2005 Page 8 Bibliographie G. Potamianos, C. Neti, G. Gravier, A. Garp, A. W. Senior. Recent Advances in the Automatic Recognition of Audiovisuel Speech. In IEEE? Vol. 91, pages sept J.N. Gowdy, A. Subramanya, C. Bartels, and J. Bilmes. DBN-Based Multi-Stream Models for Audio-Visual Speech Recognition IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, May Montreal, Canada F. Brugger, L. Zouari, H. Bredin, A. Ameheaye, G. Chollet, D. Pastor et Y. Ni. Reconnaissance de la parole audiovisuelle par VMike. Accepté aux XVIèmes Journées dEtude sur la Parole. Dinard 2006.