ARC RAPSODIS Reconnaissance Automatique de la Parole Suivie et Orientée par Des Informations Syntaxico-Sémantiques PAROLE – METISS – TALARIS – TEXMEX –

Slides:



Advertisements
Présentations similaires
Un thésaurus des services généraux pour l'Arseg
Advertisements

PROJET PILOTE ELEARNING EN RADIOPROTECTION MEDICALE
L'interopérabilité dans l'innovation 2
Copyright 2008 © Consortium ESUP-Portail ESUP-Days 7, Paris, 3 février 2009 La démarche projet Pascal Aubry.
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
6 Mars 2007 PCN Sécurité1 Le GET et la sécurité Savoir faire Stratégie Projets.
Recent Advances in the Automatic Recognition of Audiovisual Speech
Reconnaissance de la parole
Simulations du VMike et évaluations comparatives.
Gérer l'autoformation guidée
Indexation vidéo Indexation multimédia
Les méthodes formelles en ingénierie des connaissances Damien Lhomme-Desages Jérémie Barlet.
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
27 octobre 2006 Thierry Clavel, ENSSIB Le site Internet du Comité français UNIMARC Thierry Clavel ENSSIB Deuxième journée dinformation UNIMARC, Paris,
LCG DATAGRID - France 8 Juillet 2002 LCG : LHC Grid computing - qui, quoi, quand, comment ? Quoi ? But : préparer l'infrastructure informatique des 4 expériences.
Navigation Interactive dans les documents
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
Détection dobjets cartographiques dans les images satellites Très Haute Résolution Guray Erus, Nicolas Loménie Université René Descartes – Paris5, Centre.
Maîtrise des données et des métadonnées de l’ODS
Estella Annoni, Franck Ravat, Olivier Teste, Gilles Zurfluh
E.Dot – juillet 2005 Page 1 Projet R.N.T.L. e.Dot – Entrepôts de Données Ouverts sur la Toile – Organisation et Structuration.
Communication Scientifique
Esup Days 2010 CALIFORNIA INSTITUTE OF TECHNOLOGY UNIVERSITE PIERRE ET MARIE CURIE.
Session 4: Le suivi de la feuille de route de la Stratégie de Dakar
Evaluation de la qualité des documents anciens
Interaction audio sur le site web du LIA
Annotations sémantiques pour le domaine des biopuces
Référentiel ISO 9001 DI Réalisé par: Awatif EL BANANI Réda BOUKALLAL
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
Reconnaissance Vocale
TESTING BUSINESS PROCESSES
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
© Petko ValtchevUniversité de Montréal Janvier IFT 2251 Génie Logiciel Notions de Base Hiver 2002 Petko Valtchev.
Systeme Question-Reponse SQR
Grammaire de compréhension à émission de concepts
Jenny Benois-Pineau Philippe Joly
RECONNAISSANCE DE FORMES
1 ClassRoom 2000 (eclass) Séminaire SH pour le groupe de recherche DIVA de Fribourg Étudiant: Marco Genasci Professeurs: R. Ingold, D. Lalanne.
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires - Démonstration : quel imitateur êtes vous ? Plateau Traitement du son.
la municipalité de St-Pol/Ternoise
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
Présentation du projet edot Revue intermédiaire - 29 Juin 2004.
E.Dot – juillet 2005 Page 1 Conclusion [ Lot 4. Validation et Évaluation ] Rapport Final 4 juillet 2005.
Corporate Research Center Software Department 1/14 UAC/L/99/0292 PROJET CALIFE Réunion de lancement 2 septembre 1999 Calife.
Approches Formelles en Systèmes d'information
Le processus de reconnaissance des mots La reconnaissance des mots lors de la parole continue Contexte et reconnaissance des mots.
Réunion des directeurs d’unités ST2I 30 octobre 2007 Réseau Doc-ST2I Missions et perspectives (MI2S)
Extraction de segments pour la reconnaissance de symboles : Une approche robuste par Transformée de Hough Présenté par : Simon BERNARD Encadré par : Jean-Marc.
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.
Sylwia Ozdowska1, Vincent Claveau2
Dominique LAURENT Patrick SEGUELA
Mustapha Hamidou Vendredi 20 août Stage Contour Matching.
Site Web IUT 2 V3.0 Réunion WEB 24 mars 2005 Présentation du site Formations à la publication Les étapes suivantes Questions / remarques.
Le Wiki Nouvelle Génération Ludovic Dubost, CEO i-expo Mai 2011.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
Présentation de la taxonomie XBRL BE-fr-pfs-ci Bruxelles, le 25 janvier 2006 Camille Dümm Pascal Rodrique Centrale des bilans.
JAOO Octobre JAOO 2007 Evènement annuel au Danemark depuis 10 ans, 15 ème édition 3 jours de conférence  Sessions organisées en « Tracks.
Reconnaissance de visage par vidéo
TEXT MINING Fouille de textes
1 Sébastien Comos Avancement SOA et framework ISICIL 21 Septembre 2009.
Systèmes et Logiciels Embarqués : l'informatisation des objets Gestion de l'énergie (bâtiment intelligent) Ferroviaire (trains, métro autom.,...) Equipements.
Le Traitement Automatique des Langues (TAL)
DYNI DYNamiques de l'Information [DYNI – UMR LSIS] Activité en traitement image resp. Pr. GLOTIN Inst. Univ de France & USTV - Contexte.
Consolidation de grands réseaux lexicaux
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
Citations Le traitement automatisé des citations au CERN Jean-Philippe Schmitt.
Lieu de concertation, de médiation et de coopération entre les institutions, l’Alliance Athena a pour mission d’améliorer les dynamiques du système de.
1 Stage Master 2 THYP Wiki Informatique Approches sémantique et ontologique à l’Université Paris 8 14 Septembre 2006.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Transcription de la présentation:

ARC RAPSODIS Reconnaissance Automatique de la Parole Suivie et Orientée par Des Informations Syntaxico-Sémantiques PAROLE – METISS – TALARIS – TEXMEX – CEA/LIST Analyse syntaxique des phrases reconnues Relations sémantiques et mesure de confiance La syntaxe en reconnaissance Le système de reconnaissance automatique de la parole génère des phrases contenant des erreurs. La détection et la correction de ces erreurs est un enjeu majeur pour la reconnaissance. Améliorer la transcription automatique de la parole en exploitant lanalyse syntaxique Mise en œuvre : Syntex, LIMA, FIPS Remerciements Nous souhaitons remercier le comité de lINRIA qui nous a attribué cette ARC et qui nous a ainsi accordé un cadre et des moyens pour initier une collaboration interdisciplinaire prometteuse dans un domaine aux défis scientifiques particulièrement nombreux. EPI Parole : EPI TALARIS : Défi principal: Identification et modélisation dindices syntaxiques Cette information doit être intégrable dans les modèles de reconnaissance et permettre daméliorer leurs performances. Avancement du projet Analyse syntaxique de loral transcrit Des phénomènes spécifiques à loral et à lapplication affectent les analyses: erreurs de transcriptions, disfluences, absence de ponctuation,... Cooccurrence de mots : Random Indexing Relations syntaxiques : Calculer la probabilité que deux lemmes soient dépendants selon une relation syntaxique donnée. Adaptation du modèle de langage : [Bellagarda05] Réordonnancement des hypothèses de transcription : Mesures de confiance : 2 étapes: 1- Identification des mots erronés 2- Filtrage du treillis / nouvelle passe de reconnaissance Systèmes de reconnaissance / Environnement de test ANTS de PAROLE Irene de METISS Validation prévue sur ESTER2 Publications Cerisara et al : Automatic extraction, of a semantic lexicon from the speech stream, Computer Speech and Language, 2008 (à paraître) Huet et al : Toward the integration of natural language processing and automatic speech recognition: using morpho-syntax and pragmatics for transcription. Multimodal Procesing and Interaction: Audio, Video, Text. Springer Verlag, Pitel et Grefenstette : Semi-automatic building method for a multidimensional affect dictionary for a new language, Proc. LREC, 2008 Cerisara : Integration of confidence measures and missing data mask for robust speech recognition, Proc. Acoustics, juillet 2008 Huet et al : Morphosyntactic Resources for Automatic Speech Recognition. Proc. LREC2008, Marrakech, Mai Site web: Wiki: Partage de données : matrices de cooccurences (CEA), reconnaissances sur ESTER2, analyses syntaxiques Contacts EPI METISS : EPI TEXMEX : CEA LIST : RéunionDateObjet Montparnasse12/02/2008Kick-off: présentation des partenaires, mise en place dun plan de travail Nancy02/04/2008Etude des solutions potentielles pour lanalyse syntaxique Montparnasse02/07/2008Présentation des données du CEA / Table ronde sur lintégration IHP Paris 519/09/2008Retour sur les données du CEA et sur lanalyse syntaxique F w x d R d x k = F w x k F w x k distance sémantique Matrice termes- documents Matrice respectant le lemme de Johnson-Lindenstrauss (1984): distances préservées si R aléatoire et 1<<k<<d TF-IDFcosine TermesCosinus moyen de0,136 et0,135 à0,134 le0,134 la0,134 Précision Rappel Probabilités syntaxiques Caractéristiques: Objectif La distribution de la moyenne des cosines entre le vecteur dun mot et son contexte est modélisée respectivement pour les mots justes et faux. Le rapport de vraisemblances permet de mesurer la confiance des mots. Le fonctionnement est simple le radar sera installé sur une caméra numérique Le monsieur Hue en est simple le radar sera installé sur une caméra numérique Hue est le numérique ensimple sur une monsieur radar sera caméra installé SUJ ATTS NOMPREP DET SUJ AUX ADJ DET PREP 1