Identification automatique des langue

Slides:



Advertisements
Présentations similaires
LANGUES VIVANTES à l’Ecole Primaire
Advertisements

Distance inter-locuteur
Résolution de problèmes et logiciel de calcul symbolique
A. Cornuéjols IAA (basé sur Rob Schapires IJCAI99 talk) Combiner des apprenants: le boosting.
Licence 2 Option de découverte (1L4INJM) APPLICATIONS INFORMATIQUES POUR LINTERACTION HOMME-ROBOT Responsable : Julien PINQUIER
RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours -
Reconnaissance du locuteur
Le traitement automatique de la parole Comment reproduire les processus physiologiques et cognitifs humains? Ivan Magrin-Chagnolleau, CNRS Laboratoire.
Reconnaissance de la parole
Cours parole du 2 Mars 2005 enseignants: Dr
Analyse de la parole Ivan Magrin-Chagnolleau, CNRS
Codage de la parole Ivan Magrin-Chagnolleau, CNRS
Reconnaissance Automatique de la Parole
Codage de la parole à très bas débit avec des unités ALISP
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Cours parole du 2 Mars 2005 enseignants: Dr
Codage de la parole à très bas débit: passage du cas dépendant vers le cas indépendant du locuteur 6-ème réunion d'avancement SYMPATEX : ENST, 19 Septembre.
La méthode expérimentale TD 2 - Licence Laure Fernandez
Indexation vidéo Indexation multimédia
TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES
Girard Pia & Laffont Caroline
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
contrat Creative Commons Paternité-Pas d'Utilisation Commerciale- Partage des Conditions Initiales à l'Identique.
l'approche ergonomique
R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)
Directeur de thèse : Régine André-Obrecht
Reconnaissance de la parole
Monique THONNAT et Nathanaël ROTA Projet ORION
Control des objectifs des technologies de l’information COBIT
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
Interaction Homme Robot Sujet « 16/03/2012 » Réalisé par :
Groupe de travail Veille collective
Approche critique des produits IdL Master 1 IdL Année
Application des algorithmes génétiques
Applications du perceptron multicouche
Les conditions d’efficacité de l’enseignement magistral
Hésitations autonomes en 8 langues :
DeltaPROD Suivi des interventions Gestion de configuration
Quelques Modèles de conception
Représentations des objectifs à atteindre dans l’apprentissage des langues: processus qualifiant et compétences plurilingues Patrick Chardenet Maître de.
Maîtrise des risques et sûreté de fonctionnement – Avignon – 6-10 Octobre 2008 Modélisation des dysfonctionnements dun système dans le cadre dactivités.
SCIENCES DE L ’INGENIEUR
Reconnaissance Vocale
IGL301 - Spécification et vérification des exgiences 1 Chapitre 2 Le processus dingénierie des exigences (ref : Bray chapitre 2)
WikiViz La visualisation dun réseau sémantique Travail de diplôme 2005 Urs Richle / 31 it.
Web sémantique : Web de demain
Chaouki Daassi Projet Cartable Electronique
‘The Voice Company’ Du texte à la Parole
Chapitre 2 La description du langage
ECOLE DES HAUTES ETUDES COMMERCIALES
Master 1 – Sciences du Langage –
Département fédéral de l’intérieur DFI Office fédéral de la statistique OFS Rapport sur le développement durable 2012 – Le système d’indicateurs MONET.
Plan cours parole 29 Octobre 2003  1. Applications et démos (appli) voir feuilles distribués + démos  2. Fondements théoriques (theorie)  2.1 voir cours.
Traitement de la parole : Synthèse et reconnaissance
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
1 La norme individuelle : étude pilote sur le lien perception-production Martine Toda LPP et ENST-LTCI (UMR 5141) Crédits : Projet.
Présentation RFIA janvier 2002
CNRS-LTCI 16 novembre 2000, Avancement SYMPATEX ENST RNRT-SYMPATEX Codage de la Parole à très bas débit. Maurice CHARBIT, Gérard CHOLLET, Niklas PAULSSON,
La prosodie pour l’Identification Automatique des Langues
Evaluation automatique du débit de la parole sur des données multilingues spontanées Jean-Luc Rouas, Jérôme Farinas, François Pellegrino.
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Synthèse de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage
Fusion de paramètres rythmiques et segmentaux pour l’Identification Automatique des Langues Jean-Luc Rouas1, Jérôme Farinas1, François Pellegrino2 & Régine.
TRAITEMENT DE LA PAROLE
Le Traitement Automatique des Langues (TAL)
Bianca Vieru-Dimulescu encadrant : Philippe Boula de Mareüil
Apprentissage automatique des prononciations à partir de grandes masses de données orales Rena NEMOTO Encadrée par Martine Adda-Decker & Ioana Vasilescu.
Journée Des Doctorants 2004
Introduction aux Interfaces Homme-Machine
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Transcription de la présentation:

Identification automatique des langue Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Introduction Linguistique 5 000 à 6 000 langues parlées Plus de 10 000 dialectes Près de 3 enfants sur 4 naissent en environnement multilingue Ingénierie des langues Domaine récent (1990) Traitement automatique de la parole Environnement multilingue Objectifs à long terme Décrire automatiquement les langues Comprendre et traduire automatiquement les langues I D E N T F C A O U M Q S L G LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Et l’homme ? Identification des langues par l’enfant Très précoce Basée sur la distinction de la mélodie et du rythme Parole Naturelle Parole Synthétisée Hollandais Japonais Identification des langues par l’adulte Bon système d’identification ! Influence des connaissances linguistiques a priori Japonais Coréen ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

L’Identification Automatique des Langues Application standard Identifier la langue parlée par un locuteur inconnu La langue fait partie d’un ensemble de N langues connues La durée de l’énoncé est limitée ( 1 min.) Au-delà… Langues, dialectes ? Possibilité de prendre une décision de rejet ? Identifier des accents étrangers ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Les enjeux de l’IAL Enjeux scientifiques Enjeux applicatifs Enjeux stratégiques LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Les enjeux scientifiques Caractérisation linguistique Typologies linguistiques vs. automatiques Compréhension des processus cognitifs du langage Modélisation Phonétique Phonologie Rythme Prosodie Apprentissage d’une langue étrangère L2 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Les enjeux applicatifs Interfaces Homme - Machine Communication multilingue Interfaces Homme Machine Communication HM multilingue A quelle heure ? I don’t understand ! Dictée Vocale  Serveurs Vocaux LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Les enjeux applicatifs Indexation par le contenu Indexation de documents Multimédia ou Audio Parole / Musique / Bruit Sujet traité Locuteur Langue Sélection « en ligne » d’émissions hertziennes/câblées LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Les enjeux applicatifs Dialogue assisté par ordinateur Standards téléphoniques, Services d’urgence 911 Intervention humanitaire Où avez-vous mal ? Where does it hurt ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Les enjeux stratégiques Communication internationale Instances internationales (ONU, …) Mission multinationale (Casques bleus, …) « Renseignement militaire » Identification des langues Identification des dialectes, des parlers Vérification de la langue LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Comment identifier une langue ? Quelles informations ? Phonétiques Phonotactiques Phonologiques Prosodiques Comment les exploiter ? Modèles statistiques Modèles neuromimétiques Systèmes experts Morphologiques Syntaxiques Sémantiques LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Informations phonétiques Informations phonotactiques L’approche actuelle Informations phonétiques Informations phonotactiques Modèles de Markov Cachés Modèles N-grammes LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

Topologie d’un système d’IAL Reconnaissance Phonétique Langue 1 Langue ... Langue N Modèles phonétiques Langue 1 Langue ... Langue N Modèles phonotactiques Prétraitement acoustique Reconnaissance Phonotactique Décision LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE L’IAL aujourd’hui Les points positifs des systèmes actuels Efficaces : 90 % d’identification correcte (11 langues) Parole téléphonique, énoncés de 45 secondes Les limites Données étiquetées limitées  Nombre de décodeurs phonétiques limités  Nombre de langues reconnues limitées Incapacité à comparer l’énoncé inconnu à une base de données LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Perspectives Objectifs Identifier plus de langues Identifier plus efficacement Identifier à partir d’enregistrements plus courts Prendre en compte les dialectes Obtenir une description automatique de l’énoncé à identifier Méthodes Prendre en compte plus d’informations Prosodique Phonologique Concevoir des systèmes plus performants Multi-niveaux Approches « systèmes experts » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

L’identification des langues à DDL Expériences perceptives et cognitives Mieux comprendre le processus d’identification des langues Evaluer les différences de traitement cognitifs entre langues et dialectes Faire émerger des paramètres pertinents pour l’IAL Modélisation automatique Améliorer les résultats (taux d’identification et nombre de langues) Obtenir une description phonologique partielle des langues à identifier  Tendre vers une description automatique des langues LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

L’identification des langues à DDL Expériences perceptives et cognitives Nature des expériences Stimuli naturels ou synthétiques Expériences d’identification ou de différentiation Résultats Evaluation des différences phonétiques et phonologiques entre dialectes arabes maghrébins et moyen-orientaux Evaluation de distances perceptives entre langues romanes Expérience d’identification des langues sur Internet LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

L’identification des langues à DDL Modélisation Etudes menées Modélisation statistique non supervisée des systèmes vocaliques Etude préliminaire sur la modélisation de la prosodie et du rythme Résultats Identification de 4 langues à 98 % coréen, français, japonais et vietnamien Parole téléphonique Identification de la zone dialectale arabe à 90 % Maghreb vs. Moyen-Orient LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Bibliographie R. Boite, H. Bourlard, T. Dutoit, J. Hancq, and H. Leich. Traitement de la parole. Presses Polytechniques Romandes. Calliope. La parole et son traitement automatique. Masson, 1989. LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Liens Internet Synthèse http://tcts.fpms.ac.be/synthesis/mbrola.html http://www.bell-labs.com/project/tts/#examples http://www.cstr.ed.ac.uk/projects/festival/ http://www.research.att.com/projects/tts/ Codage http://people.qualcomm.com/karn/voicedemo/ LE TRAITEMENT AUTOMATIQUE DE LA PAROLE