Identification automatique des langue Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Introduction Linguistique 5 000 à 6 000 langues parlées Plus de 10 000 dialectes Près de 3 enfants sur 4 naissent en environnement multilingue Ingénierie des langues Domaine récent (1990) Traitement automatique de la parole Environnement multilingue Objectifs à long terme Décrire automatiquement les langues Comprendre et traduire automatiquement les langues I D E N T F C A O U M Q S L G LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Et l’homme ? Identification des langues par l’enfant Très précoce Basée sur la distinction de la mélodie et du rythme Parole Naturelle Parole Synthétisée Hollandais Japonais Identification des langues par l’adulte Bon système d’identification ! Influence des connaissances linguistiques a priori Japonais Coréen ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
L’Identification Automatique des Langues Application standard Identifier la langue parlée par un locuteur inconnu La langue fait partie d’un ensemble de N langues connues La durée de l’énoncé est limitée ( 1 min.) Au-delà… Langues, dialectes ? Possibilité de prendre une décision de rejet ? Identifier des accents étrangers ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Les enjeux de l’IAL Enjeux scientifiques Enjeux applicatifs Enjeux stratégiques LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Les enjeux scientifiques Caractérisation linguistique Typologies linguistiques vs. automatiques Compréhension des processus cognitifs du langage Modélisation Phonétique Phonologie Rythme Prosodie Apprentissage d’une langue étrangère L2 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Les enjeux applicatifs Interfaces Homme - Machine Communication multilingue Interfaces Homme Machine Communication HM multilingue A quelle heure ? I don’t understand ! Dictée Vocale Serveurs Vocaux LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Les enjeux applicatifs Indexation par le contenu Indexation de documents Multimédia ou Audio Parole / Musique / Bruit Sujet traité Locuteur Langue Sélection « en ligne » d’émissions hertziennes/câblées LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Les enjeux applicatifs Dialogue assisté par ordinateur Standards téléphoniques, Services d’urgence 911 Intervention humanitaire Où avez-vous mal ? Where does it hurt ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Les enjeux stratégiques Communication internationale Instances internationales (ONU, …) Mission multinationale (Casques bleus, …) « Renseignement militaire » Identification des langues Identification des dialectes, des parlers Vérification de la langue LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Comment identifier une langue ? Quelles informations ? Phonétiques Phonotactiques Phonologiques Prosodiques Comment les exploiter ? Modèles statistiques Modèles neuromimétiques Systèmes experts Morphologiques Syntaxiques Sémantiques LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Informations phonétiques Informations phonotactiques L’approche actuelle Informations phonétiques Informations phonotactiques Modèles de Markov Cachés Modèles N-grammes LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Topologie d’un système d’IAL Reconnaissance Phonétique Langue 1 Langue ... Langue N Modèles phonétiques Langue 1 Langue ... Langue N Modèles phonotactiques Prétraitement acoustique Reconnaissance Phonotactique Décision LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE L’IAL aujourd’hui Les points positifs des systèmes actuels Efficaces : 90 % d’identification correcte (11 langues) Parole téléphonique, énoncés de 45 secondes Les limites Données étiquetées limitées Nombre de décodeurs phonétiques limités Nombre de langues reconnues limitées Incapacité à comparer l’énoncé inconnu à une base de données LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Perspectives Objectifs Identifier plus de langues Identifier plus efficacement Identifier à partir d’enregistrements plus courts Prendre en compte les dialectes Obtenir une description automatique de l’énoncé à identifier Méthodes Prendre en compte plus d’informations Prosodique Phonologique Concevoir des systèmes plus performants Multi-niveaux Approches « systèmes experts » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
L’identification des langues à DDL Expériences perceptives et cognitives Mieux comprendre le processus d’identification des langues Evaluer les différences de traitement cognitifs entre langues et dialectes Faire émerger des paramètres pertinents pour l’IAL Modélisation automatique Améliorer les résultats (taux d’identification et nombre de langues) Obtenir une description phonologique partielle des langues à identifier Tendre vers une description automatique des langues LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
L’identification des langues à DDL Expériences perceptives et cognitives Nature des expériences Stimuli naturels ou synthétiques Expériences d’identification ou de différentiation Résultats Evaluation des différences phonétiques et phonologiques entre dialectes arabes maghrébins et moyen-orientaux Evaluation de distances perceptives entre langues romanes Expérience d’identification des langues sur Internet LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
L’identification des langues à DDL Modélisation Etudes menées Modélisation statistique non supervisée des systèmes vocaliques Etude préliminaire sur la modélisation de la prosodie et du rythme Résultats Identification de 4 langues à 98 % coréen, français, japonais et vietnamien Parole téléphonique Identification de la zone dialectale arabe à 90 % Maghreb vs. Moyen-Orient LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Bibliographie R. Boite, H. Bourlard, T. Dutoit, J. Hancq, and H. Leich. Traitement de la parole. Presses Polytechniques Romandes. Calliope. La parole et son traitement automatique. Masson, 1989. LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE Liens Internet Synthèse http://tcts.fpms.ac.be/synthesis/mbrola.html http://www.bell-labs.com/project/tts/#examples http://www.cstr.ed.ac.uk/projects/festival/ http://www.research.att.com/projects/tts/ Codage http://people.qualcomm.com/karn/voicedemo/ LE TRAITEMENT AUTOMATIQUE DE LA PAROLE