La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Identification automatique des langue

Présentations similaires


Présentation au sujet: "Identification automatique des langue"— Transcription de la présentation:

1 Identification automatique des langue
Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

2 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Introduction Linguistique 5 000 à langues parlées Plus de dialectes Près de 3 enfants sur 4 naissent en environnement multilingue Ingénierie des langues Domaine récent (1990) Traitement automatique de la parole Environnement multilingue Objectifs à long terme Décrire automatiquement les langues Comprendre et traduire automatiquement les langues I D E N T F C A O U M Q S L G LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

3 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Et l’homme ? Identification des langues par l’enfant Très précoce Basée sur la distinction de la mélodie et du rythme Parole Naturelle Parole Synthétisée Hollandais Japonais Identification des langues par l’adulte Bon système d’identification ! Influence des connaissances linguistiques a priori Japonais Coréen ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

4 L’Identification Automatique des Langues
Application standard Identifier la langue parlée par un locuteur inconnu La langue fait partie d’un ensemble de N langues connues La durée de l’énoncé est limitée ( 1 min.) Au-delà… Langues, dialectes ? Possibilité de prendre une décision de rejet ? Identifier des accents étrangers ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

5 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Les enjeux de l’IAL Enjeux scientifiques Enjeux applicatifs Enjeux stratégiques LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

6 Les enjeux scientifiques
Caractérisation linguistique Typologies linguistiques vs. automatiques Compréhension des processus cognitifs du langage Modélisation Phonétique Phonologie Rythme Prosodie Apprentissage d’une langue étrangère L2 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

7 Les enjeux applicatifs
Interfaces Homme - Machine Communication multilingue Interfaces Homme Machine Communication HM multilingue A quelle heure ? I don’t understand ! Dictée Vocale  Serveurs Vocaux LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

8 Les enjeux applicatifs
Indexation par le contenu Indexation de documents Multimédia ou Audio Parole / Musique / Bruit Sujet traité Locuteur Langue Sélection « en ligne » d’émissions hertziennes/câblées LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

9 Les enjeux applicatifs
Dialogue assisté par ordinateur Standards téléphoniques, Services d’urgence 911 Intervention humanitaire Où avez-vous mal ? Where does it hurt ? LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

10 Les enjeux stratégiques
Communication internationale Instances internationales (ONU, …) Mission multinationale (Casques bleus, …) « Renseignement militaire » Identification des langues Identification des dialectes, des parlers Vérification de la langue LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

11 Comment identifier une langue ?
Quelles informations ? Phonétiques Phonotactiques Phonologiques Prosodiques Comment les exploiter ? Modèles statistiques Modèles neuromimétiques Systèmes experts Morphologiques Syntaxiques Sémantiques LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

12 Informations phonétiques Informations phonotactiques
L’approche actuelle Informations phonétiques Informations phonotactiques Modèles de Markov Cachés Modèles N-grammes LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

13 Topologie d’un système d’IAL
Reconnaissance Phonétique Langue 1 Langue ... Langue N Modèles phonétiques Langue 1 Langue ... Langue N Modèles phonotactiques Prétraitement acoustique Reconnaissance Phonotactique Décision LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

14 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
L’IAL aujourd’hui Les points positifs des systèmes actuels Efficaces : 90 % d’identification correcte (11 langues) Parole téléphonique, énoncés de 45 secondes Les limites Données étiquetées limitées  Nombre de décodeurs phonétiques limités  Nombre de langues reconnues limitées Incapacité à comparer l’énoncé inconnu à une base de données LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

15 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Perspectives Objectifs Identifier plus de langues Identifier plus efficacement Identifier à partir d’enregistrements plus courts Prendre en compte les dialectes Obtenir une description automatique de l’énoncé à identifier Méthodes Prendre en compte plus d’informations Prosodique Phonologique Concevoir des systèmes plus performants Multi-niveaux Approches « systèmes experts » LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

16 L’identification des langues à DDL
Expériences perceptives et cognitives Mieux comprendre le processus d’identification des langues Evaluer les différences de traitement cognitifs entre langues et dialectes Faire émerger des paramètres pertinents pour l’IAL Modélisation automatique Améliorer les résultats (taux d’identification et nombre de langues) Obtenir une description phonologique partielle des langues à identifier  Tendre vers une description automatique des langues LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

17 L’identification des langues à DDL
Expériences perceptives et cognitives Nature des expériences Stimuli naturels ou synthétiques Expériences d’identification ou de différentiation Résultats Evaluation des différences phonétiques et phonologiques entre dialectes arabes maghrébins et moyen-orientaux Evaluation de distances perceptives entre langues romanes Expérience d’identification des langues sur Internet LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

18 L’identification des langues à DDL
Modélisation Etudes menées Modélisation statistique non supervisée des systèmes vocaliques Etude préliminaire sur la modélisation de la prosodie et du rythme Résultats Identification de 4 langues à 98 % coréen, français, japonais et vietnamien Parole téléphonique Identification de la zone dialectale arabe à 90 % Maghreb vs. Moyen-Orient LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

19 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Bibliographie R. Boite, H. Bourlard, T. Dutoit, J. Hancq, and H. Leich. Traitement de la parole. Presses Polytechniques Romandes. Calliope. La parole et son traitement automatique. Masson, 1989. LE TRAITEMENT AUTOMATIQUE DE LA PAROLE

20 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE
Liens Internet Synthèse Codage LE TRAITEMENT AUTOMATIQUE DE LA PAROLE


Télécharger ppt "Identification automatique des langue"

Présentations similaires


Annonces Google