La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Identification automatique des langue Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage

Présentations similaires


Présentation au sujet: "LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Identification automatique des langue Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage"— Transcription de la présentation:

1

2 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Identification automatique des langue Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage

3 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 2 IDENTIFICATIONIDENTIFICATION AUTOMATIQUEAUTOMATIQUE DESLANGUESDESLANGUES Introduction à Linguistique à langues parlées Plus de dialectes Près de 3 enfants sur 4 naissent en environnement multilingue à Ingénierie des langues Domaine récent (1990) Traitement automatique de la parole Environnement multilingue à Objectifs à long terme Décrire automatiquement les langues Comprendre et traduire automatiquement les langues

4 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 3 Et lhomme ? Identification des langues par ladulte Bon système didentification ! Influence des connaissances linguistiques a priori JaponaisCoréen???? Identification des langues par lenfant Très précoce Basée sur la distinction de la mélodie et du rythme Parole NaturelleParole Synthétisée HollandaisJaponaisHollandaisJaponais

5 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 4 LIdentification Automatique des Langues Application standard –Identifier la langue parlée par un locuteur inconnu –La langue fait partie dun ensemble de N langues connues –La durée de lénoncé est limitée ( 1 min.) Au-delà… –Langues, dialectes ? –Possibilité de prendre une décision de rejet ? –Identifier des accents étrangers ?

6 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 5 Les enjeux de lIAL Enjeux scientifiques Enjeux applicatifs Enjeux stratégiques

7 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 6 Les enjeux scientifiques Caractérisation linguistique –Typologies linguistiques vs. automatiques –Compréhension des processus cognitifs du langage Modélisation –Phonétique –Phonologie –Rythme –Prosodie Apprentissage dune langue étrangère L2

8 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 7 Les enjeux applicatifs Communication HM multilingue Communication multilingue Interfaces Homme Machine A quelle heure ? I dont understand ! à Dictée Vocale Serveurs Vocaux Interfaces Homme - Machine

9 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 8 Les enjeux applicatifs Indexation de documents Multimédia ou Audio –Parole / Musique / Bruit –Sujet traité –Locuteur –Langue Sélection « en ligne » démissions hertziennes/câblées Indexation par le contenu

10 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 9 Où avez- vous mal ? Where does it hurt ? Les enjeux applicatifs Standards téléphoniques, Services durgence Intervention humanitaire Dialogue assisté par ordinateur

11 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 10 Les enjeux stratégiques à Communication internationale Instances internationales (ONU, …) Mission multinationale (Casques bleus, …) à « Renseignement militaire » Identification des langues Identification des dialectes, des parlers Vérification de la langue

12 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 11 Morphologiques Syntaxiques Sémantiques Comment identifier une langue ? Quelles informations ? –Phonétiques –Phonotactiques –Phonologiques –Prosodiques Comment les exploiter ? –Modèles statistiques –Modèles neuromimétiques –Systèmes experts

13 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 12 Lapproche actuelle Informations phonétiques Informations phonotactiques Modèles de Markov Cachés Modèles N-grammes

14 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 13 Topologie dun système dIAL Reconnaissance Phonétique Langue 1 Langue... Langue N Modèles phonétiques Reconnaissance Phonotactique Langue 1 Langue... Langue N Modèles phonotactiques Prétraitement acoustique Décision

15 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 14 LIAL aujourdhui Les points positifs des systèmes actuels –Efficaces : 90 % didentification correcte (11 langues) –Parole téléphonique, énoncés de 45 secondes Les limites –Données étiquetées limitées Nombre de décodeurs phonétiques limités Nombre de langues reconnues limitées –Incapacité à comparer lénoncé inconnu à une base de données

16 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 15 Perspectives Objectifs –Identifier plus de langues –Identifier plus efficacement –Identifier à partir denregistrements plus courts –Prendre en compte les dialectes –Obtenir une description automatique de lénoncé à identifier Méthodes –Prendre en compte plus dinformations Prosodique Phonologique –Concevoir des systèmes plus performants Multi-niveaux Approches « systèmes experts »

17 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 16 Lidentification des langues à DDL Expériences perceptives et cognitives –Mieux comprendre le processus didentification des langues –Evaluer les différences de traitement cognitifs entre langues et dialectes –Faire émerger des paramètres pertinents pour lIAL Modélisation automatique –Améliorer les résultats (taux didentification et nombre de langues) –Obtenir une description phonologique partielle des langues à identifier Tendre vers une description automatique des langues

18 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 17 Lidentification des langues à DDL Expériences perceptives et cognitives Nature des expériences –Stimuli naturels ou synthétiques –Expériences didentification ou de différentiation Résultats –Evaluation des différences phonétiques et phonologiques entre dialectes arabes maghrébins et moyen-orientaux –Evaluation de distances perceptives entre langues romanes Expérience didentification des langues sur Internet

19 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 18 Lidentification des langues à DDL Modélisation Etudes menées –Modélisation statistique non supervisée des systèmes vocaliques –Etude préliminaire sur la modélisation de la prosodie et du rythme Résultats –Identification de 4 langues à 98 % coréen, français, japonais et vietnamien Parole téléphonique –Identification de la zone dialectale arabe à 90 % Maghreb vs. Moyen-Orient

20 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 19 Bibliographie R. Boite, H. Bourlard, T. Dutoit, J. Hancq, and H. Leich. Traitement de la parole. Presses Polytechniques Romandes. Calliope. La parole et son traitement automatique. Masson, 1989.

21 LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 20 Liens Internet Synthèse Codage


Télécharger ppt "LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Identification automatique des langue Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage"

Présentations similaires


Annonces Google