Une approche intégrée pour la normalisation des extragrammaticalités de la parole spontanée Mohamed-Zakaria KURDI CLIPS – IMAG.

Slides:



Advertisements
Présentations similaires
Les Jeudis du Patrimoine 19 Avril 2012 Marchés financiers : nos idées d'investissements pour diversifier et dynamiser votre patrimoine.
Advertisements

Approche graphique du nombre dérivé
E1 E1 E1 E1 E1 E1 E1 E1 E2 E2 E2 E2 E2 E2 E3 E3 E3 E3 E3 E4 E4 E4 E4
Qui a le nombre qui vient après 8 ?
Plate-forme de conception de systèmes interactifs
A:B: D:C:. A:B: D:C: Bienvenus à QUI VEUT GAGNER DES MILLIONS? GCSE français: thème 1 ÉCRIS: ton nom et ta classe la date les numéros de 1 à 15 (1 numéro.
A:B: D:C:. A:B: D:C: Bienvenus à QUI VEUT GAGNER DES MILLIONS! Thème: grammaire ÉCRIS: ton nom et ta classe la date les numéros de 1 à 15 (1 numéro par.
A:B: D:C:. A:B: D:C: Bienvenus à QUI VEUT GAGNER DES MILLIONS? GCSE français, Thème 2 ÉCRIS: ton nom et ta classe la date les numéros de 1 à 15 (1 numéro.
1 Off road obstacle avoidance through end to end learning Yann LeCun, Urs Muller, Jan Ben, Eric Cosatto, Beat Flepp.
Licence 2 Option de découverte (1L4INJM) APPLICATIONS INFORMATIQUES POUR LINTERACTION HOMME-ROBOT Responsable : Julien PINQUIER
Portée des variables VBA & Excel
Reconnaissance de la parole
Reconnaissance Automatique de la Parole
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
Surveillance des cas de rougeole dans 3 départements français à couverture vaccinale élevée Projet pilote de surveillance exhaustive Institut de.
Multiplication de nombres relatifs
ACTIVITES Le calcul littéral (3).
Addition de nombres relatifs
CALCUL LITTERAL 3° Avon 2010 Bernard Izard 05-LT I – NOTATIONS
Épreuve de bonne conduite
L'étiquetage morpho-syntaxique d'un corpus oral Claudia-Mariana Ionescu Ripoll.
contrat Creative Commons Paternité-Pas d'Utilisation Commerciale- Partage des Conditions Initiales à l'Identique.
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Défi écriture BEF Couverture. Défi écriture BEF Page 1.
Calculs automatisés n°2 Niveau 3ème Consignes Indiquez votre nom. Indiquez si vous êtes côté fenêtres ou côté couloir. Numérotez votre feuille de (1)
Journée de Travail Groupe “Bermudes”
Analyse des proximités, des préférences et typologie
Intégration réfléchie de la calculatrice Expérimentation
Maîtrise des données et des métadonnées de l’ODS
Identification des personnes par l’iris
Expertise et formation du lméca ESIA / Université de Savoie
Réponds au futur, mets un pronom objet direct
Université Paul Sabatier - Toulouse 3 - Département de GMP Enquête Insertion Professionnelle – Promotion
Tarif et qualification des traducteurs : des indicateurs de qualité ?
Début 15/10/12 Translate the following to French, then practice speaking it with a neighbor: Hi, my name is ____. I am __ years old. I am American, and.
Introduction : Compilation et Traduction
La haute tour sombre 3 Des actions
Karin Lundgren-Cayrol
PUBLIC HEALTH AGENCY of CANADA AGENCE DE LA SANTÉ PUBLIQUE du CANADA 1 PUBLIC HEALTH AGENCY of CANADA AGENCE DE LA SANTÉ PUBLIQUE du CANADA SUICIDE CHEZ.
Apprentissages scolaires
Une expérience originale et populaire
Recherche Documentaire et traitement de l’information
Introduction - Modèle Discret – Modèle Continu - Algorithmes - Conclusion
SYSTEMES D’INFORMATION
Les conceptions des objets mathématiques portées par le langage :
Test bilan de calcul mental N°1 :
IGL301 - Spécification et vérification des exgiences 1 Chapitre 2 Le processus dingénierie des exigences (ref : Bray chapitre 2)
Les différentes méthodologies d’évaluation en IPM
La gestion par activités (ABM)
14² 15² 16² 17² 18² 19² 20² 30² 40² 50² 60² 70² 80² 90² 10² 0² 1² 2² 3² 4² 5² 6² 7² 8² 9² 10² 11² 12² 13².
Chapitre 4: le développement du langage
Arithmétique et algèbre Continuités et ruptures : lettres, signe égal, expressions Module 1.
L ’apprentissage de l ’orthographe lexicale : approche cognitive
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI Jean-Jacques DUMÉRY -1-
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI
1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »
Présentation de la méthode des Eléments Finis
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
“Je dirige tes pas” “Je ne peux resoudre les choses...” Dieu te dit
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Modèle pédagogique d’un système d’apprentissage (SA)
chapitre -1- OPERATIONS [B] REGLES DE PRIORITE (f n°103) lundi 15 septembre 2014  rappels de 6°  du nouveau en 5°  applications  exercices  Page.
Combien ça coute? How much does that cost?.
1 Gestion des intérêts d’une communauté au moyen d’un agent intelligent El Bachir Boukherouaa, El Bachir Gardouh, Claude Frasson Laboratoire HERON Informatique.
Les pronoms de l’objet direct
30 Janvier 2002 Club SEE 63 "Systèmes Informatiques de Confiance" 1 Vérification de spécification de logiciel critique Jean-Louis Boulanger RATPEST/ITF/AQL.
COMMENT ACCEDER AU FORMULAIRE SUBVENTION MONDIALE en ligne 1° Si vous avez ouvert votre compte précédemment, accédez à votre compte par le site
L’EVALUATION et LA VALORISATION DES ACQUIS
Présentation du développement du projet.  Introduction  Conception et méthodes  Developpement  Conclusion 2.
Transcription de la présentation:

Une approche intégrée pour la normalisation des extragrammaticalités de la parole spontanée Mohamed-Zakaria KURDI CLIPS – IMAG

2 Plan 1.Introduction 2.Quelques extragrammaticalités de la parole 3.Travaux précédents 4.Approche et méthode 5.Test et résultats 6.Conclusion

3 Introduction 1.Le développement des systèmes de dialogue nécessite la prise en compte de la spontanéité de la parole 2.Ignorer les extragrammaticalités conduit à des erreurs dinterprétation => Analyse et traitement des extragrammaticalités

4 Typologie des extragrammaticalités de la parole oCompétence ou Performance ? o3 zones (Shriberg, 95) :

5 Quelques extragrammaticalités de la parole Quelques extragrammaticalités de la parole 1.Les extragrammaticalités lexico-syntaxiques Els : Cte fois jte l dis. Cest quoi son nom ? Il veut quoi ? 2.Les répétitions : (...) vous demandez vous demandez une voiture une voiture de location… 3.Les faux départs : (...) je voudrais avez-vous une chambre (…) 4.Lautocorrection : (...) le train part de Grenoble euh pardon de Lyon Perrache 5.Lincomplétude : (…) et si on

6 Travaux précédents oApproches à base de patterns Approches symboliques : (Bear, 1992), (Shriberg, 1994), phonologie, prosodie, Approches stochastiques : (Heeman, 1994), (Heeman, 1997), n-grammes oApproches basées sur la syntaxe Méta-règles danalyse : (Cori, 1997), (Core, 1999)

7 Notre approche Utiliser les informations structurales locales (pour les répétitions par ex.) Utiliser la morpho-syntaxe (pour les auto- corrections par ex.) Utiliser la pragmatique du discours (pour la détection et lanalyse des zones dédition par ex.)

8 Les phénomènes traités Les phénomènes traités par des patterns simples (information structurale superficielle) avec des règles syntaxiques (information morpho-syntaxique) par des patterns hybrides (informations structurale et syntaxique)

9 Méthode Normalisation lexicale POS tagging (Xerox) Normalisation des ESL Deux passes Traitement des répétitions des auto- corrections, des faux- départs et des incomplétudes Traitement des extragrammaticalités lexicales

10 Méthode Le traitement par patterns Étiquetage local avec segmentation (Bear, 94) Étiquetage global sans segmentation M x Motsidentiques R x Remplacement EÉditeurs (silence, hésitation, mots incomplets XMotsneutres Signes utilisés pour létiquetage

11 Les patterns de base Extraction des patterns du corpus dapprentissage (60 dialogues)

12 Méthode Traitement syntaxique Phénomènes : faux départs, Cadre général : analyse par chunks (Abney, 1991). Information des frontières lexicales (..) now the so what (...) Modèles de malformations des chunks I need to my probleme is (...)

13 Problèmes spécifiques Extragrammaticalités multiples (= imbrications)

14 Problèmes spécifiques Surgénérativité (=erreurs) Ressemblance structurale: As soon as, To go to, etc. Traitement : Patterns de contrôle spécifiques La zone dédition : Le nombre –Maximum deux mots neutres Le sens –Enumérations, expressions figées (voyons voir)

15 Le corpus TRAINS Corpus, Université de Rochester USA, (Heeman, 1995) Corpus de négociation de transport ferroviaire de 93 dialogues (441 KB de mots et 5600 tours de parole) 60 dialogues sont réservés à lentraînement

16 Test et résultats Le corpus de test : 500 énoncés dont 286 qui contiennent des Extragrammaticalités

17 Analyse des erreurs 30% de cas non détectés (erreur de détection de la zone dédition) 70% de cas extrêmement complexes dus à linterférence de plusieurs phénomènes (anaphores et extragrammaticalités)

18 Conclusion oIntégration de différentes sources de connaissances pour le traitement des extragrammaticalités de la parole oRésolution de certain cas de surgénérativité