Grammaire de compréhension à émission de concepts Myrtille Terrier (2ème année) Myrtille.Terrier@math-info.univ-paris5.fr CRIP5, équipe Diadex. Université René Descartes – Paris V LaLICC FRE 2919, équipe Parole et Langage. Université de Paris-Sorbonne – Paris IV Société SoNear, logiciels applicatifs pour téléphones mobiles PROBLEMATIQUE Compréhension de la parole dans des applications de dialogue vocal ETAT DE L’ART Système de dialogue vocal CONTRIBUTION 3. Description des connaissances linguistiques 1. Système de reconnaissance 2. Grammaire de compréhension 4. Grammaire d’unification Moteur de reconnaissance vocale + Modèle de langage Modèle de langage généraliste (n-gram) Estimation de la probabilité d'un mot connaissant ses N prédécesseurs 10-15% d’erreurs (Broadcast News) 40% d’erreurs (Meeting Recognition) Analyse des énoncés reconnus par le système de reconnaissance Grammaire de syntagmes minimaux (chunks) [Abney 91] 1. Identification des mots [Je/ pronom] [voudrais/verbe] [partir/verbe] [de/prep] [Paris/nom propre] 2. Conversion d’une suite de mots en chunks (patrons prédéfinis) [Je] [voudrais partir] [de Paris] 3. Construction de phrases à partir des chunks [[Je/SN [voudrais partir/SV] [de Paris/sprep]] 4. Compréhension,grâce aux concepts sémantico-pragamatiques associés à la tête lexicale du chunk (lexique du domaine de la tâche) <GC1>::= <mouvement><GC2> <mouvement>::= partir |aller <GC2>::= <localisation>|<état> <localisation>::= Paris|Lyon|Grenoble <état>::= vacances|retraite [[mouvement: partir] [localisation:Paris]] Représentation du lexique (syntaxe et sémantique lexicale) fondée sur une structuration de traits de modalité et de valeurs données Syntaxe mot voudrais nature verbe mode: indicatif temps: présent personne: 1ere nombre: sing mot je nature pronom sous cat: personnel personne: 1ere nombre: sing Sémantique lexicale lemme vouloir concept formulation spécialisation expressif: volonté lemme partir concept mouvement spécialisation polarité locative: initiale transitionnel: + Contraintes logiques sur les traits et les valeurs Contraintes syntaxiques Concordance des temps, traitement des accords (C1) RUSynt 1 {Accord_Personne_Nombre} : pronom (Personne, Nombre) ∧ verbe (Personne, Nombre) Unification de la valeur des traits Personne et Nombre (C2) RUSynt 2 {Accord_Genre_Nombre} : article (Genre, Nombre) ∧ nom (Genre, Nombre) Contraintes entre les syntagmes (représentation simplifiée) (C3) RUSynt 3 {Phrase} : SN ∧ SV ∧ RUSynt 1 (C4) RUSynt 4 {Phrase} : SN ∧ SPrep (C5) RUSynt 5 {SV} : verbe ∧ Sprep () (C6) RUSynt 6 {Sprep} : prep ∧ SN SN: syntagme nominal SV: syntagme verbal SPrep: syntagme prépositionnel Contraintes sémantiques Contraintes entre les constituants sémantiques (sémantique relationnelle) (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: Valeur) ∧ mouvement (polarité locative: Valeur) Unification de la valeur du trait Polarité Locative (Valeur) Modèle de langage formel spécialisé Grammaire hors contexte <HC1>::= je voudrais <HC2> <HC3> <HC2>::= partir|aller <HC3>::= <HC4>|<HC5> <HC4>::= en vacances <HC5>::= de <HC6> <HC6>::= Paris|Lyon|Grenoble Modèle de langage peu flexible Nombreuses règles dues à la spécialisation Faible niveau d’abstraction Pas d’analyse linguistique profonde (traitement des ellipses, anaphores, cataphores, deixis) 5. Grammaire d’unification à émission de concepts pour la compréhension Bibliographie 6. Modalité d’évaluation Une contrainte satisfaite peut émettre un ou plusieurs nouveau(x) concept(s) (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: finale) ∧ mouvement (polarité locative: finale) Émission nouveau concept: trajet [localisation[cible]] (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: initiale) ∧ mouvement (polarité locative: initiale) Émission nouveau concept: trajet [localisation[source]] Ex: (C3) ∧ (C4) ∧ (C7) Il peut arriver à Autran ? Je veux revenir à l’hôtel le plus tôt possible Un billet au départ de la gare de Lyon, s’il vous plait Demain, je partirai de la place Grenette Ils vont décoller de Lyon à midi je vais partir de l’aile nord de l’aéroport RCG - J. Dowding, B.A. Hockey, J.M. Gawron, and C. Culy. (2001). Practical issues in compiling typed unification grammars for speech recognition. In Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics, Toulouse, France. - R. Moore. (1998). Using natural language knowledge sources in speech recognition. In Proceedings of the NATO Advanced Studies Institute. - M. Rayner, B.A. Hockey, J.-M. Renders, N. Chatzichrisafis and K. Farrell. (2005). Spoken Language Processing in the Clarissa Procedure Browser. ICSI Tech Report TR-05-005. Taux d’erreur de reconnaissance - en mots: 2,02% - en concepts Couverture de la langue Taux de réutilisation des contraintes - syntaxiques - sémantiques Approche flexible Réutilisation des connaissances syntaxiques et sémantiques Description hiérarchique Grammaire formelle de reconnaissance et de compréhension pour le dialogue Une grammaire d’unification pour modéliser la réponse de l’utilisateur à 1 question Perspective: génération automatique de grammaires d’unification spécialisées [Rayner 05] Génération d’une grammaire hors contexte de reconnaissance à partir de cette grammaire [Moore 98][Dowding 01] École d’été Dialogue et Interaction- Juillet 2006- Autran