Grammaire de compréhension à émission de concepts

Slides:



Advertisements
Présentations similaires
MOT Éditeur de modèles de connaissances par objets typés
Advertisements

APPRENDRE A LIRE Présentation par : Marie-Christine Ratez CPC Chauny Roselyne Cail CPC Guise.
Déductions logiques et calcul de représentations sémantiques Alain Lecomte UMR SFL Séminaire « Logique, Sémantique, Dialogue » - partie I.
Hiérarchisation des Variations
Culture et enseignement/ apprentissage des langues
Modélisation d’informations temporelles
Introduction : plasticité des IHMs – Page 1 IHM et plasticité 1 IHM et Différents supports Différents utilisateurs Différents environnements Problématique.
Urbanisation de Systèmes d'Information
Indexation vidéo Indexation multimédia
De l’oral à l ’écrit Retards et troubles Repérage dépistage prévention
Les méthodes formelles en ingénierie des connaissances Damien Lhomme-Desages Jérémie Barlet.
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
OLST — Université de Montréal
L'étiquetage morpho-syntaxique d'un corpus oral Claudia-Mariana Ionescu Ripoll.
Approches formelles en syntaxe et sémantique Alain Lecomte UMR 7023 Structures Formelles de la Langue.
Approches formelles en syntaxe et sémantique
EP1 – Première situation d’évaluation
Vers un système de traduction automatique du langage texto Centre de recherche en linguistique et traitement automatique des langues Lucien Tesnière Université
Directeur de thèse : Régine André-Obrecht
Reconnaissance de la parole
Cours présentielle avec 1er année.
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
ARC RAPSODIS Reconnaissance Automatique de la Parole Suivie et Orientée par Des Informations Syntaxico-Sémantiques PAROLE – METISS – TALARIS – TEXMEX –
L’observation réfléchie de la langue au cycle 3
Pour un système formel de description linguistique
Pour l’utilisation de l’Analyse en Constituants Immédiats
La prévention des difficultés d’écriture
May 4th – 5th 2009, Rabat, Morocco Inès ZALILA & Kais HADDAR
Métagrammaire RLT, 7/02/02. Plan n Rappels : compilateur de BG n Essais sur les verbes n Questions.
Spécification et Vérification de Modèles de Procédés de Développement
4 - Les automates et les lexiques morphologiques : le contenu mot fléchilemmepartie du discourstraits de flexion Habituellement, un lexique morphologique.
La subordination complétive
Génération d’un analyseur syntaxique basé sur HPSG avec le LKB
La communication de ce document est soumise à autorisation de France Télécom R&D (Nom du fichier) - D1 - 01/03/2000 France Télécom R&D Énoncé Représentation.
Présentation à la DGESCO, 16 juin 2010 André OUZOULIAS, formateur à l’IUFM de Versailles-UCP Département PEPSSE (Philosophie, Épistémologie, Psychologie,
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
Maîtrise de la langue française
MOT Éditeur de modèles de connaissances par objets typés
Reconnaissance Vocale
Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait.
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
Une approche intégrée pour la normalisation des extragrammaticalités de la parole spontanée Mohamed-Zakaria KURDI CLIPS – IMAG.
Chapitre 2 La description du langage
LE DEVELOPPEMENT DU LANGAGE
8èmes Journées INTEX/NooJ
Portée, arrimages et intervenants Évolution des méthodes
« Le mot est ...une sorte de pont jeté entre moi et les autres » Bakhtine « Pour faire un homme, il faut d’autres hommes…Mes gènes me permettent de fabriquer.
LA DIFFÉRENCE ENTRE L’ÉTUDE D’UNE PHRASE ET D’UN ENONCÉ
LE JARDIN DE GRAND-MERE
1 er décembre 2005IFT6010 – Jean-Yves Guyomarc’h Colorless green ideas…. Une « guerre de religion »
Le formalisme utilisé pour Lexical Functional Grammar Lionel Clément Signes - Labri Mosaïque 1er décembre 2006.
Architecture et modularité du modèle L'exemple de GUST et des grammaires de correspondance polarisées Sylvain Kahane Modyco, Université Paris.
Approches Formelles en Systèmes d'information
Paulette Roulon-Doko La syntaxe Paulette Roulon-Doko
Les étapes initiales du développement du langage ORAL
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Théories, formalismes, modèles Sylvain Kahane Modyco, Université Paris 10 - Nanterre Mosaïque, Paris, 1/12/2006.
Dominique LAURENT Patrick SEGUELA
Introduction Formalisation de GUST basée sur GUP (GUST = Grammaire d’Unification Sens-Texte, Kahane 2001) (GUP = Grammaire d’Unification Polarisée, Kahane.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
+ Français Deux Notes: Le pronom Y Une location (a, au, aux, dans etc) Il vont a Paris Ils sont allés au Mexique. Ils voudraient aller en France.
Le Traitement Automatique des Langues (TAL)
Règles d’or à suivre en rédaction
Progression/Programmation – Français (1/3)
Consolidation de grands réseaux lexicaux
Conférences (CR) PACLING'03 Pacific Association for Computational LINGuistics 22 au 25 août 2003 Halifax, côte Est Canada RANLP Recent Advances in Natural.
Les relatives infinitives ou la construction d’un inobservable Sylvain Kahane Modyco, Université Paris 10 Lattice, Université Paris 7 COLDOC, Université.
Le syntagme prépositionnel
Lingua francese III.
Transcription de la présentation:

Grammaire de compréhension à émission de concepts Myrtille Terrier (2ème année) Myrtille.Terrier@math-info.univ-paris5.fr CRIP5, équipe Diadex. Université René Descartes – Paris V LaLICC FRE 2919, équipe Parole et Langage. Université de Paris-Sorbonne – Paris IV Société SoNear, logiciels applicatifs pour téléphones mobiles PROBLEMATIQUE Compréhension de la parole dans des applications de dialogue vocal ETAT DE L’ART Système de dialogue vocal CONTRIBUTION 3. Description des connaissances linguistiques 1. Système de reconnaissance 2. Grammaire de compréhension 4. Grammaire d’unification Moteur de reconnaissance vocale + Modèle de langage Modèle de langage généraliste (n-gram) Estimation de la probabilité d'un mot connaissant ses N prédécesseurs 10-15% d’erreurs (Broadcast News) 40% d’erreurs (Meeting Recognition) Analyse des énoncés reconnus par le système de reconnaissance Grammaire de syntagmes minimaux (chunks) [Abney 91] 1. Identification des mots [Je/ pronom] [voudrais/verbe] [partir/verbe] [de/prep] [Paris/nom propre] 2. Conversion d’une suite de mots en chunks (patrons prédéfinis) [Je] [voudrais partir] [de Paris] 3. Construction de phrases à partir des chunks [[Je/SN [voudrais partir/SV] [de Paris/sprep]] 4. Compréhension,grâce aux concepts sémantico-pragamatiques associés à la tête lexicale du chunk (lexique du domaine de la tâche) <GC1>::= <mouvement><GC2> <mouvement>::= partir |aller <GC2>::= <localisation>|<état> <localisation>::= Paris|Lyon|Grenoble <état>::= vacances|retraite  [[mouvement: partir] [localisation:Paris]] Représentation du lexique (syntaxe et sémantique lexicale) fondée sur une structuration de traits de modalité et de valeurs données Syntaxe mot voudrais nature verbe mode: indicatif temps: présent personne: 1ere nombre: sing mot je nature pronom sous cat: personnel personne: 1ere nombre: sing Sémantique lexicale lemme vouloir concept formulation spécialisation expressif: volonté lemme partir concept mouvement spécialisation polarité locative: initiale transitionnel: + Contraintes logiques sur les traits et les valeurs Contraintes syntaxiques Concordance des temps, traitement des accords (C1) RUSynt 1 {Accord_Personne_Nombre} : pronom (Personne, Nombre) ∧ verbe (Personne, Nombre) Unification de la valeur des traits Personne et Nombre (C2) RUSynt 2 {Accord_Genre_Nombre} : article (Genre, Nombre) ∧ nom (Genre, Nombre) Contraintes entre les syntagmes (représentation simplifiée) (C3) RUSynt 3 {Phrase} : SN ∧ SV ∧ RUSynt 1 (C4) RUSynt 4 {Phrase} : SN ∧ SPrep (C5) RUSynt 5 {SV} : verbe ∧ Sprep () (C6) RUSynt 6 {Sprep} : prep ∧ SN SN: syntagme nominal SV: syntagme verbal SPrep: syntagme prépositionnel Contraintes sémantiques Contraintes entre les constituants sémantiques (sémantique relationnelle) (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: Valeur) ∧ mouvement (polarité locative: Valeur) Unification de la valeur du trait Polarité Locative (Valeur) Modèle de langage formel spécialisé Grammaire hors contexte <HC1>::= je voudrais <HC2> <HC3> <HC2>::= partir|aller <HC3>::= <HC4>|<HC5> <HC4>::= en vacances <HC5>::= de <HC6> <HC6>::= Paris|Lyon|Grenoble Modèle de langage peu flexible Nombreuses règles dues à la spécialisation Faible niveau d’abstraction Pas d’analyse linguistique profonde (traitement des ellipses, anaphores, cataphores, deixis) 5. Grammaire d’unification à émission de concepts pour la compréhension Bibliographie 6. Modalité d’évaluation Une contrainte satisfaite peut émettre un ou plusieurs nouveau(x) concept(s) (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: finale) ∧ mouvement (polarité locative: finale) Émission nouveau concept: trajet [localisation[cible]] (C7) RUSem 1 {Trajet_Partiel}: mouvement (polarité locative: initiale) ∧ mouvement (polarité locative: initiale) Émission nouveau concept: trajet [localisation[source]] Ex: (C3) ∧ (C4) ∧ (C7) Il peut arriver à Autran ? Je veux revenir à l’hôtel le plus tôt possible Un billet au départ de la gare de Lyon, s’il vous plait Demain, je partirai de la place Grenette Ils vont décoller de Lyon à midi je vais partir de l’aile nord de l’aéroport RCG - J. Dowding, B.A. Hockey, J.M. Gawron, and C. Culy. (2001). Practical issues in compiling typed unification grammars for speech recognition. In Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics, Toulouse, France. - R. Moore. (1998). Using natural language knowledge sources in speech recognition. In Proceedings of the NATO Advanced Studies Institute. - M. Rayner, B.A. Hockey, J.-M. Renders, N. Chatzichrisafis and K. Farrell. (2005). Spoken Language Processing in the Clarissa Procedure Browser. ICSI Tech Report TR-05-005. Taux d’erreur de reconnaissance - en mots: 2,02% - en concepts Couverture de la langue Taux de réutilisation des contraintes - syntaxiques - sémantiques Approche flexible Réutilisation des connaissances syntaxiques et sémantiques Description hiérarchique Grammaire formelle de reconnaissance et de compréhension pour le dialogue Une grammaire d’unification pour modéliser la réponse de l’utilisateur à 1 question Perspective: génération automatique de grammaires d’unification spécialisées [Rayner 05] Génération d’une grammaire hors contexte de reconnaissance à partir de cette grammaire [Moore 98][Dowding 01] École d’été Dialogue et Interaction- Juillet 2006- Autran