Grammaires de dépendance et théorie Sens-Texte (3) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours
Sylvain Kahane, TALN, 5 juillet Plan du tutoriel (rappel) Séance 1. Dépendance et fonction syntaxiques Séance 2. Théorie Sens-Texte Séance 3. Gramm. d'Unification Sens-Texte Séance 4. Analyse en gramm. de dépendance –par contraintes, CKY (et HPSG), incrémentale
Sylvain Kahane, TALN, 5 juillet Séance 3. GUST : Grammaire d'Unification Sens-Texte
Sylvain Kahane, TALN, 5 juillet Plan de la 3ème séance n Grammaires transductives et grammaires génératives n Grammaire d'Unification Sens-Texte –modules sémantique, syntaxique et morphologique n Combinaison des modules –stratégies horizontale vs. verticale –lexicalisation (lien avec TAG)
Sylvain Kahane, TALN, 5 juillet Grammaires transductives et grammaires génératives
Sylvain Kahane, TALN, 5 juillet Grammaire transductive n Une grammaire transductive entre des ens. de structures S et S' est une grammaire qui met en correspondance des éléments de S et de S' par un ens. fini de règles de correspondance Ex : modules d'un MST n Une grammaire transductive définit une correspondance entre les ensembles S et S' Une correspondance entre S et S' est équivalente à un ensemble de couples ( S,S' ) avec S in S et S' in S'
Sylvain Kahane, TALN, 5 juillet Structure produit (N)pl subj EAT (V) obj mod BEAN RED (Adj) PETER (N)sg adv OFTEN (Adv) EAT (V) obj BEAN (N)pl adv OFTEN (Adv) mod RED (Adj) subj PETER (N)sg 3,sg EAT (V) BEAN (N)pl OFTEN (Adv) RED (Adj) PETER (N)sg 3,sg arbre suite (= ordre linéaire) fonction Arbre linéairement ordonné = produit d’un arbre et d’un ordre linéaire
Sylvain Kahane, TALN, 5 juillet Supercorrespondance n Un module TST definit une supercorrespondance entre deux ensembles de structures n Une supercorrespondance est une correspondance avec pour chaque couple d'éléments en correspondance une fonction entre des partitions de ces éléments Une supercorrespondance est équivalente à un ensemble de structures produit, càd, de triplets ( S,S',ƒ ) avec S in A, S' in B et ƒ une fonction entre des partitions de S et S'
Sylvain Kahane, TALN, 5 juillet Retour sur le Premier postulat TST Postulat 1 (revisé) Une langue naturelle est (considérée comme) une supercorrespondance multivoque entre sens et textes n Phrase = structure produit (HPSG 1994) fonction entre des fragments de sens et des fragments de texte (2ème articulation)
Sylvain Kahane, TALN, 5 juillet Transductive, générative, équative n Grammaire transductive: on prend une structure et on lui en fait correspondre une autre n Grammaire générative: on génère, à partir de rien, les deux structures en correspondance n Grammaire équative: on filtre parmi les couples ceux qui se correspondent (Kahane 2000, TALN)
Sylvain Kahane, TALN, 5 juillet Grammaires génératives et supercorrespondance n La linguistique a besoin de grammaires qui définissent des (super)correspondances (par exemple, en générant des structures produit) n Grammaire de Gaifman-Hays : supercorrespondance entre arbres de dépendance et suites n Grammaires hors-contexte n Deux grammaires sont fortement équivalentes ssi elles définissent la même (super)correspondance
Sylvain Kahane, TALN, 5 juillet GUST
Sylvain Kahane, TALN, 5 juillet Les règles de correspondance (synt) comme règles génératives subj X Y Y < X d(X,Y) = -10 (V) (N) -10 subj (V) (N)
Sylvain Kahane, TALN, 5 juillet Accord et régime suj (V) 3//p,sg//n (p)n (i) Nous viendrons (ii) Pierre viendra (iii) Que tu viennes est impossible suj (V) (N,pro)nom
Sylvain Kahane, TALN, 5 juillet Dérivation -10 subj (V) (N) -5 adv (V) (Adv) -5 mod (N) (Adj) +10 obj (N) (V) BEAN (N)pl OFTEN (Adv) RED (Adj) PETER (N)sg EAT (V) EAT (V) obj BEAN (N)pl adv OFTEN (Adv) mod RED (Adj) subj PETER (N)sg 3,sg Générer un ens. de règles Les combiner par unification suj (V) 3//p,sg//n (p)n
Sylvain Kahane, TALN, 5 juillet Les règles de correspondance (sém) comme règles génératives 1 2 ‘eat’ ‘Y’ ‘X’ EAT subj obj X Y (V) (N) EAT (V) sem: ‘eat’ arg1: x arg2: y subj obj (N) sem: x (N) sem: y
Sylvain Kahane, TALN, 5 juillet Dérivation EAT (V) sem: ‘eat’ arg1: x arg2: y subj obj (N) sem: x (N) sem: y mod RED (Adj) sem: ‘red’ arg1: x (N) sem: x adv OFTEN (Adv) sem: ‘often’ arg1: x (V) sem: x BEAN (N) sem: ‘bean’ PETER (N) sem: ‘Peter’ Générer un ens. de règles Les combiner par unification
Sylvain Kahane, TALN, 5 juillet Dérivation EAT (V) sem: e ‘eat’ arg1 : x arg2 : y subj obj BEAN (N) sem: y ‘bean’ PETER (N) sem: x ‘Peter’ mod RED (Adj) sem: ‘red’ arg1 : y adv OFTEN (Adv) sem: ‘often’ arg1 : e Générer un ens. de règles Les combiner par unification
Sylvain Kahane, TALN, 5 juillet Structure produit ‘red’ (N)pl subj EAT (V)ind,present obj mod BEAN RED (Adj) PETER (N)sg adv OFTEN (Adv) 1 2 ‘eat’ ‘often’ ‘bean’ ‘Peter’ 1 1 EAT (V) sem: e ‘eat’ arg1 : x arg2 : y subj obj BEAN (N) sem: y ‘bean’ PETER (N) sem: x ‘Peter’ mod RED (Adj) sem: ‘red’ arg1 : y adv OFTEN (Adv) sem: ‘often’ arg1 : e
Sylvain Kahane, TALN, 5 juillet Les règles de correspondance (morph) comme règles génératives EAT (V)ind,present,3,sg EAT (V)ind,present,3,sg graph: eats phon: /i:ts/ eats (written) /i:ts/ (speech)
Sylvain Kahane, TALN, 5 juillet Règles sémantiques lexicales La lexicalisation par un verbe exige l'instanciation des grammèmes de mode, voix, temps Cette règle n'est pas utilisable tant que les grammèmes en question n'ont pas été instanciés PARLER (V) m, v, t sem: ‘parler’ arg1 : x arg2 : y suj iobj À (Prép) ¬sem prép (N) sem: y (N) sem: x
Sylvain Kahane, TALN, 5 juillet Règles sém. grammaticales : version opérateur (1) X (V) m, v, t passé comp suj Y X (V) p-passé, v t: ‘passé composé’ suj aux (V) m,présent Y X (V) m, v, t présent X (V) m,présent, v t: ‘présent’
Sylvain Kahane, TALN, 5 juillet Règles sém. grammaticales : version opérateur (2) PARLER (V) m, v, t sem: ‘parler’ arg1 : x arg2 : y suj iobj À (Prép) ¬sem prép (N) sem: y (N) sem: x passé comp suj aux (V) m,présent (N) sem: x PARLER (V) p-passé, v sem: ‘parler’ t: ‘passé comp’ arg1 : x arg2 : y À (Prép) ¬sem prép (N) sem: y iobj
Sylvain Kahane, TALN, 5 juillet Règles sém. grammaticales : version unification (1) X (V) p-passé, v t: ‘passé comp’ suj aux (V) m,présent Y suj passé composé PARLER (V) m, v, t sem: ‘parler’ arg1 : x arg2 : y suj iobj À (Prép) ¬sem prép (N) sem: y (N) sem: x PARLER suj aux (V) m,présent (N) sem: x PARLER (V) p-passé, v sem: ‘parler’ t: ‘passé comp’ arg1 : x arg2 : y À (Prép) ¬sem prép (N) sem: y iobj suj PARLER p-comp +
Sylvain Kahane, TALN, 5 juillet Règles sém. grammaticales : version unification (2) CHAT (N) d, n sem: ‘chat’ CHAT + défini LE (Dét) ¬sem dét X (N) n d: ‘défini’ CHAT déf LE (Dét) ¬sem dét CHAT (N) n d: ‘défini’
Sylvain Kahane, TALN, 5 juillet Locutions MONTER (V) m, v, t sem: ‘la moutarde monter au nez’ arg1 : x suj iobj À, (Prép), ¬sem (N,pro) sem: x dét loc prép dét LE, (Dét), ¬sem MOUTARDE (N) ¬sem NEZ, (N), ¬sem LA (Dét) ¬sem (i) La moutarde me monte sérieusement au nez (ii) *La moutarde forte me monte au nez
Sylvain Kahane, TALN, 5 juillet Verbes à contrôle vs. à montée ESSAYER (V) m, v, t sem: ‘essayer’ arg1 : x arg2 : y suj inf DE (Prép) ¬sem prép (V)inf sem: y suj (N) sem: x COMMENCER (V) m, v, t sem: ‘commencer’ arg1 : x suj inf À (Prép) ¬sem prép (V)inf sem: x suj (N) (i) La moutardecommence à lui monter au nez (ii) *La moutarde essaye de lui monter au nez
Sylvain Kahane, TALN, 5 juillet Verbes copules et adjectifs (i) un petit livre (ii) ce livre est petit (iii) Pierre trouve ce livre petit ÊTRE (V) m, v, t suj préd (Adj) mod TROUVER (V) m, v, t sem: ‘trouver’ arg1 : x arg2 : y suj préd mod (Adj) sem: y (N) sem: x dobj mod (N) sem: x PETIT (Adj) sem: ‘petit’ arg1 : x
Sylvain Kahane, TALN, 5 juillet Tough-movement (i) un livre facile à lire (ii) ce livre est facile à lire (iii) Pierre trouve ce livre facile à lire mod ÊTRE (V) m, v, t suj préd (Adj) mod TROUVER (V) m, v, t sem: ‘trouver’ arg1 : x arg2 : y suj préd mod (Adj) sem: y (N) sem: x dobj (N) FACILE (Adj) sem: ‘facile’ arg1 : x inf À, (Prép), ¬sem prép (V)inf sem: x dobj
Sylvain Kahane, TALN, 5 juillet Modularité et lexicalisation
Sylvain Kahane, TALN, 5 juillet (V) (N) (Adj) (N) (V) (Adv) (V)3//p,sg//n (p)n EAT (V)present sem: ‘eat’ arg1: x arg2: y subj obj (N) sem: x (N) sem: y mod RED (Adj) sem: ‘red’ arg1: x (N) sem: x adv OFTEN (Adv) sem: ‘often’ arg1: x (V) sem: x BEAN (N)pl sem: ‘bean’ PETER (N)sg sem: ‘Peter’ -10 subj-5 adv -5 mod +10 obj subj EAT (V)ind,present,3,sg graph: eats phon: /i:ts/ PETER (N)sg graph: Peter phon: /pi:te*/ BEAN (N)pl graph: beans phon: /bi:ns/ OFTEN (Adv) graph: often phon: /ofn/ RED (Adj) graph: red phon: /red/ représentation sémantique représentation syntaxique représentation morphologique représentation graphique/phonologique
Sylvain Kahane, TALN, 5 juillet Stratégies d'analyses n Deux stratégies principales: –Analyse horizontale (module par module) : < étiquetage < shallow parsing (analyse superficielle) < analyse profonde –Analyse verticale (mot par mot) : cf. grammaires lexicalisées
Sylvain Kahane, TALN, 5 juillet EAT (V)present sem: ‘eat’ arg1: x arg2: y subj obj (N) sem: x (N) sem: y mod RED (Adj) sem: ‘red’ arg1: x (N) sem: x adv OFTEN (Adv) sem: ‘often’ arg1: x (V) sem: x BEAN (N)pl sem: ‘bean’ PETER (N)sg sem: ‘Peter’ EAT (V)ind,present,3,sg graph: eats phon: /i:ts/ PETER (N)sg graph: Peter phon: /pi:te*/ BEAN (N)pl graph: beans phon: /bi:ns/ OFTEN (Adv) graph: often phon: /ofn/ RED (Adj) graph: red phon: /red/ étiquetage shallow parsing analyse profonde Analyse horizontale (V) (N) (Adj) (N) (V) (Adv) (V)3//p,sg//n (p)n -10 subj-5 adv -5 mod +10 obj subj représentation sémantique représentation syntaxique représentation morphologique représentation graphique/phonologique
Sylvain Kahane, TALN, 5 juillet EAT (V)present sem: ‘eat’ arg1: x arg2: y subj obj (N) sem: x (N) sem: y mod RED (Adj) sem: ‘red’ arg1: x (N) sem: x adv OFTEN (Adv) sem: ‘often’ arg1: x (V) sem: x BEAN (N)pl sem: ‘bean’ PETER (N)sg sem: ‘Peter’ EAT (V)ind,present,3,sg graph: eats phon: /i:ts/ PETER (N)sg graph: Peter phon: /pi:te*/ BEAN (N)pl graph: beans phon: /bi:ns/ OFTEN (Adv) graph: often phon: /ofn/ RED (Adj) graph: red phon: /red/ Analyse verticale Analyse verticale représentation sémantique représentation syntaxique représentation morphologique représentation graphique/phonologique (V) (N) (Adj) (N) (V) (Adv) (V)3//p,sg//n (p)n -10 subj-5 adv -5 mod +10 obj subj
Sylvain Kahane, TALN, 5 juillet (V) (N) (V) (V)t,3,n (N)n EAT (V)present sem: ‘eat’ arg1: x arg2: y subj obj (N) sem: x (N) sem: y -10 subj+10 obj subj EAT (V)ind,present,3,sg graph: eats phon: /i:ts/ Lexicalisation complète Lexicalisation complète
Sylvain Kahane, TALN, 5 juillet (V) (N) (V) (V)t,3,n (N)n EAT (V)present sem: ‘eat’ arg1: x arg2: y subj obj (N) sem: x (N) sem: y -10 subj+10 obj subj EAT (V)ind,present,3,sg graph: eats phon: /i:ts/ Lexicalisation complète EAT (V)present,3,sg sem: ‘eat’ arg1: x arg2: y graph: eats phon: /i:ts/ -10 subj obj +10 (N)sg sem: x (N) sem: y
Sylvain Kahane, TALN, 5 juillet Quelle lexicalisation ? n Comment lexicaliser une grammaire modulaire ? = Comment regrouper les règles de la grammaire modulaire ? = Qui de deux mots décide de leur positionnement relatif ? Quel mot décide de la distribution d'un syntagme ? …
Sylvain Kahane, TALN, 5 juillet Quelle lexicalisation ? n Qui de deux mots décide de leur positionnement relatif ? n Exemple : les arguments syntaxiques d'un verbe doivent-ils être positionnés dans la structure du verbe ? n Réponse –Oui pour les arguments canoniques –Non pour les clitiques, les mots qu-, …
Sylvain Kahane, TALN, 5 juillet Quelle lexicalisation ? n Quel mot décide de la distribution d'un syntagme ? n Exemple : quel mot contrôle le fait qu'une relative modifie un nom ? qu'une interrogative indirecte peut être l'argument d'un verbe interrogatif ? la personne à qui tu veux parler je me demande à qui tu veux parler n Réponse: le mot qu- (Kahane 2000, TAL)
Sylvain Kahane, TALN, 5 juillet Stratégie verticale (1) n Grammaires complètement lexicalisées –Grammaires catégorielles (Ajdukiewicz 1935, Bar-Hillel, Steedman, Moortgat …) –Grammaires de dépendance (Hays 1960 …) –LTAG (Joshi, Schabes 1990, Abeillé 1991…) n Obtenir une grammaire lexicalisée à partir d'une grammaire modulaire (Vijay-Shanker 1992, Kasper et al. 1995, Candito 1996 …)
Sylvain Kahane, TALN, 5 juillet Stratégie verticale (2) n Grammaire complètement lexicalisée = précompilation de la grammaire modulaire n Synthèse verticale = compilation on-line n GUST : grammaire modulaire et complètement lexicalisée dans le même formalisme –stratégie intermédiaire : groupement par chunks n Conclusion : architecture modulaire ≠ analyse/synthèse module par module