G-TAG : A Lexicalized Formalism for the tactical component of a generation system Laurence Danlos Université Paris 7 ALPAGE IUF
1, 2, 3 1 : 2 : 3 : Purpose ( 1, 2) Narration ( 1, 3) e1, x e1-vacuuming(x) x = Ted e2, y, z e2-rewarding (y, z) y = Marie z = x e3, u e3-napping(u) u = z duration(e3)=2h Ted a passé l'aspirateur pour être récompensé par Marie. Ensuite, il a fait une sieste pendant deux heures. Ted ran the vacuum cleaner to be rewarded by Mary. Next, he took a nap for two hours.
Outline the semantic level; the syntactic level; the post-processing module; the lexical data bases that constitute the conceptual- semantic interface; how to compute a g-derivation tree; implementations and applications of G-TAG
Semantic level g-derivation (dependency) trees Marie a récompensé Jean (Mary rewarded John)
g-derivation trees Jean a été récompensé par Marie (John was rewarded by Mary)
g-derivation trees Il a fait la sieste pendant deux heures (He took a nap for two hours)
TAG grammar for texts 1/2 Jean a passé l'aspirateur …. Ensuite, il a fait la sieste pendant deux heures. S S S (arg1) Adv S (arg2) ensuite GDT1GDT2 arg1arg2
TAG grammar for texts 2/2 Jean a poussé Marie. Elle est tombée. (John pushed Mary. She fell.) Marie est tombée. Jean l'a poussée. (Mary fell. John pushed her.) S S (arg1) S (arg2) GDT1GDT2 arg1arg2
g-derived trees post-processing module : Jean a été récompensé par Marie
Post-processing module 1/2 lexical variants Jean a passé l'aspirateur …. Ensuite, il a fait une sieste pendant deux heures. Jean a passé l'aspirateur …. Puis, il a fait une sieste pendant deux heures. ensuite --> puis (afterwards --> next) ensuite … ensuite --> ensuite … puis
Post-processing module 2/2 word order variants Jean a passé l'aspirateur …. Ensuite, il a fait une sieste pendant deux heures. Jean a passé l'aspirateur …. Il a ensuite fait une sieste pendant deux heures. ensuite GN (ne) V aux (pas) --> GN (ne) V aux (pas) ensuite
Conceptual-semantic interface Lexical data bases : underspecified g-derivation trees BL(e-rewarding (y, z)) récompenserdonner-récompenserecevoir-récompense zzzyyy arg1 arg2
BL(Narration ( 1, 2)) Jean a passé l'aspirateur. Ensuite, il a fait une sieste. Jean a passé l'aspirateur avant de faire une sieste. ensuiteavant arg1 arg2 11 11 22 22 (+T, +S)(-T, +S) (+S) (-T, +S)
BL(e-napping(x)) Jean a fait la sieste (pendant deux heures). La sieste de Jean (a duré deux heures). faire-siestesieste x x arg1 (-T, +S)(-T, -S)
1, 2, 3 1 : 2 : 3 : Purpose ( 1, 2) Narration ( 1, 3) e1, x e1-vacuuming(x) x = Ted e2, y, z e2-rewarding (y, z) y = Marie z = x e3, u e3-napping(u) u = z duration(e3)=2h Building a g-derivation tree
Narration ( 1, 3) ensuiteavant arg1 arg2 11 11 33 33 (+T, +S)(-T, +S) (+S) (-T, +S) Lexical data base for Narration:
Lexicalisation of 1 (trait +S) 1: passer-aspirateur arg1 x= Ted e1, x e1-vacuuming(x) x = Ted
Lexicalisation of 3 (trait +S) e3, u e3-napping(u) u = z duration(e3)=2h 3: faire-sieste arg10 pendant 2h u=z arg1 faire-siestesieste x x arg1 (-T, +S)(-T, -S)
Lexicalization for Narration ( 1, 3) ensuite arg1arg2 passer-aspirateur arg1 x= Ted faire-sieste arg10 pendant 2h u=z arg1
Purpose ( 1, 2) Lexical data base for Purpose : the conjunction pour (que) takes an infinitival clause pour arg1arg2 11 22 (-T, +S)
e1, x e1-vacuuming(x) x = Ted e2, y, z e2-rewarding (y, z) y = Marie z = x 1 : 2 : passer-aspirateur x récompenserdonner-récompenserecevoir-récompense zzzyyy lexical choices such as x = z be subject arg1 arg2
Syntactic functions known from the TAG grammar for 1 : –arg1 x of passer-l'aspirateur is subject in the canonical construction for 2 : –arg2 z of de récompenser is subject in the passive construction –arg2 z of donner-récompense can never be subject –arg1 z of recevoir-récompense is subject in the canonical construction
e1, x e1-vacuuming(x) x = Ted e2, y, z e2-rewarding (y, z) y = Marie z = x 1 : 2 : passer-aspirateur x=Ted récompenserdonner-récompenserecevoir-récompense z=x y=Marie [T-passif = +]
Lexicalisation of Purpose ( 1, 2) arg1 arg2 pour passer-aspirateur x=Ted récompenser z=xy=Marie 1 [T-passif = +] T-reduc-conj = +] [T-reduc = +] ()() arg1 arg2
Factorization of 1 arg1 passer-aspirateur x=Ted arg1 pour arg2 (-T, +S) ensuite arg1arg2 passer-aspirateur arg1 x= Ted (+T, +S)
Factorization of 1 ensuite arg1 arg2 arg1 passer-aspirateur x=Ted arg1 pour arg2
Final lexicalization ensuite arg1 arg2 arg1 passer-aspirateur x=Ted arg1 pour arg2 récompenser z=xy=Marie [T-passif = +] T-reduc-conj = +] [T-reduc = +] ()() arg1 arg2 faire-sieste arg10 pendant 2h u=z arg1 arg2
Referring expressions ensuite arg1 arg2 arg1 passer-aspirateur Ted number=sing, gender=masc arg1 pour arg2 récompenser Marie [T-passif = +] [T-reduc-conj = +] [T-reduc = +] ( ) number=sing, gender=masc arg1 arg2 faire-sieste arg10 pendant heure arg1 PRO number=sing, gender=masc deux 0
Main features of G-TAG the lexicon drives the generation process not only for predicates but also for discourse relations lexical choice is interleaved with syntactic realization
Implementations and applications 1995 : F. Meunier (CORA & TALANA) : FLAUBERT in ADA (three applications in technical domains) 2000 : F. Meunier et A. El Ghali (THOMSON & TALANA) : CLEF in Java in a multi-agent structure 2008 : F. Meunier (Watch-Assistance) TEXT- ELABORATOR, application with TNS (February 2009)