Grammaire d'Unification Sens-Texte : modularité et polarisation Sylvain Kahane François Lareau Modyco, Université Paris 10 OLST, U. de Montréal Lattice, Université Paris 7 Lattice, Université Paris 7 TALN, Dourdan, 7 juin 2005
Kahane & Lareau, TALN Introduction Formalisation de GUST basée sur GUP (GUST = Grammaire d’Unification Sens-Texte, Kahane 2001) (GUP = Grammaire d’Unification Polarisée, Kahane 2004) Architecture GUST basée sur TST (TST = Théorie Sens-Texte, Mel’čuk 1974) GUP : combinaison de structures élémentaires contrôl é e par polarisation des objets
Kahane & Lareau, TALN Plan Niveaux de représentation GUP Grammaires de bonne formation Grammaires de correspondance Interface sémantique-syntaxe Stratégie de génération (et d’analyse) Interface syntaxe-morphotopologie
Kahane & Lareau, TALN Les niveaux de représentation sémantique (graphe) syntaxique (arbre de dépendances) morphotopologique (arbre ordonné) phonologique (cha î ne) grammaires de bonne formation grammaires de correspondance
Kahane & Lareau, TALN GUP structure = objets + fonctions –graphe = nœuds, arcs + source, cible structure polarisée = objets polarisés –(P,.) = ensemble des polarités + produit –N = sous-ensemble des polarités neutres GUP : P,., N, objets, fonctions, structures élémentaires, (structure initiale)
Kahane & Lareau, TALN Système des polarités = gris = neutre absolue = blanc = contexte obligatoire = noir = saturation (Nasr 1995, Duchier & Thater 1999, Perrier 2002, Kahane 2004) polarités neutres :
Kahane & Lareau, TALN La grammaire sémantique : G sém Inventaire des sémantèmes de la langue Valence sémantique de chaque sémantème
Kahane & Lareau, TALN Un fragment de G sém ‘ pomme ’‘ pierre ’‘ deux ’ 1 ‘ manger ’ 21 ‘ deux ’ ‘ pierre ’ ‘ manger ’ ‘ pomme ’ 1 12 ‘ deux ’ ‘ pierre ’ ‘ manger ’ ‘ pomme ’ ‘ manger ’ 1 2
Kahane & Lareau, TALN La grammaire syntaxique : G synt S’assure que chaque objet est bien formé –les nœuds sont étiquetés et associés à une PdD –les arcs vont d’un nœud à un autre –les verbes ont un mode, les noms un nombre… polarité p synt S’assure que la structure est bien un arbre polarité p synt-gouv
Kahane & Lareau, TALN Un fragment de G synt structure initiale codsuj MANGER PIERRE POMME détdét pdd : Num DEUX pdd : N nbre pl pdd : V mode indic temps pr é s pers 3 nbre sg r è gles lexicales r è gles sagittalesr è gles d ’ accord r è gles grammaticales pdd : V mode pdd : V mode MANGER pdd : Num DEUX pdd : N nbre POMME pdd : N nbre sg PIERRE suj pdd : V mode indic cod pdd : V détdét pdd : N pdd : Num pdd : V mode indic temps pr é s pdd : V mode indic temps pers nbre suj détdét nbre pl pdd : Num suj pers 3 pdd : ¬ Pro suj nbre sg
Kahane & Lareau, TALN Grammaires de correspondance. A et B deux ensembles de structures G une grammaire de correspondance entre A et B A ∈ A, B ∈ B fonctionnement équatif : A et B donnés fonctionnement transductif : A donné fonctionnement génératif : rien au départ Les structures données ont des objets de polarité p G = 〇 pour que G les consomme AB G
Kahane & Lareau, TALN Fonctionnement transductif A ∈ A est donné p A (A)= et p G (A)= 〇 Puis, G consomme A et produit B p G (A)= et p G (B)= Enfin, on vérifie que B ∈ B p B (B)= 〇 Articulation : double polarisation p A -p G ( , 〇 )= « construit par A » et ( 〇, )= « construit par G » AB G
Kahane & Lareau, TALN L’interface sémantique-syntaxe ‘ pierre ’ cod suj ‘ manger ’ 2 1 pdd : V MANGER pdd : N PIERRE pdd : N ‘ pomme ’ POMME détdét 1 pdd : Num DEUX ‘ deux ’ Combiner les règles pour neutraliser p sém-synt
Kahane & Lareau, TALN L’interface sémantique-syntaxe cod suj pdd : V MANGER pdd : N PIERRE POMME détdét pdd : Num DEUX pdd : N ‘ deux ’ ‘ pomme ’‘ Pierre ’ ‘ manger ’ Introduire p sém et p synt pour l’articulation avec G sém et G synt Combiner les règles pour neutraliser p sém-synt
Kahane & Lareau, TALN L’interface sémantique-syntaxe ‘ pomme ’ ‘ Pierre ’ ‘ deux ’ 1 ‘ manger ’ 2 1 graphe sémantique cod suj pdd : V MANGER pdd : N PIERRE POMME détdét pdd : Num DEUX pdd : N ‘ deux ’ ‘ pomme ’‘ Pierre ’ ‘ manger ’ Déclencher I sém-synt pour neutraliser p sém-synt Introduire p sém-synt pour déclencher I sém-synt
Kahane & Lareau, TALN L’interface sémantique-syntaxe POMME cod suj pdd : V MANGER pdd : N PIERRE détdét pdd : Num DEUX pdd : N ‘ deux ’ ‘ pomme ’‘ Pierre ’ ‘ manger ’ Déclencher G synt pour neutraliser p synt cod suj MANGER pdd : N nbre : sg POMME détdét pdd : Num DEUX pdd : V mode : indic temps : pr é s pers : 3 nbre : sg PIERRE Déclencher I sém-synt pour neutraliser p sém-synt
Kahane & Lareau, TALN L’interface sémantique-syntaxe ‘ deux ’ ‘ pomme ’‘ Pierre ’ ‘ manger ’ De nouvelles p sém-synt à neutraliser cod suj MANGER pdd : N nbre : sg POMME détdét pdd : Num DEUX pdd : V mode : indic temps : pr é s pers : 3 nbre : sg PIERRE pdd : N Déclencher G synt pour neutraliser p synt
Kahane & Lareau, TALN Les grammèmes ‘ concomitant ’ ‘ maintenant ’ pdd : V mode : indic temps : pr é s 2 1 I sém-synt ‘ concomitant ’ 2 1 ‘ maintenant ’ G sém
Kahane & Lareau, TALN Les grammèmes ‘ deux ’ ‘ pomme ’‘ Pierre ’ ‘ manger ’ cod suj MANGER pdd : N nbre : sg POMME détdét pdd : Num DEUX pdd : V mode : indic temps : pr é s pers : 3 nbre : sg PIERRE pdd : N ‘ concomitant ’ 1 2 ‘ maintenant ’
Kahane & Lareau, TALN Interface syntaxe-morphotopologie (1) Règle de bonne formation morpho-topologique : construire un arbre de constituants et indiquer l’ordre entre les constituant ex : R1 est équivalent S GN GV S GN GV R1
Kahane & Lareau, TALN Interface syntaxe-morphotopologie (2) 3 types de règles d’interface 1) règle pour le sous-constituant tête ex : R2 dit que GV est la tête de S, càd que GV et S sont synchronisés avec le même nœud syntaxique S GV R2 pdd :V
Kahane & Lareau, TALN Interface syntaxe-morphotopologie (3) 2) règle pour le placement d’un dépendant ex : R3 dit que le sujet correspond au GN sous S S GN suj R3 pdd : N pdd : V
Kahane & Lareau, TALN Interface syntaxe-morphotopologie (4) 3) règle de « morphologie » ex : R4 dit que mange = MANGER ind, prés, 3, sg V mange R4 MANGER pdd : V mode indic temps pr é s pers 3 nbre sg
Kahane & Lareau, TALN R1 + R2 + R3 = règle LFG S GN suj R3 pdd : N pdd : V S GN GV R1 S GV R2 pdd :V S GN GV = Suj = suj pdd : N pdd : V S GN GV
Kahane & Lareau, TALN Conclusion Modèle modulaire : 3 grammaires de bonne formation, 2 grammaires d’interface Un formalisme unique Une polarité (au moins) pour chaque grammaire Deux procédures : –en largeur : saturation de chaque niveau –en profondeur : neutralisation des polarités d’articulation (possible parce que même formalisme partout) Possibilité de traiter une structure « incomplète » et de la compléter ensuite
Kahane & Lareau, TALN Merci