Grammaires de dépendance et théorie Sens-Texte (2) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours
Sylvain Kahane, TALN, 5 juillet Plan du tutoriel (rappel) Séance 1. Dépendance et fonction syntaxiques Séance 2. Théorie Sens-Texte Séance 3. Gramm. d'Unification Sens-Texte –grammaires transductives vs. générative –lexicalisation (et TAG) Séance 4. Analyse en gramm. de dépendance –par contraintes, CKY (et HPSG), incrémentale
Sylvain Kahane, TALN, 5 juillet Séance 2. Théorie Sens-Texte
Sylvain Kahane, TALN, 5 juillet Plan de la 2ème séance n Postulats de base de la TST n Niveaux de représentation d'une phrase –sémantique, syntaxique profond, syntaxique de surface, morphologique profond, … n Modèle Sens-Texte standard –lexique (décomposition lexic., fonctions lexicales) –modules de correspondance
Sylvain Kahane, TALN, 5 juillet Postulats de base de la théorie Sens-Texte
Sylvain Kahane, TALN, 5 juillet Théorie Sens-Texte (Introduction 1) n Fondation: Zolkovskij & Mel'cuk 1965, 1967 n Références principales: Mel'cuk, 1988, Dependency Syntax: Theory and Practice, SUNY Press. Mel'cuk et al. 1984, 1988, 1992, 1999, Dictionnaire explicatif et combinatoire du français contemporain, Vol. 1, 2, 3, 4., PUM. Mel'cuk, , Cours de morphologie générale, 5 vol., PUM/CNRS. Mel'cuk, à paraître en 2001, Communicative Organization in Natural Language, Benjamins.
Sylvain Kahane, TALN, 5 juillet Théorie Sens-Texte (Introduction 2) n La TST se distingue des grammaires syntagmatiques à plus d'un titre : –en privilégiant la sémantique sur la syntaxe –en privilégiant la synthèse sur l'analyse –en donnant une importance primordiale au lexique –en préférant une représentation syntaxique basée sur un arbre de dépendance plutôt qu'un arbre syntagmatique (conséquence des points précédant)
Sylvain Kahane, TALN, 5 juillet Premier postulat Postulat 1 Une langue naturelle est (considérée comme) une correspondance multivoque entre des sens et des textes { sens }{ textes } langue naturelle
Sylvain Kahane, TALN, 5 juillet Correspondance multivoque { sens }{ textes } ‘causer’ ‘Pierre’ ‘Marie’ ‘partir’‘pleurer’ Le départ de Marie a fait pleurer Pierre …. Le fait que Marie soit partie a provoqué les pleurs de Pierre Pierre a pleuré parce que Marie est partie Marie est partie. Pierre a pleuré.
Sylvain Kahane, TALN, 5 juillet Comparaison avec Chomsky 1957 (1) n Chomsky 1957 : décrire une langue naturelle L = décrire l'ens. des phrases acceptables de L n Mauvaise interprétation : –Phrase = suite de mots –Langage formel = ensemble de suites –Une langue naturelle ne peut en aucun cas être modélisée par un langage formel en ce sens
Sylvain Kahane, TALN, 5 juillet Comparaison avec Chomsky 1957 (2) n Meilleure interprétation : –Une phrase est un signe avec un sens (signifié) et une forme (signifiant) –Correspondance entre sens et textes = ens. de couples formés d'un sens et d'un texte correspondant = ensemble de phrases
Sylvain Kahane, TALN, 5 juillet Second postulat Postulat 2 La correspondance sens-textes est décrite par un système formel qui simule l'activité linguistique d'un locuteur natif n Un locuteur parle = transforme ce qu'il veut dire (un sens) en ce qu'il dit (un texte) n La correspondance est bidirectionnelle mais la direction de la synthèse est privilégiée n Règles de la grammaire = règles de correspondance
Sylvain Kahane, TALN, 5 juillet Troisième postulat Postulat 3 Des niveaux de représentation intermédiaires doivent être considérés : un niveau syntaxique et un niveau morphologique (structure des phrases et structure des mots) { RSynt } { RMorph } { RSem } { RPhon }
Sylvain Kahane, TALN, 5 juillet Modularité n La correspondance est complètement modulaire n La sémantique, la syntaxe et la morphologie sont trois modules de correspondance sémantique { RSynt } { RMorph } { RSem } { RPhon } syntaxe morphologie
Sylvain Kahane, TALN, 5 juillet Modularité n Pas de primauté de la syntaxe –Une Rsynt bien formée est seulement caractérisé par le fait d'être un intermédiai- re possible entre une Rsem et une RPhon –Ce n'est pas l'objet de la TST de caractériser les RSynt bien formées sémantique { RSynt } { RMorph } { RSem } { RPhon } syntaxe morphologie
Sylvain Kahane, TALN, 5 juillet Niveaux de représentation
Sylvain Kahane, TALN, 5 juillet Géométrie n RSem = graphe de relations prédicat-argument n RSynt = arbre de dépendance n RMorph = suite de mots n RPhon = suite de phonèmes module sémantique : hiérarchisation (+ choix lexicaux) module syntaxique : linéarisation
Sylvain Kahane, TALN, 5 juillet Représentation sémantique Représentation sémantique n Le cœur de la représentation sémantique est un graphe orienté dont les nœuds sont étiquetés par des sémantèmes : –sémantèmes lexicaux = sens de mots ou locutions –sémantèmes grammaticaux = sens de flexions grammaticales n Arcs = relations prédicat-argument = dépendances sémantiques
Sylvain Kahane, TALN, 5 juillet Valence sémantique n La valence sémantique est déterminé par la définition lexicographique n ‘blessureI.2 de X à Y par Z’ = ‘lésion à la partie Y du corps de X qui est causée par Z et qui peut causer une ouverture de la peau de Y, un saignement de Y, une douleur de X à Y ou la mort de X’ (sa X blessure par balle Z à la jambe Y ) n ‘W blesseI.1 X à Y par Z’ = ‘W cause une blessureI.2 de X à Y par Z’
Sylvain Kahane, TALN, 5 juillet Dépendances sém vs. synt n Actant : la rivière coule –rivière dépend syntaxiquement de coule –‘rivière’ dépend sémantiquement de ‘coule’ n Modifieur : une petite rivière –petite dépend syntaxiquement de rivière –‘rivière’ dépend sémantiquement de ‘petit’ n "mismatch" : Pierre semble malade un livre facile à lire
Sylvain Kahane, TALN, 5 juillet Repr. sém et formules logiques (1) Pierre veut vendre sa voiture bleue x,y,p,s,e,m ‘Pierre’(x) ‘voiture’(y) ‘bleu’(p,y) ‘appartenir’(s,y,x) ‘vendre’(e,x,y) ‘vouloir’(m,x,e) 1 2 ‘vouloir’ ‘voiture’ ‘appartenir’ ‘Pierre’ ‘bleu’ ‘vendre’ m e x s y p
Sylvain Kahane, TALN, 5 juillet Repr. sém et formules logiques (2) n Logique frégéenne –le sens dénote un état du monde –variables = objets du monde n Représentation sémantiques TST –sens = invariant de paraphrase –"variables" = sémantèmes n Ex : grosse fourmi, gros fumeur –‘fumeur’ = ‘personne qui fume (régulièrement)’ –‘gros fumeur’ = ‘personne qui fume (régulièrement) en grosse quantité’ une très grosse fourmi, plus grosse que mon pouce
Sylvain Kahane, TALN, 5 juillet Les composantes de la repr. sém. n La repr. sémantique est composée de : –graphe sémantique –structure référentielle –structure communicative –structure rhétorique n Mise en garde : représentation mauvais terme Dans l'esprit TST, la repr. sém. ne représente pas le sens d'un texte, mais c'est les textes qui expriment des repreprésentations sémantiques (Polguère 1990)
Sylvain Kahane, TALN, 5 juillet T R Structure communicative n Partition rhème-thème –rhème = ce qui est dit –thème = ce dont on parle ‘durer’ ‘Marie’ ‘2 semaines’ ‘malade’ La maladie de Marie a duré 2 semaines DURER suj comp cn DE 2 SEMAINES MALADIE prép MARIE
Sylvain Kahane, TALN, 5 juillet T R Marie a été malade pendant 2 semaines ETRE préd MALADE n Partition rhème-thème –rhème = ce qui est dit –thème = ce dont on parle Structure communicative ‘durer’ ‘Marie’ ‘2 semaines’ ‘malade’ PENDANT suj circ MARIE prép 2 SEMAINES
Sylvain Kahane, TALN, 5 juillet R T Structure comm. et relatives Un type lisait le livre qu'il avait acheté ‘lire’ ‘acheter’ ‘type’ 1 2 ‘livre’ 1 2 R T ‘lire’ ‘acheter’ ‘type’ 1 2 ‘livre’ 1 2 Un type avait acheté un livre qu'il lisait Un type qui avait acheté un livre le lisait R T ‘lire’ ‘acheter’ ‘type’ 1 2 ‘livre’ 1 2 Kahane & Mel'cuk 1999
Sylvain Kahane, TALN, 5 juillet Str. communicative : focalisation n Elément focalisé = élément présenté par le locuteur comme étant localement proéminent pour lui (Lambrecht 1994, Mel'cuk 2001) a. Zoé essaye de parler à la dame b. La dame, Zoé essaye de lui parler c. C'est à la dame que Zoé essaye de parler d. Zoé, c'est à la dame qu'elle essaye de parler e. Ce que Zoé essaye de faire, c'est de parler à la dame
Sylvain Kahane, TALN, 5 juillet Str. communicative et synthèse n En analyse, forte ambiguité communicative Marie m'a dit que Pierre est parti Que fait Marie ?, Qu'a dit Marie ?, Qu'a dit Marie de Pierre ?, Que fait Pierre ?, Qui a dit que Pierre est parti ?, Qui est parti ? n En synthèse, le locuteur sait de quoi il veut parler et ce qu'il veut dire D'après Marie, Pierre est parti C'est Marie qui a dit que Pierre est parti...
Sylvain Kahane, TALN, 5 juillet Repr. syntaxique profonde (1) Repr. syntaxique profonde (1) n Le cœur de la représentation syntaxique profonde est un arbre de dépendance non ordonné –dont les nœuds sont étiquetés par une lexie profonde + une liste de grammèmes profonds –dont les branches sont étiquetées par des relations syntaxiques profondes
Sylvain Kahane, TALN, 5 juillet III ESSAYER ATTR ZOÉ PARLER DAME ind,présent,actif sg,déf III BEAU ZOÉ inf,actif 1 2 ‘essayer’ ‘dame’ ‘Zoé’ ‘beau’ ‘parler’ ‘ présent ’ ‘ singulier’ ‘ défini ’ Repr. syntaxique profonde (2)
Sylvain Kahane, TALN, 5 juillet Relations syntaxiques profondes n Relations syntaxiques profondes : –relations actancielles : I, II, III, … –relation attributive : ATTR –relation coordinative : COORD Marie, Jean et Pierre : MARIE COORD JEAN COORD ET II PIERRE –relation appenditive : APPEND Naturellement, il n'a rien fait ; Où vas-tu, Zoé ?
Sylvain Kahane, TALN, 5 juillet Grammèmes profonds n Grammèmes profonds : –morphèmes grammaticaux pleins (correspondant au sémantèmes grammaticaux de la repr. sém.) ex : temps, nombre (des noms), détermination, … –grammèmes de changement de diathèse (qui expriment les différentes correspondances possibles entre arguments sém. et actants synt.) ex : voix –grammèmes de translation ex : infinitif
Sylvain Kahane, TALN, 5 juillet Lexies profondes Lexies profondes : LIVRE, POMME DE TERRE, PRENDRE LE TAUREAU PAR LES CORNES, … n Fonctions lexicales : Magn : follement amoureux, con comme un balai, grièvement blessé, … Incep : le jour se lève, la nuit tombe, l'orage éclate, la fin approche, ouvrir le feu, … n Pas de pronoms, pas de lexies vides
Sylvain Kahane, TALN, 5 juillet Représentation syntaxique de surface (1) Représentation syntaxique de surface (1) n Le cœur de la représentation syntaxique est un arbre de dépendance non ordonné –dont les nœuds sont étiquetés par une lexie de surface + une liste de grammèmes de surface –dont les branches sont étiquetées par des relations syntaxiques de surface (fonctions syntaxiques)
Sylvain Kahane, TALN, 5 juillet Représentation syntaxique de surface (2) Représentation syntaxique de surface (2) III ESSAYER ATTR ZOÉ PARLER DAME ind,présent,actif sg,déf III BEAU ZOÉ inf,actif suj inf prép mod dét iobj prép ESSAYER ZOÉ PARLER DAME ind,présent sg BEAU inf LE DE À
Sylvain Kahane, TALN, 5 juillet Représentation morphologique Représentation morphologique n Le cœur de la représentation morphologique est la suite des représentations morphologiques des mots ( = lemme + suite de grammèmes, y compris ceux d'accord et de régime ),3,sg n Structure prosodique morphologique = hiérarchie de constituants prosodiques (Gerdes & Kahane 2001) ZOÉ ESSAYER DE PARLER ind,present fém,sg inf À LE BEAU DAME fém,sgsg
Sylvain Kahane, TALN, 5 juillet Modèle Sens-Texte standard
Sylvain Kahane, TALN, 5 juillet Introduction n Modèle Sens-Texte [MST] = modèle d'une langue en TST modèle = "grammaire formelle" n MST = lexique + grammaire grammaire = modules de correspondance
Sylvain Kahane, TALN, 5 juillet Lexique n lexique d'un MST = DEC (Dictionnaire Explicatif et Combinatoire) –DEC du russe : Mel'cuk & Zolkovsky 1984 –DEC du français : Mel'cuk et al. 1984, 88, 92, 99 (université de Montréal) –le manuel : Mel'cuk, Class & Polguère 1995, Introduction à la lexicologie explicative et combin. n Entrée de DEC –zone sémantique : définition lexicographique –zone syntaxique : tableau de régime –zone de cooccurence lexicale : fonctions lexicales
Sylvain Kahane, TALN, 5 juillet Définition lexicographique (1) n La définition lexicographique est basée sur : –la paraphrase : la définition de L doit être substituable à L –la cooccurrence lexicale : les fonctions lexicales pointent sur certaines composantes de la définition
Sylvain Kahane, TALN, 5 juillet Définition lexicographique (2) BLESSURE I.2 ‘blessureI.2 de X à Y par Z’ = ‘lésion à la partie Y du corps de X qui est causée par Z et qui peut causer (I) une ouverture de la peau de Y, (II) un saignement de Y, (III) une douleur de X à Y ou (IV) la mort de X’ Sa X blessure par balle Z à la jambe Y n Une blessure peut être (I) profonde, (II) saigner, (III) faire souffrir ou (IV) être fatale.
Sylvain Kahane, TALN, 5 juillet Tableau de régime n Contrainte sur 3.1 : N désigne une arme blanche Contrainte sur 3.2 : N = balle, … n blessureI.2 de X à Y par Z
Sylvain Kahane, TALN, 5 juillet Fonctions lexicales (1) Syn : lésion Syn : coupure, écorchure; égratignure; morsure; brûlure; ecchymose; déchirure; fracture; entorse Syn : plaie; bobo “fam” personne-S 1 : blessé A 1/2 : // blessé A 1/2 +Magn: couvert, criblé [de ~s] Magn: grave, majeure, sérieuse AntiMagn: légère, mineure, superficielle // égratignure AntiBon: mauvaise, vilaine IncepMinusBon: s'aggraver; s'enflammer, s'envenimer, s'infecter Oper 1 : avoir [ART ~]; porter [ART ~]; souffrir [de ART ~] FinOper 1 : se remettre, se rétablir [de ART ~] Caus 1 Oper 1 : se faire [ART ~] LiquOper 1 : guérir [N de ART ~]
Sylvain Kahane, TALN, 5 juillet Fonctions lexicales (2) FinFunc 0 : se cicatriser, (se) guérir, se refermer essayer de LiquFunc 0 : soigner, traiter [ART ~] ; bander, panser [ART ~] CausFunc 1 : faire [ART ~] [à N] ; infliger [ART ~] [à N] // blesser [N] [avec N=Z] Caus 1 Func 1 : se faire [ART ~] ; se blesser [avec N=Z] Real 1 : (II) souffrir [de ART ~] ; (IV) succomber [à ART ~], mourir [de ART ~] AntiReal 1 : (IV) réchapper [de ART ~] Fact 0 : (I) s'ouvrir, se rouvrir; (II) saigner Fact 1 : (IV) emporter, tuer [N] Able 1 Fact 1 ( Magn) : (I) ouverte < profonde < béante; (III) cuisante, douloureuse; (IV) fatale, mortelle, qui ne pardonne pas AntiAble 1 Fact 1 ( AntiMagn) : bénigne “spéc”, sans conséquence
Sylvain Kahane, TALN, 5 juillet Modules de correspondance régime pronominalisation linéarisation prosodie accord hiérarchisation lexicalisation { RSyntP } { RSyntS } { RSem } { RMorph } module sémantique module syntaxique profond module syntaxique de surface
Sylvain Kahane, TALN, 5 juillet Module sémantique (1) n Hiérarchisation: choisir la racine de l'arbre T R i ‘X’ ‘Y’ X I Y (V)
Sylvain Kahane, TALN, 5 juillet Module sémantique (2) n Lexicalisation 1 2 ‘durer’ ‘Y’ ‘X’ DURER I II X Y (V) II PENDANT (Prep) X Y (V) (N) ATTR
Sylvain Kahane, TALN, 5 juillet Module sémantique (3) n Lexicalisation ‘X’ 1 ‘malade’ MALADE (N) (Adj) ATTR X I MALADIE (N) X (V) ETRE II MALADE I X (Adj)(N)
Sylvain Kahane, TALN, 5 juillet Module sémantique : synthèse Marie a été malade pendant 2 semaines T R ‘durer’ ‘Marie’ ‘2 semaines’ ‘malade’
Sylvain Kahane, TALN, 5 juillet Module sémantique : synthèse Marie a été malade pendant 2 semaines I (V) ETRE II MALADE (Adj) MARIE (N) PENDANT ATTR II (Prép) 2 SEMAINES (N) T R ‘durer’ ‘Marie’ ‘2 semaines’ ‘maladie’
Sylvain Kahane, TALN, 5 juillet Module sémantique (4) ‘Y’ 1 ‘X’ I X Y X est un N ou X est un V pas au passif Pierre Y part X ; le départ X de Pierre Y ‘Y’ 1 ‘X’ II X Y X est un V au passif le livre volé X par Pierre Y ‘Y’ 1 ‘X’ ATTR Y X (Y est un N et X est un Adj) ou (Y n'est un N et X est un Adv) un gros X tas Y ; très X gros Y ; partir Y vite X
Sylvain Kahane, TALN, 5 juillet Module syntaxique profond (1) n Règles nodales : –expansion des locutions –valeurs de fonction lexicale –pronominalisation n Règles sagittales : –introduction des fonctions syntaxiques –introduction des prépositions règime n Règles grammaticales analytiques : –détermination, voix, temps composé
Sylvain Kahane, TALN, 5 juillet Module syntaxique profond (2) suj X Y X est un V fini Pierre Y part X I X Y dét X Y X est un N et Y est un pronom son Y départ X I X Y cnom X DE X est un N et Y est un N le départ X de Pierre Y I X Y prép Y
Sylvain Kahane, TALN, 5 juillet Module syntaxique profond (3) mod X Y X est un V fini le gros Y tas X ATTR X Y cnom Y DE X est un N et Y est un N quantitatif un verre Y de vin X trois mètres Y de tissu X ATTR X Y prép X
Sylvain Kahane, TALN, 5 juillet Module syntaxique de surface (1) n Règles sagittales : linéarisation n Règles nodales : accord, cas
Sylvain Kahane, TALN, 5 juillet Module syntaxique de surface (2) n Linearisation Y < X d(X,Y) = -10 suj X Y (V) (N)
Sylvain Kahane, TALN, 5 juillet Module syntaxique de surface (3) n Linearisation Y < X d(X,Y) = -5 adv X Y (V) (Adv)
Sylvain Kahane, TALN, 5 juillet Module syntaxique de surface (4) n Accord subj X Y (V) (N)n X (V)3,n
Sylvain Kahane, TALN, 5 juillet Module syntaxique : synthèse Peter often eats red beans (N)pl subj EAT (V) obj mod BEAN RED (Adj) PETER (N)sg adv OFTEN (Adv)
Sylvain Kahane, TALN, 5 juillet Module syntaxique : synthèse Peter often eats red beans EAT (V) obj BEAN (N)pl mod RED (Adj) subj PETER (N)sg adv OFTEN (Adv) EAT (V) obj +10 BEAN (N)pl -5 adv OFTEN (Adv) -5 mod RED (Adj) -10 subj PETER (N)sg 3,sg
Sylvain Kahane, TALN, 5 juillet Module syntaxique : synthèse Peter often eats red beans EAT (V) obj BEAN (N)pl mod RED (Adj) subj PETER (N)sg adv OFTEN (Adv) EAT (V) BEAN (N)pl OFTEN (Adv) RED (Adj) PETER (N)sg 3,sg