Grammaires de dépendance et théorie Sens-Texte Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours
Sylvain Kahane, TALN, 5 juillet Plan du tutoriel Séance 1. Dépendance et fonction syntaxiques Séance 2. Théorie Sens-Texte –niveaux de représentation d'une phrase –lexique, décomposition lexic., fonctions lexicales –modules de correspondance Séance 3. Gramm. d'Unification Sens-Texte –grammaires transductives vs. générative –lexicalisation (et TAG) Séance 4. Analyse en gramm. de dépendance –par contraintes, CKY (et HPSG), incrémentale
Sylvain Kahane, TALN, 5 juillet Séance 1. Dépendance et fonction syntaxiques
Sylvain Kahane, TALN, 5 juillet Plan de la 1ère séance n Caractérisation de la dépendance syntaxique –équivalence entre arbre de dépendance et arbre syntagmatique avec tête n Pourquoi faire un tutoriel sur les GD ? n Fonction syntaxique n Premières GD
Sylvain Kahane, TALN, 5 juillet Dépendance syntaxique
Sylvain Kahane, TALN, 5 juillet Historique n Tesnière 1934, 1959 Eléments de syntaxe structurale n les américains: Hays 1960, 1964, Gaifman 1965, Robinson 1970 n les russes: Zolkovsky & Mel'cuk 1964 (TST) n les tchèques: Sgall, Hajicova n les anglais: Anderson, Hudson (WG) n Syntaxe X-barre, LFG, G/HPSG, LTAG
Sylvain Kahane, TALN, 5 juillet Arbre de dépendance n Structure syntaxique: groupe vs. dépendance n Arbre de dépendance: la présence de chaque mot est légitimée par la présence d'un autre mot (son gouverneur syntaxique) le petit garçon parle à Marie parle à petitMarie garçon le
Sylvain Kahane, TALN, 5 juillet Arbres à la Gladkij n transitivité projection du nœud x = x et ses dépendants et les dépendants de ses dépendants et ainsi de suite parle à petitMarie garçon le parle à petit Marie garçon le
Sylvain Kahane, TALN, 5 juillet Arbres syntagmatiques avec têtes lexicales Sous-constituant tête ( T ) n tête ≠ gouverneur parle à petit Marie garçon le parle à petit Marie garçon le T T T
Sylvain Kahane, TALN, 5 juillet Arbres syntagmatiques avec têtes lexicales n Arbre non ordonné parle à petit Marie garçon le T T T parle àpetitMariegarçonle T T T
Sylvain Kahane, TALN, 5 juillet Arbre de dépendance vs. arbre syntagmatique dét mod labelle compte suj obl prép Marie dame sur S VP NP N Marie V compte PP P sur NP Adj D N la belle dame Marie compte sur la belle dame
Sylvain Kahane, TALN, 5 juillet Caractérisation de la dépendance n dépendance = constituant + tête n caractérisation de la tête syntaxique La tête syntaxique d'un constituant est l'élément qui détermine la valence passive de ce constituant, c'est-à-dire l'élément qui contrôle la distribution de ce constituant.
Sylvain Kahane, TALN, 5 juillet er ex : tête de la phrase n tête de la proposition = verbe fini n verbe à un temps composé ( Pierre a donné un livre à Marie ) tête = auxiliaire (Tesnière, Mel'cuk, …) –Il faudrait que Pierre ait/*a donné un livre à Marie –Pierre pense avoir donné un livre à Marie –Pierre a-t-il donné un livre à Marie ? –Pierre n'a pas donné un livre à Marie n ? tête = flexion temporelle (Infl)
Sylvain Kahane, TALN, 5 juillet Consensus et problèmes n actant (élément sous-catégorisé) n modifieur n sujet n coordination n complémenteur n déterminant
Sylvain Kahane, TALN, 5 juillet Translation de Tesnière (1) n 4 parties du discours majeures : verbe, nom, adjectif, adverbe n relations prototypiques entre pdd : –les actants du verbe sont des noms –les modifieurs du verbe sont des adverbes –les dépendants du nom sont des adjectifs –les dépendants de l'adjectif et de l'adverbe sont des adverbes
Sylvain Kahane, TALN, 5 juillet Translation de Tesnière (2) n translatif de X en Y = permet à un élément de cat X d'occuper un position pour un Y n 16 types de translatifs (4 x 4) n Ex : translatif de V en N –Pierre veut la parole –Pierre veut parler –Pierre veut que Marie parle
Sylvain Kahane, TALN, 5 juillet Translation de Tesnière (3) n ex : translatif de V en Adj –le livre volé par Pierre –la personne volant le livre n ex : translatif de N en Adj ou Adv –le livre rouge / le livre de Pierre –Pierre boit maladroitement / avec maladresse n translation vs. dérivation (ici de V en N) –manier cet outil est difficile –le maniement de cet outil est difficile
Sylvain Kahane, TALN, 5 juillet Translation et tête n Le translatif est le gouverneur du translaté : le translatif contrôle la distribution n Le translatif comme co-tête –marqueur en HPSG Il faut que Pierre parte/*part –nucléus translatif Pierre veut partir/*le départ morphologisation
Sylvain Kahane, TALN, 5 juillet Coordination (1) Pierre achète un livre et un cahier neufs n Avec tête : le premier conjoint est la tête (Mel'cuk 1988) n Problème : neufs est distributif achète livre Pierre un cahier et unneufs suj dobj dét coord conj mod-distr dét
Sylvain Kahane, TALN, 5 juillet Coordination (2) Pierre achète un livre et un cahier neufs n Avec co-têtes : les conjoints comme co-dépendants (Tesnière 1959, Hudson 1990) n Problème : accord de neufs livre Pierre un cahier et unneufs dobj dét mod dobj suj achète
Sylvain Kahane, TALN, 5 juillet Coordination (3) Pierre achète un livre et un cahier neufs n Avec co-têtes : Syntaxe X-barre, HPSG, Kahane 1997 (arbre à bulles) livre Pierre un cahier et unneufs suj dobj dét mod achète
Sylvain Kahane, TALN, 5 juillet Conclusion 1.1 n l'arbre de dépendance est un moyen d'encodage suffisant n l'arbre de dépendance est une représentation intermédiaire (surtout en TST) –il n'a pas besoin de tout encoder –en synthèse : permet de récupérer la représentation sémantique –en analyse : permet d'obtenir l'ordre des mots et les bonnes flexions
Sylvain Kahane, TALN, 5 juillet Pourquoi faire un tutoriel sur les gram. de dépendance ?
Sylvain Kahane, TALN, 5 juillet Equivalence ou pas ? n Les grammaires de dépendance et les grammaires syntagmatiques avec têtes sont formellement équivalentes n Sauf que les grammaires syntagmatiques présupposent que les syntagmes pertinents sont les projections des têtes n Nucléus verbaux n Chunks
Sylvain Kahane, TALN, 5 juillet Nucléus verbaux n extraction: la personne à qui Pierre veut parler n coordination elliptique Pierre veut parler à Marie et Paul à Anne n négation Pierre ne veut parler à personne n inversion du sujet la personne à qui veut parler Pierre suj inf veut parler à Pierre iobj Marie prép
Sylvain Kahane, TALN, 5 juillet Syntaxe de l'allemand (Gerdes & Kahane, 2001, ACL) Niemand hat diesem Mann das Buch zu lesen versprochen Niemand hat das Buch diesem Mann zu lesen versprochen Diesem Mann hat das Buch niemand zu lesen versprochen Diesem Mann hat niemand das Buch zu lesen versprochen Das Buch hat diesem Mann niemand zu lesen versprochen Das Buch hat niemand diesem Mann zu lesen versprochen hat ‘a’ suj aux iobj inf versprochen ‘promis’ zu lesen ‘de lire’ das Buch ‘le livre’ niemand ‘personne’ diesem Mann ‘à cet homme’ dobj
Sylvain Kahane, TALN, 5 juillet Chunks [A l’issue] [de la réunion] [de son cabinet,] [le président] [a déclaré] [que les combats] [qui ont débutés] [au début] [du mois] [de décembre] [ont provoqué] [la fuite] [de nombreux réfugiés.] [A [l’issue [de [la réunion [de [son cabinet]]]]]]
Sylvain Kahane, TALN, 5 juillet Chunks et superlatif jolie fille mod la plus spéc du monde sup la fille la plus jolie du monde la plus jolie fille du monde jolie fille mod la plus spéc du monde sup jolie fille mod la plus spéc du monde sup
Sylvain Kahane, TALN, 5 juillet Fonctions syntaxiques
Sylvain Kahane, TALN, 5 juillet Fonctions et dépendances Dépendance fonction Etiquetage des dépendances nécessaire pour distinguer les différents dépendants Fonction dépendance les syntagmes remplissent une fonction par rapport à une lexie arbre à la Gladkij arbre de dépendance n Tesnière : systématisation (tout mot remplit une fonction par rapport à un autre)
Sylvain Kahane, TALN, 5 juillet Fonctions vs. catégories (1) n Combien de fonctions ? Objectif : limiter le nbre de fcts et de cats –Propriété catégorielle : intrinsèque à la lexie (et indépendant de la position synt) –Propriété fonctionnelle : intrinsèque à la pos synt (et indépendant de la lexie)
Sylvain Kahane, TALN, 5 juillet Fonctions vs. catégories (2) n Deux lexies ont la même cat si comportement similaire dans toutes les pos synt n Deux pos synt ont la même fonction si comportement similaire avec toutes les lexies n Critères pour caractériser l'ens des fonctions : –deux dép d'un même mot (ds deux phr ≠) –deux dép de deux mots ≠
Sylvain Kahane, TALN, 5 juillet Dépendants d'un même mot (1) n Pierre lit le livre Pierre le lit le livre que Pierre lit n Même fonction syntaxique : –Exclusion mutuelle –Même rôle sémantique n Relations syntaxiques différentes ? –placements différents –distinction des cas (il/le/lui, qui/que)
Sylvain Kahane, TALN, 5 juillet Dépendants d'un même mot (2) n Pierre veut un bonbon Pierre veut manger Pierre veut qu'on lui donne un bonbon n Même fonction syntaxique : –Exclusion mutuelle –Même rôle sémantique –Même pronominalisation (Pierre le veut ; Que veut Pierre ?) n Pb : verbe à montée pour un infinitif
Sylvain Kahane, TALN, 5 juillet Dépendants d'un même mot (3) n Autre critère possible : coordination (Sag et al. 1985, Hudson 1988) deux syntagmes peuvent être coordonnés seulement s'ils remplissent la même fonction n Ex : Pierre veut un bonbon et manger
Sylvain Kahane, TALN, 5 juillet Dépendants de 2 mots différents (1) n Pierre compte sur Marie Pierre pose le livre sur la table Le livre est sur la table n Fonctions syntaxiques différentes : –Pronominalisation (*Pierre y compte ; Pierre y pose le livre) –Substituabilité : Pierre pose le livre sous la table / dans la boîte (complément oblique vs. complément locatif)
Sylvain Kahane, TALN, 5 juillet Dépendants de 2 mots différents (2) n Pierre compte sur Marie Pierre est aidé par Marie n Mêmes fonctions syntaxiques : –Mêmes pronominalisations (dessus lié à sur) –Même placement –Même redistribution (complément oblique)
Sylvain Kahane, TALN, 5 juillet Dépendants de 2 mots différents (3) n Pierre mange un bonbon Pierre veut un bonbon n Problème –Mêmes pronominalisations –Redistributions différentes (le bonbon est mangé par Pierre ; *le bonbon est voulu par Pierre) n Fonctions différentes ou catégories différentes pour manger et vouloir
Sylvain Kahane, TALN, 5 juillet Conclusion 1.3 n Le choix d'un ensemble de fonctions syntaxiques est lié à la fçon dont sont écrites les règles de –pronominalisation –linéarisation –redistribution –coordination
Sylvain Kahane, TALN, 5 juillet Premières grammaires de dépendance
Sylvain Kahane, TALN, 5 juillet Projectivité (1) n Lecerf 1961, Iordanskaja 1963, Gladkij 1966 n Un arbre de dépendance linéairement ordonné est projectif ssi : –deux dépendances ne se coupent jamais –aucune dépendance ne couvre la racine * *
Sylvain Kahane, TALN, 5 juillet Projectivité (2) n T est projectif ssi la projection de tout nœud forme un segment continu (Lecerf 1961) n Ordonner un arbre projectif = spécifier la position d'un nœud vis-à-vis de son gouverneur et de ses frères le petit garçon parle à Zoé ‹ ‹ › ›‹
Sylvain Kahane, TALN, 5 juillet Grammaire de Hays-Gaifman (1) n Grammaire de Hays 1960 –V = vocabulaire –C = ens de catégories lexicales –L = lexique V x C –R = ens de règles de la forme: X(Y 1 Y 2 …Y k *Y k+1 …Y n ) avec X, Y i dans C
Sylvain Kahane, TALN, 5 juillet Grammaire de Hays-Gaifman (2) n Grammaire de Hays 1960 –C = { D, N, N p, V i, V t, V tp, …} –L = { (le,D), (chat,N), (Marie,N p ), (dort,V i ), (mange,V t ), (donne,V tp ), …} –R = { D(*), N(D*), N p (*), V i (N*), V t (N*N), V tp (N*N P), …}
Sylvain Kahane, TALN, 5 juillet Grammaire de Hays-Gaifman (3) n Gaifman 1965 Equivalence entre grammaires de Hays, grammaires catégorielles de Ajduckiewicz- Bar-Hillel et grammaires de réécriture –(a,X) et X(Y 1 Y 2 …Y k *Y k+1 …Y n ) –a : Y k …Y 1 \X/Y n …Y k+1 –X Y 1 Y 2 …Y k a Y k+1 …Y n
Sylvain Kahane, TALN, 5 juillet Grammaire de Hays-Gaifman (3) Gaifman 1965, Greibach 1965 Toute grammaire de réécriture est faiblement équivalente à une grammaire dont les règles sont de la forme X a Y 1 Y 2, X a Y 1, X a n Gaifman 1965 Théorème d'équivalence forte entre les grammaires de Hays et une sous-classe de grammaires hors contexte (cf. Dikovsky & Modina, 2000, TAL)
Sylvain Kahane, TALN, 5 juillet Grammaire de Hays-Gaifman (4) n Faiblesses des grammaires de Hays-Gaifman : –pas de distinction entre les règles de bonne formation de l'arbre de dépendance (sous- catégorisation, modification, …) et les règles de linéarisation séparer X(Y 1 Y 2 …Y k *Y k+1 …Y n ) en 3 < ajouter les fonctions –pas de structure interne des catégories (structures de traits + unification) –pas de traitement pour la non-projectivité