La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Grammaires de dépendance et théorie Sens-Texte (2) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours.

Présentations similaires


Présentation au sujet: "Grammaires de dépendance et théorie Sens-Texte (2) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours."— Transcription de la présentation:

1 Grammaires de dépendance et théorie Sens-Texte (2) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours

2 Sylvain Kahane, TALN, 5 juillet 20012 Plan du tutoriel (rappel) Séance 1. Dépendance et fonction syntaxiques Séance 2. Théorie Sens-Texte Séance 3. Gramm. d'Unification Sens-Texte –grammaires transductives vs. générative –lexicalisation (et TAG) Séance 4. Analyse en gramm. de dépendance –par contraintes, CKY (et HPSG), incrémentale

3 Sylvain Kahane, TALN, 5 juillet 20013 Séance 2. Théorie Sens-Texte

4 Sylvain Kahane, TALN, 5 juillet 20014 Plan de la 2ème séance n Postulats de base de la TST n Niveaux de représentation d'une phrase –sémantique, syntaxique profond, syntaxique de surface, morphologique profond, … n Modèle Sens-Texte standard –lexique (décomposition lexic., fonctions lexicales) –modules de correspondance

5 Sylvain Kahane, TALN, 5 juillet 20015 2.1 Postulats de base de la théorie Sens-Texte

6 Sylvain Kahane, TALN, 5 juillet 20016 Théorie Sens-Texte (Introduction 1) n Fondation: Zolkovskij & Mel'cuk 1965, 1967 n Références principales: Mel'cuk, 1988, Dependency Syntax: Theory and Practice, SUNY Press. Mel'cuk et al. 1984, 1988, 1992, 1999, Dictionnaire explicatif et combinatoire du français contemporain, Vol. 1, 2, 3, 4., PUM. Mel'cuk, 1993-2000, Cours de morphologie générale, 5 vol., PUM/CNRS. Mel'cuk, à paraître en 2001, Communicative Organization in Natural Language, Benjamins.

7 Sylvain Kahane, TALN, 5 juillet 20017 Théorie Sens-Texte (Introduction 2) n La TST se distingue des grammaires syntagmatiques à plus d'un titre : –en privilégiant la sémantique sur la syntaxe –en privilégiant la synthèse sur l'analyse –en donnant une importance primordiale au lexique –en préférant une représentation syntaxique basée sur un arbre de dépendance plutôt qu'un arbre syntagmatique (conséquence des points précédant)

8 Sylvain Kahane, TALN, 5 juillet 20018 Premier postulat Postulat 1 Une langue naturelle est (considérée comme) une correspondance multivoque entre des sens et des textes { sens }{ textes } langue naturelle

9 Sylvain Kahane, TALN, 5 juillet 20019 Correspondance multivoque { sens }{ textes } 1 2 11 ‘causer’ ‘Pierre’ ‘Marie’ ‘partir’‘pleurer’ Le départ de Marie a fait pleurer Pierre …. Le fait que Marie soit partie a provoqué les pleurs de Pierre Pierre a pleuré parce que Marie est partie Marie est partie. Pierre a pleuré.

10 Sylvain Kahane, TALN, 5 juillet 200110 Comparaison avec Chomsky 1957 (1) n Chomsky 1957 : décrire une langue naturelle L = décrire l'ens. des phrases acceptables de L n Mauvaise interprétation : –Phrase = suite de mots –Langage formel = ensemble de suites –Une langue naturelle ne peut en aucun cas être modélisée par un langage formel en ce sens

11 Sylvain Kahane, TALN, 5 juillet 200111 Comparaison avec Chomsky 1957 (2) n Meilleure interprétation : –Une phrase est un signe avec un sens (signifié) et une forme (signifiant) –Correspondance entre sens et textes = ens. de couples formés d'un sens et d'un texte correspondant = ensemble de phrases

12 Sylvain Kahane, TALN, 5 juillet 200112 Second postulat Postulat 2 La correspondance sens-textes est décrite par un système formel qui simule l'activité linguistique d'un locuteur natif n Un locuteur parle = transforme ce qu'il veut dire (un sens) en ce qu'il dit (un texte) n La correspondance est bidirectionnelle mais la direction de la synthèse est privilégiée n Règles de la grammaire = règles de correspondance

13 Sylvain Kahane, TALN, 5 juillet 200113 Troisième postulat Postulat 3 Des niveaux de représentation intermédiaires doivent être considérés : un niveau syntaxique et un niveau morphologique (structure des phrases et structure des mots) { RSynt } { RMorph } { RSem } { RPhon }

14 Sylvain Kahane, TALN, 5 juillet 200114 Modularité n La correspondance est complètement modulaire n La sémantique, la syntaxe et la morphologie sont trois modules de correspondance sémantique { RSynt } { RMorph } { RSem } { RPhon } syntaxe morphologie

15 Sylvain Kahane, TALN, 5 juillet 200115 Modularité n Pas de primauté de la syntaxe –Une Rsynt bien formée est seulement caractérisé par le fait d'être un intermédiai- re possible entre une Rsem et une RPhon –Ce n'est pas l'objet de la TST de caractériser les RSynt bien formées sémantique { RSynt } { RMorph } { RSem } { RPhon } syntaxe morphologie

16 Sylvain Kahane, TALN, 5 juillet 200116 2.2 Niveaux de représentation

17 Sylvain Kahane, TALN, 5 juillet 200117 Géométrie n RSem = graphe de relations prédicat-argument n RSynt = arbre de dépendance n RMorph = suite de mots n RPhon = suite de phonèmes  module sémantique : hiérarchisation (+ choix lexicaux)  module syntaxique : linéarisation

18 Sylvain Kahane, TALN, 5 juillet 200118 Représentation sémantique Représentation sémantique n Le cœur de la représentation sémantique est un graphe orienté dont les nœuds sont étiquetés par des sémantèmes : –sémantèmes lexicaux = sens de mots ou locutions –sémantèmes grammaticaux = sens de flexions grammaticales n Arcs = relations prédicat-argument = dépendances sémantiques

19 Sylvain Kahane, TALN, 5 juillet 200119 Valence sémantique n La valence sémantique est déterminé par la définition lexicographique n ‘blessureI.2 de X à Y par Z’ = ‘lésion à la partie Y du corps de X qui est causée par Z et qui peut causer une ouverture de la peau de Y, un saignement de Y, une douleur de X à Y ou la mort de X’ (sa X blessure par balle Z à la jambe Y ) n ‘W blesseI.1 X à Y par Z’ = ‘W cause une blessureI.2 de X à Y par Z’

20 Sylvain Kahane, TALN, 5 juillet 200120 Dépendances sém vs. synt n Actant : la rivière coule –rivière dépend syntaxiquement de coule –‘rivière’ dépend sémantiquement de ‘coule’ n Modifieur : une petite rivière –petite dépend syntaxiquement de rivière –‘rivière’ dépend sémantiquement de ‘petit’ n "mismatch" : Pierre semble malade un livre facile à lire

21 Sylvain Kahane, TALN, 5 juillet 200121 Repr. sém et formules logiques (1) Pierre veut vendre sa voiture bleue x,y,p,s,e,m ‘Pierre’(x) ‘voiture’(y) ‘bleu’(p,y) ‘appartenir’(s,y,x) ‘vendre’(e,x,y) ‘vouloir’(m,x,e) 1 2 ‘vouloir’ ‘voiture’ ‘appartenir’ ‘Pierre’ 1 1 2 1 2 ‘bleu’ ‘vendre’ m e x s y p

22 Sylvain Kahane, TALN, 5 juillet 200122 Repr. sém et formules logiques (2) n Logique frégéenne –le sens dénote un état du monde –variables = objets du monde n Représentation sémantiques TST –sens = invariant de paraphrase –"variables" = sémantèmes n Ex : grosse fourmi, gros fumeur –‘fumeur’ = ‘personne qui fume (régulièrement)’ –‘gros fumeur’ = ‘personne qui fume (régulièrement) en grosse quantité’ une très grosse fourmi, plus grosse que mon pouce

23 Sylvain Kahane, TALN, 5 juillet 200123 Les composantes de la repr. sém. n La repr. sémantique est composée de : –graphe sémantique –structure référentielle –structure communicative –structure rhétorique n Mise en garde : représentation mauvais terme Dans l'esprit TST, la repr. sém. ne représente pas le sens d'un texte, mais c'est les textes qui expriment des repreprésentations sémantiques (Polguère 1990)

24 Sylvain Kahane, TALN, 5 juillet 200124 T R Structure communicative n Partition rhème-thème –rhème = ce qui est dit –thème = ce dont on parle 1 2 1 ‘durer’ ‘Marie’ ‘2 semaines’ ‘malade’ La maladie de Marie a duré 2 semaines DURER suj comp cn DE 2 SEMAINES MALADIE prép MARIE

25 Sylvain Kahane, TALN, 5 juillet 200125 T R Marie a été malade pendant 2 semaines ETRE préd MALADE n Partition rhème-thème –rhème = ce qui est dit –thème = ce dont on parle Structure communicative 1 2 1 ‘durer’ ‘Marie’ ‘2 semaines’ ‘malade’ PENDANT suj circ MARIE prép 2 SEMAINES

26 Sylvain Kahane, TALN, 5 juillet 200126 R T Structure comm. et relatives Un type lisait le livre qu'il avait acheté ‘lire’ ‘acheter’ ‘type’ 1 2 ‘livre’ 1 2 R T ‘lire’ ‘acheter’ ‘type’ 1 2 ‘livre’ 1 2 Un type avait acheté un livre qu'il lisait Un type qui avait acheté un livre le lisait R T ‘lire’ ‘acheter’ ‘type’ 1 2 ‘livre’ 1 2 Kahane & Mel'cuk 1999

27 Sylvain Kahane, TALN, 5 juillet 200127 Str. communicative : focalisation n Elément focalisé = élément présenté par le locuteur comme étant localement proéminent pour lui (Lambrecht 1994, Mel'cuk 2001) a. Zoé essaye de parler à la dame b. La dame, Zoé essaye de lui parler c. C'est à la dame que Zoé essaye de parler d. Zoé, c'est à la dame qu'elle essaye de parler e. Ce que Zoé essaye de faire, c'est de parler à la dame

28 Sylvain Kahane, TALN, 5 juillet 200128 Str. communicative et synthèse n En analyse, forte ambiguité communicative Marie m'a dit que Pierre est parti Que fait Marie ?, Qu'a dit Marie ?, Qu'a dit Marie de Pierre ?, Que fait Pierre ?, Qui a dit que Pierre est parti ?, Qui est parti ? n En synthèse, le locuteur sait de quoi il veut parler et ce qu'il veut dire D'après Marie, Pierre est parti C'est Marie qui a dit que Pierre est parti...

29 Sylvain Kahane, TALN, 5 juillet 200129 Repr. syntaxique profonde (1) Repr. syntaxique profonde (1) n Le cœur de la représentation syntaxique profonde est un arbre de dépendance non ordonné –dont les nœuds sont étiquetés par une lexie profonde + une liste de grammèmes profonds –dont les branches sont étiquetées par des relations syntaxiques profondes

30 Sylvain Kahane, TALN, 5 juillet 200130 III ESSAYER ATTR ZOÉ PARLER DAME ind,présent,actif sg,déf III BEAU ZOÉ inf,actif 1 2 ‘essayer’ ‘dame’ ‘Zoé’ 1 1 2 ‘beau’ ‘parler’ 1 1 1 ‘ présent ’ ‘ singulier’ ‘ défini ’ Repr. syntaxique profonde (2)

31 Sylvain Kahane, TALN, 5 juillet 200131 Relations syntaxiques profondes n Relations syntaxiques profondes : –relations actancielles : I, II, III, … –relation attributive : ATTR –relation coordinative : COORD Marie, Jean et Pierre : MARIE  COORD  JEAN  COORD  ET  II  PIERRE –relation appenditive : APPEND Naturellement, il n'a rien fait ; Où vas-tu, Zoé ?

32 Sylvain Kahane, TALN, 5 juillet 200132 Grammèmes profonds n Grammèmes profonds : –morphèmes grammaticaux pleins (correspondant au sémantèmes grammaticaux de la repr. sém.) ex : temps, nombre (des noms), détermination, … –grammèmes de changement de diathèse (qui expriment les différentes correspondances possibles entre arguments sém. et actants synt.) ex : voix –grammèmes de translation ex : infinitif

33 Sylvain Kahane, TALN, 5 juillet 200133 Lexies profondes Lexies profondes : LIVRE, POMME DE TERRE, PRENDRE LE TAUREAU PAR LES CORNES, … n Fonctions lexicales : Magn : follement amoureux, con comme un balai, grièvement blessé, … Incep : le jour se lève, la nuit tombe, l'orage éclate, la fin approche, ouvrir le feu, … n Pas de pronoms, pas de lexies vides

34 Sylvain Kahane, TALN, 5 juillet 200134 Représentation syntaxique de surface (1) Représentation syntaxique de surface (1) n Le cœur de la représentation syntaxique est un arbre de dépendance non ordonné –dont les nœuds sont étiquetés par une lexie de surface + une liste de grammèmes de surface –dont les branches sont étiquetées par des relations syntaxiques de surface (fonctions syntaxiques)

35 Sylvain Kahane, TALN, 5 juillet 200135 Représentation syntaxique de surface (2) Représentation syntaxique de surface (2) III ESSAYER ATTR ZOÉ PARLER DAME ind,présent,actif sg,déf III BEAU ZOÉ inf,actif suj inf prép mod dét iobj prép ESSAYER ZOÉ PARLER DAME ind,présent sg BEAU inf LE DE À

36 Sylvain Kahane, TALN, 5 juillet 200136 Représentation morphologique Représentation morphologique n Le cœur de la représentation morphologique est la suite des représentations morphologiques des mots ( = lemme + suite de grammèmes, y compris ceux d'accord et de régime ),3,sg n Structure prosodique morphologique = hiérarchie de constituants prosodiques (Gerdes & Kahane 2001) ZOÉ ESSAYER DE PARLER ind,present fém,sg inf À LE BEAU DAME fém,sgsg

37 Sylvain Kahane, TALN, 5 juillet 200137 2.3 Modèle Sens-Texte standard

38 Sylvain Kahane, TALN, 5 juillet 200138 Introduction n Modèle Sens-Texte [MST] = modèle d'une langue en TST modèle = "grammaire formelle" n MST = lexique + grammaire grammaire = modules de correspondance

39 Sylvain Kahane, TALN, 5 juillet 200139 Lexique n lexique d'un MST = DEC (Dictionnaire Explicatif et Combinatoire) –DEC du russe : Mel'cuk & Zolkovsky 1984 –DEC du français : Mel'cuk et al. 1984, 88, 92, 99 (université de Montréal) –le manuel : Mel'cuk, Class & Polguère 1995, Introduction à la lexicologie explicative et combin. n Entrée de DEC –zone sémantique : définition lexicographique –zone syntaxique : tableau de régime –zone de cooccurence lexicale : fonctions lexicales

40 Sylvain Kahane, TALN, 5 juillet 200140 Définition lexicographique (1) n La définition lexicographique est basée sur : –la paraphrase : la définition de L doit être substituable à L –la cooccurrence lexicale : les fonctions lexicales pointent sur certaines composantes de la définition

41 Sylvain Kahane, TALN, 5 juillet 200141 Définition lexicographique (2) BLESSURE I.2 ‘blessureI.2 de X à Y par Z’ = ‘lésion à la partie Y du corps de X qui est causée par Z et qui peut causer (I) une ouverture de la peau de Y, (II) un saignement de Y, (III) une douleur de X à Y ou (IV) la mort de X’ Sa X blessure par balle Z à la jambe Y n Une blessure peut être (I) profonde, (II) saigner, (III) faire souffrir ou (IV) être fatale.

42 Sylvain Kahane, TALN, 5 juillet 200142 Tableau de régime n Contrainte sur 3.1 : N désigne une arme blanche Contrainte sur 3.2 : N = balle, … n blessureI.2 de X à Y par Z

43 Sylvain Kahane, TALN, 5 juillet 200143 Fonctions lexicales (1) Syn  : lésion Syn  : coupure, écorchure; égratignure; morsure; brûlure; ecchymose; déchirure; fracture; entorse Syn  : plaie; bobo “fam” personne-S 1 : blessé A 1/2 : // blessé A 1/2 +Magn: couvert, criblé [de ~s] Magn: grave, majeure, sérieuse AntiMagn: légère, mineure, superficielle // égratignure AntiBon: mauvaise, vilaine IncepMinusBon: s'aggraver; s'enflammer, s'envenimer, s'infecter Oper 1 : avoir [ART ~]; porter [ART ~]; souffrir [de ART ~] FinOper 1 : se remettre, se rétablir [de ART ~] Caus 1 Oper 1 : se faire [ART ~] LiquOper 1 : guérir [N de ART ~]

44 Sylvain Kahane, TALN, 5 juillet 200144 Fonctions lexicales (2) FinFunc 0 : se cicatriser, (se) guérir, se refermer essayer de LiquFunc 0 : soigner, traiter [ART ~] ; bander, panser [ART ~] CausFunc 1 : faire [ART ~] [à N] ; infliger [ART ~] [à N] // blesser [N] [avec N=Z] Caus 1 Func 1 : se faire [ART ~] ; se blesser [avec N=Z] Real 1 : (II) souffrir [de ART ~] ; (IV) succomber [à ART ~], mourir [de ART ~] AntiReal 1 : (IV) réchapper [de ART ~] Fact 0 : (I) s'ouvrir, se rouvrir; (II) saigner Fact 1 : (IV) emporter, tuer [N] Able 1 Fact 1 (  Magn) : (I) ouverte < profonde < béante; (III) cuisante, douloureuse; (IV) fatale, mortelle, qui ne pardonne pas AntiAble 1 Fact 1 (  AntiMagn) : bénigne “spéc”, sans conséquence

45 Sylvain Kahane, TALN, 5 juillet 200145 Modules de correspondance régime pronominalisation linéarisation prosodie accord hiérarchisation lexicalisation { RSyntP } { RSyntS } { RSem } { RMorph } module sémantique module syntaxique profond module syntaxique de surface

46 Sylvain Kahane, TALN, 5 juillet 200146 Module sémantique (1) n Hiérarchisation: choisir la racine de l'arbre T R i ‘X’ ‘Y’ X I Y (V)

47 Sylvain Kahane, TALN, 5 juillet 200147 Module sémantique (2) n Lexicalisation 1 2 ‘durer’ ‘Y’ ‘X’ DURER I II X Y (V) II PENDANT (Prep) X Y (V) (N) ATTR

48 Sylvain Kahane, TALN, 5 juillet 200148 Module sémantique (3) n Lexicalisation ‘X’ 1 ‘malade’ MALADE (N) (Adj) ATTR X I MALADIE (N) X (V) ETRE II MALADE I X (Adj)(N)

49 Sylvain Kahane, TALN, 5 juillet 200149 Module sémantique : synthèse Marie a été malade pendant 2 semaines T R 1 2 1 ‘durer’ ‘Marie’ ‘2 semaines’ ‘malade’

50 Sylvain Kahane, TALN, 5 juillet 200150 Module sémantique : synthèse Marie a été malade pendant 2 semaines I (V) ETRE II MALADE (Adj) MARIE (N) PENDANT ATTR II (Prép) 2 SEMAINES (N) T R 1 1 2 ‘durer’ ‘Marie’ ‘2 semaines’ ‘maladie’

51 Sylvain Kahane, TALN, 5 juillet 200151 Module sémantique (4) ‘Y’ 1 ‘X’ I X Y X est un N ou X est un V pas au passif Pierre Y part X ; le départ X de Pierre Y ‘Y’ 1 ‘X’ II X Y X est un V au passif le livre volé X par Pierre Y ‘Y’ 1 ‘X’ ATTR Y X (Y est un N et X est un Adj) ou (Y n'est un N et X est un Adv) un gros X tas Y ; très X gros Y ; partir Y vite X

52 Sylvain Kahane, TALN, 5 juillet 200152 Module syntaxique profond (1) n Règles nodales : –expansion des locutions –valeurs de fonction lexicale –pronominalisation n Règles sagittales : –introduction des fonctions syntaxiques –introduction des prépositions règime n Règles grammaticales analytiques : –détermination, voix, temps composé

53 Sylvain Kahane, TALN, 5 juillet 200153 Module syntaxique profond (2) suj X Y X est un V fini Pierre Y part X I X Y dét X Y X est un N et Y est un pronom son Y départ X I X Y cnom X DE X est un N et Y est un N le départ X de Pierre Y I X Y prép Y

54 Sylvain Kahane, TALN, 5 juillet 200154 Module syntaxique profond (3) mod X Y X est un V fini le gros Y tas X ATTR X Y cnom Y DE X est un N et Y est un N quantitatif un verre Y de vin X trois mètres Y de tissu X ATTR X Y prép X

55 Sylvain Kahane, TALN, 5 juillet 200155 Module syntaxique de surface (1) n Règles sagittales : linéarisation n Règles nodales : accord, cas

56 Sylvain Kahane, TALN, 5 juillet 200156 Module syntaxique de surface (2) n Linearisation Y < X d(X,Y) = -10 suj X Y (V) (N)

57 Sylvain Kahane, TALN, 5 juillet 200157 Module syntaxique de surface (3) n Linearisation Y < X d(X,Y) = -5 adv X Y (V) (Adv)

58 Sylvain Kahane, TALN, 5 juillet 200158 Module syntaxique de surface (4) n Accord subj X Y (V) (N)n X (V)3,n

59 Sylvain Kahane, TALN, 5 juillet 200159 Module syntaxique : synthèse Peter often eats red beans (N)pl subj EAT (V) obj mod BEAN RED (Adj) PETER (N)sg adv OFTEN (Adv)

60 Sylvain Kahane, TALN, 5 juillet 200160 Module syntaxique : synthèse Peter often eats red beans EAT (V) obj BEAN (N)pl mod RED (Adj) subj PETER (N)sg adv OFTEN (Adv) EAT (V) obj +10 BEAN (N)pl -5 adv OFTEN (Adv) -5 mod RED (Adj) -10 subj PETER (N)sg 3,sg

61 Sylvain Kahane, TALN, 5 juillet 200161 Module syntaxique : synthèse Peter often eats red beans EAT (V) obj BEAN (N)pl mod RED (Adj) subj PETER (N)sg adv OFTEN (Adv) EAT (V) BEAN (N)pl OFTEN (Adv) RED (Adj) PETER (N)sg 3,sg


Télécharger ppt "Grammaires de dépendance et théorie Sens-Texte (2) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours."

Présentations similaires


Annonces Google