La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

4 juillet 2006ARC Mosaïque1 Les Grammaires dArbres Polychromes Marcel Cori Université Paris X - Nanterre CNRS - UMR MoDyCo le 4 juillet 2006.

Présentations similaires


Présentation au sujet: "4 juillet 2006ARC Mosaïque1 Les Grammaires dArbres Polychromes Marcel Cori Université Paris X - Nanterre CNRS - UMR MoDyCo le 4 juillet 2006."— Transcription de la présentation:

1 4 juillet 2006ARC Mosaïque1 Les Grammaires dArbres Polychromes Marcel Cori Université Paris X - Nanterre CNRS - UMR MoDyCo le 4 juillet 2006

2 4 juillet 2006ARC Mosaïque2 1. Introduction 2. Les arbres polychromes 3. Grammaires et composition 4. Les traits 5. Les GAP hiérarchisées

3 4 juillet 2006ARC Mosaïque3 1. Introduction 1.1 Motivations (1) Les motivations sont dabord linguistiques : définir un formalisme qui permette de rendre compte dun certain nombre de phénomènes syntaxiques. Le formalisme doit être expressif, manipulable par des linguistes. Les Grammaires darbres polychromes (GAP) : Cori et Marandin (1993, 1994, 1998).

4 4 juillet 2006ARC Mosaïque4 (2) Le modèle est un véritable modèle formel, pas un langage. La puissance en est limitée. Il y a un lien intime entre les propriétés mathématiques et les représentations linguistiques. (3) Linformatisation peut par conséquent se faire proprement.

5 4 juillet 2006ARC Mosaïque5 1.2 Une conception très superficielle de la syntaxe La syntaxe est ce qui règle les suites admissibles dans une langue donnée, lordre entre les constituants. Lordre et la domination sont liés. Mais, quand on assemble deux objets pour constituer un objet de niveau supérieur, ce nest pas nécessairement la concaténation de chaînes qui sapplique.

6 4 juillet 2006ARC Mosaïque6 1.3 Des grammaires syntagmatiques à X-barre Les grammaires syntagmatiques ne captent pas les parallélismes et les différences entre arbres: il ny a quune façon de dominer. En X-barre, il y a trois façons de dominer: noyau (ou tête), spécifieur et complément. Les grammaires darbres polychromes permettent: -daugmenter le nombre de façon de dominer (couleurs); -de distinguer la position de ce qui occupe la position (cf. Milner, 1989).

7 4 juillet 2006ARC Mosaïque7 La position noyau peut être occupée par des objets de catégories diverses: Paul est très sieste Paul a acheté des fruits, Marie a jeté les pourris Des complétives ou des infinitives peuvent être sujet : Dormir me fatigue Que la France gagne la coupe me surprendrait bien (pas de catégorie vide)

8 4 juillet 2006ARC Mosaïque8 1.4 Prise en compte de certains phénomènes Les « constituants disjoints » Pierre a, le pauvre, perdu son emploi Pierre, Marie en a pleuré, a perdu son emploi La constituance non bornée (unbounded branching) Le ski en été sur les glaciers à trois mille mètre daltitude

9 4 juillet 2006ARC Mosaïque9 2. Les arbres polychromes 2.1 Les couleurs Chaque branche a une couleur: ceci permet de distinguer entre les différentes manières de dominer. Il y a un ordre fixe entre les couleurs. On représente les couleurs par des nombres entiers. Plusieurs branches filles de même mère peuvent avoir la même couleur. Certaines couleurs peuvent ne pas être présentes.

10 4 juillet 2006ARC Mosaïque10 Le nombre de couleurs est défini au départ. (5 pour le français) Les couleurs définissent des positions génériques. Par exemple, la position 4. Une position sera définie par un couple:. Par exemple ou.

11 4 juillet 2006ARC Mosaïque Définition formelle On se donne un nombre p (de couleurs). A = est un arbre polychrome où X est lensemble des sommets, L : X Cat est la fonction détiquetage, P est un ordre strict partiel de X × X, d = est une suite de relations antiréflexives de X × X. La fermeture transitive D de (d 1 d 2 … d p ) doit vérifier les conditions de Wall (1972), ainsi que deux conditions supplémentaires.

12 4 juillet 2006ARC Mosaïque12 Conditions de Wall (i) x X y X D (condition de la racine unique) (ii) x, y X ( P P) ( D D) (condition dexclusivité) (iii) w, x, y, z X P D D P (condition de non-croisement)

13 4 juillet 2006ARC Mosaïque13 Conditions supplémentaires (iv) x, y, z X d i d j i P (condition sur lordre entre les couleurs) (v) x, y, z X d i d j y z ( P P) (ordre entre les fils dun même sommet)

14 4 juillet 2006ARC Mosaïque La question de la position noyau Chaque sommet qui a des descendants a un fils en position noyau. Il y a un seul fils en position noyau. Soit k un nombre compris entre 1 et p. (vi) x, y, z X d k d k y = z (vii) x, y X i d i z X d k

15 4 juillet 2006ARC Mosaïque Un exemple darbre polychrome La position noyau est la position 3. S 3 GV 1 3 V GN Vaux GN S Vpp GN Jean a limbécile, Paul me la dit, perdu son emploi

16 4 juillet 2006ARC Mosaïque16 SSGVGV GNGVGSGVGVGN V 3. Grammaires et composition 3.1 Arbres élémentaires Ce sont des arbres de profondeur 1, et tels quil y a au maximum une branche par couleur donnée.

17 4 juillet 2006ARC Mosaïque Grammaires Une grammaire est donnée par un couple, où Cat est un ensemble de catégories et B un ensemble (une base) darbres élémentaires. (1) On ne distingue pas un axiome: la grammaire engendre des structures syntaxiques qui ne correspondent pas nécessairement à des phrases. (2) On ne distingue pas un Vocabulaire terminal. Cela permet de traiter (p. ex.) a tous les jours mangé

18 4 juillet 2006ARC Mosaïque La composition des arbres Dans le cas général la composition se fait selon lopération de substitution, qui est associée à la dérivation pour les grammaires formelles. SS GNGVGNGV GV V GN VGN

19 4 juillet 2006ARC Mosaïque19 Mais il y a un cas particulier à considérer: Le ski en été sur les glaciers à trois mille mètres. GNGN dét NGN GP GN GN GP GNGP 3 5 GN GP 1 3 dét N

20 4 juillet 2006ARC Mosaïque20 La composition inclut un compactage. GN 3 5 GN GPGN 3 5 GN GP 3 5 dét NGPGPGP GN GP 1 3 dét N

21 4 juillet 2006ARC Mosaïque21 Le réordonnancement : respect de lordre des couleurs. V 3 4V VS34V V VS Vaux S Vpp Vaux Vpp a, Paul me la dit, perdu

22 4 juillet 2006ARC Mosaïque22 Définitions formelles Soient A = et A" = deux arbres tels que X X " =. Soient a la racine de A" et b une feuille de A. A et A" sont composables selon b ssi L(b) = L " (a). Un cas particulier se produit quand: c d k et L(c) = L (b). a A c A" b

23 4 juillet 2006ARC Mosaïque23 On écrit A = [A, b, A"]. Deux cas sont considérés: A A c b A" A" Propriétés: (1) [[A 1, b, A 2 ], b, A 3 ] = [A 1, b, [A 2, b, A 3 ]] (2) [[A 1, b, A 2 ], b, A 3 ] = [[A 1, b, A 3 ], b, A 2 ]

24 4 juillet 2006ARC Mosaïque24 Étant donnée une base darbres élémentaires B, on définit le langage darbres T(B) par: (i) A B A T(B) (i) A T(B) A B [A, b, A"] T(B). 3.4 Langage engendré par une grammaire Remarque: On peut définir un langage de mots par une GAP : - en séparant lensemble des catégories en un vocabulaire terminal et un vocabulaire non terminal; - en se donnant un axiome dans V N.

25 4 juillet 2006ARC Mosaïque25 La grammaire qui engendre a n b n c n On prend p = 4 et k = 2. Une grammaire particulière S aSbc a bc S aaabbbccc

26 4 juillet 2006ARC Mosaïque Approche intuitive a1:non GVGV a2:non INTERDIT a1:non GVGP a1:non GVGN a2:oui a1:oui GV GN a2:oui présente Paul à Marie*présente Paul Marie 4. Les traits

27 4 juillet 2006ARC Mosaïque27 Les arbres de la grammaire a1:X GV a1:non GV a2:nona2:Y a1:X GVGP a1:oui GVGN a2:oui a2:Y GN genre:G nombre:N genre:G dét N genre:G nombre:N nombre:N

28 4 juillet 2006ARC Mosaïque Les relations dinterdépendance GN genre:G nombre:N genre:G1 dét N genre:G2 nombre:N nombre:N G1G2G mascmascmasc fémfémfém indmascmasc ind fémfém

29 4 juillet 2006ARC Mosaïque29 Une relation dinterdépendance est associée à tout arbre (élémentaire ou complexe). Lorsquon compose deux arbres, on obtient une nouvelle relation dinterdépendance. Exemple: les temps composés en français V V Vpp

30 4 juillet 2006ARC Mosaïque30 Relation dinterdépendance: AAppTaT avoiravoirprésentpassé composé avoirêtreimparfaitplus que parfait êtrenilfuturfutur antérieur avoirnilpassé compprésent surcomposé plus que p.imparfait surcomposé futur ant.futur surcomposé En fait, la relation est le produit des deux relations ci- dessus.

31 4 juillet 2006ARC Mosaïque31 V V VppVpp AAApp TaT avoiravoiravoirprésentprésent surcomp avoiravoirêtreimparfaitimparfait surcomp avoiravoirnilfuturfutur surcomposé avoirêtrenil

32 4 juillet 2006ARC Mosaïque Définition formelle p est un nombre entier, k un nombre inférieur ou égal à p, Cat un ensemble de catégories, T un ensemble dattributs, E un ensemble (fini) de valeurs, un ensemble de variables. Un arbre polychrome est donné par A = où: (ii) : X P (T) (ensemble des attributs pour chaque sommet), (iii) F = {f 1,…, f m } (ensemble des variables de larbre), (iv) x t(x) : (x) E F (valeurs des traits), (v) R E m (relation dinterdépendance).

33 4 juillet 2006ARC Mosaïque33 5. Les GAP hiérarchisées 5.1 Introduction dune hiérarchie dans les grammaires (Cori et Marandin, 1998) Idée : capter les généralités. Inspirations : la hiérarchie des types de HPSG, dautres modèles utilisant lhéritage,… Les règles de la grammaire ne sont pas définies les unes indépendamment des autres.

34 4 juillet 2006ARC Mosaïque34 Arbres sous-spécifiés. La catégorie, la couleur dune branche ou certains traits peuvent ne pas être spécifiés dans les arbres élémentaires de la grammaire. Utilisation de variables (pour les traits, les catégories ou les couleurs). La relation dinterdépendance détermine les valeurs possibles pour ces variables. S 3 Y GV

35 4 juillet 2006ARC Mosaïque35 Relation dordre On définit une relation dordre entre les arbres élémentaires de la grammaire. Larbre A 2 subsume larbre A 1 quand A 1 est plus spécifié que A 2. a0:non X 3 Y Z A 2 S a0:non 3 5 a0:oui GVY A 1

36 4 juillet 2006ARC Mosaïque36 Graphe darbres En réalité, on se donne a priori le graphe darbres élémentaires qui dessine la relation dordre (graphe sans circuit). Cest ainsi quon définit une grammaire hiérarchisée. Il faut que cette grammaire soit bien hiérarchisée. En ce cas, on construit un graphe déduit dans lequel chaque arbre élémentaire hérite des spécifications de tous ses ascendants. Dans le graphe déduit la relation dordre est bien vérifiée.

37 4 juillet 2006ARC Mosaïque37 grammaire hiérarchiséegraphe déduit a0:non X 3 Y Z S 3 a0:oui GVGN S 1 3 GNGV a0:non X 3 Y Z a0:non S 3 a0:oui GVGN S a0:non 1 3 GN GV a0:oui

38 4 juillet 2006ARC Mosaïque38 Les grammaires hiérarchisées permettent dabstraire les propriétés communes à plusieurs constructions et disoler les propriétés qui distinguent les constructions. La hiérarchie permet une représentation unifiée de certaines propriétés. Ces propriétés peuvent être des propriétés diverses, par exemple des propriétés positionnelles, mais aussi des propriétés fonctionnelles.

39 4 juillet 2006ARC Mosaïque Les positions du sujet Il ny a pas de « position sujet » car le sujet peut occuper différentes positions. Le sujet canonique a0:non S 1 3 GNGV a0:oui Le sujet inversé S a0:non 3 5 GV GN a0:oui Jean aime Marie Referont un devoir tous les étudiants qui nont pas la moyenne

40 4 juillet 2006ARC Mosaïque40 Linversion locative GV a0:non a1:X 3 5 V GN a1:X S a0:non 1 3 GPGV a0:non Dans le lit de la petite fille dormait un ours Dans la cour mangeait un vagabond *Dans la cour mangeait un vagabond des pommes ?Dans la cour mangeait des pommes un vagabond

41 4 juillet 2006ARC Mosaïque41 La représentation (partielle) du sujet a0:non X 3 Y Z S 3 a0:oui GVGN GV 3 Z Y S 1 3 GNGV S 3 5 GVGN GV 1 3 proGV GV 3 5 V GN

42 4 juillet 2006ARC Mosaïque42 Conclusion Pour définir une grammaire faut-il: - définir les règles (arbres élémentaires) au niveau le plus bas, et faire ensuite des généralisations ? - déterminer les principes généraux et ensuite engendrer les règles de niveau inférieur ?

43 4 juillet 2006ARC Mosaïque43 Références Cori M. et Marandin J.-M., « Grammaires d'arbres polychromes », TAL vol. 34, n° 1, 1993, pp Cori M. et Marandin J.-M., « Polychrome Tree Grammars (PTGs) : a formal presentation », dans Current Issues in Mathematical Linguistics, C. Martin-Vide ed., Elsevier, 1994, pp Cori M. et Marandin J.-M., « Héritage de propriétés dans les grammaires d'arbres polychromes », LINX, Vol. 39, n° 2, 1998, pp Cori M., « La mathématisation des formalismes syntaxiques », LINX n° 48, 2003, pp Cori M., « Quelle formalisation pour les fonctions grammaticales ? », Colloque Les fonctions grammaticales : histoire, théories, pratiques, Tromsø, Norvège, octobre 2005, actes à paraître chez Peter Lang.


Télécharger ppt "4 juillet 2006ARC Mosaïque1 Les Grammaires dArbres Polychromes Marcel Cori Université Paris X - Nanterre CNRS - UMR MoDyCo le 4 juillet 2006."

Présentations similaires


Annonces Google