Pour un système formel de description linguistique Lionel Clément - Benoît Sagot Mosaïque - lundi 14 mai 2007 Inria Futurs Labri - Université Bordeaux 1
Pour un système formel ... On est d’accord pour : Distinguer constituance et dépendance syntaxique (notion de tête, notion de fonctions grammaticales) Distinguer ordre des mots (voire la structure topologique) de la constituance Séparer syntaxe et sémantique (distinguer les variantes de valence des variantes de réalisations) Donner un rôle important au lexique: valence, contrôle, sélection
Pour un système formel ... On est d’accord pour : Un modèle de la compétence: Jugement d’acceptabilité Paraphrase Une grammaire générative : Engendre seulement phrases acceptables Minimise « distance » entre paraphrases Distinguer des propriétés distributionnelles (relation entre un élément et son contexte syntaxique) Distinguer des propriétés inter-phrastiques (relation entre deux éléments d’un paradigme syntaxique)
Pour un système formel ... Quelques points de divergence Langue / parole « Choix » lexicaux ? Structure informationnelle Place du lexique dans la grammaire Aspects calculatoires des formalismes Système de description (contrairement à un formalisme basé sur une théorie linguistique) Modulaire Monotone Déclaratif
Appareil formel proposé Opérateurs génériques: Ordre linéaire: < << > >> Constituants: C [ A B ] ; C [ A, B ] Relations, dont les arguments sont des domaines (A–>B équivaut à { !A, B } ; on peut vouloir { !A B }) Dépendance (étiquetées par un niveau et par un type): –[SynP:OBJ]–> / {SynP:Obj ….. } Niveaux possibles: SynS, SynP, Sém, Disc ; relation de correspondance inter-niveaux et domaine/constituant: Rel. paradigmatique => Rel. focus, Rel. topic –f–> , –t–> Rel. de co-référence directe (sans domaine correspondant) et indirecte (y compris le domaine associé)
Etudes de cas Disloquées (avec pronom) Passif Figement lexical structure informationnelle, liage Passif structure informationnelle, relation lexique grammaire, modularité Figement lexical Collocations, figées Contrôle dépendance syntaxique versus dépendance sémantique
Etudes de cas - Disloquée (1) Dans le fossé, sa voiture, Jean, il l’a encore mise. Relation de coréférence entre le pronom et son antécédent (non bornée, obligatoire). Dans le fossé, son cheval, Jean, il l’a encore mis. Son idée idiote, Jean, il croit pouvoir la proposer à la commission. Relation de focalisation sur l’élément extrait Jean, sa voiture, il l’a encore mise dans le fossé. Relation de topicalisation sur l’élément antéposé Sa voiture, il l’a encore mise dans le fossé, Jean. Relation d’ordre linéaire entre groupe extrait et structure « matrice » L’élément extrait n’est pas enchâssé dans la phrase matrice
Etude de cas - Disloquée (2) Objets Co-référence anaphore expression référentielle Groupe « antécédent » Groupe « phrase matrice » Marque « focus », « topic » de l’élément extrait Contraintes Pronom co-référenciel de l’antécédent (accord, catégorie, valence) Jean (*lui)l’a remarqué, que Marie est partie sans rien lui dire. Jean lui(*le) a fait part de son chagrin, à Marie. Note: la proforme peut être un déterminant (« Jean, sa mobylette, elle est trop petite, la selle. ») La relation de co-réréfence est entre propositions (le focus définit donc un domaine) Jean(i), il(i) lui donne un livre. *Jean(i) lui(i) donne un livre.
Etude de cas - Disloquée (3) Contraintes (suite) Ordre linéaire : structure informationnelle du type thème/rhème. Enchâssements croisés impossibles (stratification topologique et non en dépendances syntaxiques) Les autres contraintes: pas spécifiques aux disloquées *De son frère, il est connu que Jean peint le portrait. De son frère, Jean peint le portrait.
Etude de cas - Disloquée (4)
Etude de cas - Passif (1)
Etude de cas - Passif (2) Contrainte sur les instances
Système formel (1) Occurrences d’instances
Système formel (2) Partie cohérente et complète de modules: Graphe acyclique Portée des éléments Contenu d’instance