Grammaires de dépendance et théorie Sens-Texte (4) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours.

Slides:



Advertisements
Présentations similaires
CONCEPTION DES BASES DE DONNÉES: modèle entités-associations
Advertisements

Les algorithmes arithmétiques
Les situations d enseignement Les m é thodes d enseignement L entr é e en formation Les ouvrages - supports d enseignement Un enseignement diff é renci.
Chap 1 Grammaires et dérivations.
Systèmes d’information
Architecture et modularité du modèle L'exemple de GUST et des grammaires de correspondance polarisées Sylvain Kahane Modyco, Université Paris.
Théories, formalismes, modèles Sylvain Kahane Modyco, Université Paris 10 - Nanterre Mosaïque, Paris, 1/12/2006.
Introduction Formalisation de GUST basée sur GUP (GUST = Grammaire d’Unification Sens-Texte, Kahane 2001) (GUP = Grammaire d’Unification Polarisée, Kahane.
Abdelkader Heni FUNDP Syntaxe et sémantique Abdelkader Heni FUNDP
1 Comment préparer un plan Document No. 2.1 Gestion des activités conjointes de lutte contre la tuberculose et le VIH: cours de formation pour responsables.
ABF Améliorer nos formations pour une microfinance plus sociale.
Empileur / dépileur de palettes « Multitech » (ERM)
Développement d’application avec base de données Semaine 3 : Modifications avec Entité Framework Automne 2015.
MSN 21 Représenter des figures planes à l’aide de croquis (triangle, carré, rectangle, cercle) Le croquis est à considérer comme support de réflexion Reconnaître.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 5 Support de cours rédigé par Bernard COFFIN Université.
Des outils pour penser l’enseignement et l’apprentissage Notion d’O.M. : organisation mathématique ponctuelle Le modèle praxéologique Que devront savoir,
Prendre des notes en classe: Savoir écouter, comprendre et écrire Part 1.
Stratégie nationale du DEVELOPPEMENT DURABLE DU SPORT (SNDDS) Mission Sport et Développement Durable (SDD)
Les relatives infinitives ou la construction d’un inobservable Sylvain Kahane Modyco, Université Paris 10 Lattice, Université Paris 7 COLDOC, Université.
Maths en Jean : Nager dans le brouillard. Présentation du sujet Une personne part du bord de la plage et nage 500 mètres en ligne droite dans une direction.
Ceci est la date Ceci est le titre de la présentation Ceci est le sous-titre PNAC Les titres sont normalement courts mais peuvent tenir sur deux lignes.
Chap.V RSA. I. Rappels Mathématiques La congruence Définition 1 a et b sont congrus modulo n s’ils ont même reste par la division par n. On note a≡b[n]
G. Botti Service de l ’Information Médicale Pr M. Fieschi Hôpital Timone-adultesMarseille le 13 novembre 2000 Problématique du codage Langage, communication,
 PNF BTS maintenance des véhicules (lycée Diderot Paris 18 mars 2016) 1 PNF BTS maintenance des véhicules lycée Diderot Paris - 18 mars 2016 LE DEVIS.
La vidéo en classe de fle. La vidéo est un support attractif. Son utilisation, suppose une variation des exercices proposés, afin d’éviter des habitudes.
Introduction à la Sociologie Présentation des séances de Travaux Pratiques UNamur, Année académique
GRAMMAIRE À BASE SÉMANTIQUE Notions d’argument et de prédicat Anna Grigowicz Institut d’Etudes Romanes Université de Silésie.
Les méthodes de tests Les grands principes pour réaliser des tests efficaces.
Grammaire d'Unification Sens-Texte : modularité et polarisation Sylvain Kahane François Lareau Modyco, Université Paris 10 OLST, U. de Montréal Lattice,
Pourquoi Les essais d’écriture : pourquoi ? Les essais d'écriture sont un atout pour la réussite scolaire de tous les élèves.
Séminaire national STMG des 17 et 18 janvier CNAM 1 Séminaire national STMG Atelier « Programme Gestion Finance » Ressources pour le thème 1 Scénarios.
Analyse des tâches en ergonomie
TP CARTOGRAPHIE TP 3 DE LA CARTE TOPOGRAPHIQUE A LA CARTE GEOLOGIQUE
Master 2 Entrepreneuriat International Option Gestion des Risques L’APPRECIATION DES PLUS OU MOINS VALUES LATTENTES, LES ECARTS DE CONSOLIDATION ET D’ACQUISITIONS.
Un projet collaboratif « de Clou à Clou » L'ENT au service de la pédagogie de la culture / faire vivre une artothèque par l'ENT Projet cofinancé par l'Union.
Introduction à la Programmation Orientée Objet H.GATI.
Thème TIPE 2016 Structures : organisation, complexité, dynamique. L'adéquation du sujet choisi par l'étudiant au thème de l'année s'opérera par l'une ou.
METHODE DES CHAÎNONS Méthode permettant d’implanter des postes de travail dans les usines ou entrepôts. Optimisation recherchée Gain sur le temps de fabrication.
Formation à l’utilisation de K-Sup V5 février 2009 CRISI - COM.
Grammaires de dépendance et théorie Sens-Texte Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours.
L’accueil du nouveau-né en salle de naissance: implications de l’instauration de la méthode du peau à peau. Anne-Sophie Van Acker Anne-Sophie Van Acker.
19 avenue Trudaine PARIS Tél. : +33 (0) Fax : +33 (0) site : Principaux résultats.
Rappel de la méthode :  Choisir un Etat de la technique le plus proche.  Définir le problème technique à résoudre à partir de cet Etat de la technique.
Actants et modifieurs : syntaxe ou sémantique ? Sylvain Kahane Rhapsodie, 17 novembre 2009.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 7 Support de cours rédigé par Bernard COFFIN Université.
GRAFCET Chaîne d’information Principes généraux Le GRAFCET
Objectif ? Comprendre, connaître, restituer Etre capable de REPRODUIRE des schémas, décrire des concepts, expliquer, définir… Mais aussi et le plus souvent.
Chapitre 2 Résolution de Programmes Linéaires. La méthode graphique Cette méthode est simple et s’applique à des problèmes de programmation linéaire à.
1 A. Cornuéjols Introduction à l’intelligence artificielle Introduction à l’Intelligence Artificielle (Cours n°2) Recherche non informée dans les graphes.
Profilage de textes Pierre Luc Carrier IFT6010. Problèmes typiques Catégorisation de documents Sujet Type (roman, texte journalistique, …) Niveau de langue.
On the analysis of CMMN expressiveness: revisiting workflow patterns Renata Carvalho Hafedh Mili.
Modèle de présentation Transition énergétique Ce modèle est celui de la présentation du rapport d’atelier lors de la plénière du 8 février à Lyon. La durée.
UQÀM DDL-8430 didactique de la grammaire Analyse de matériel didactique Nouvelle grammaire pratique : 2ème année du 1 er cycle du secondaire Myriam Laporte.
De la théorie Sens-Texte à une grammaire d'unification Sylvain Kahane Lattice, Université Paris 7 EHESS, 30 mars 2001.
Mesures de tendance centrale et mesures de dispersion.
Les signes grammaticaux dans l’interface sémantique-syntaxe d’une grammaire d’unification Sylvain Kahane Lattice, Paris 7 / Paris 10 TALN 2003, Batz-sur-mer.
Présenté par  Samira BELHORMA  Imane ZEHHAF. Introduction I. Définitions II. Quand et comment évaluer une compétence? III. Le contexte d’évaluation.
Étude des émissions diffuses avec l’expérience H.E.S.S. Tania Garrigoux.
Paramètres S Rappels de théorie des circuits
Médias éducatifs : modèles théoriques des médias et représentations d’étudiants et d’enseignants Un levier pour comprendre et faire évoluer les pratiques.
Les paradigmes psychologiques d’enseignement-apprentissage.
1 UNIX AVANCE Yves PAGNOTTE – Janvier – PROCESSUS ET RESSOURCES.
PARTIE 2 : LE PROJET.
AUTOMATISME Chapitre 2: Le GRAFCET.
Compétences langagières II séance du 9 / 20 mai 2016.
Etude de cas P ROFESSEUR :D R S ÉLI APEDOME P ROFESSEUR :D R S ÉLI APEDOME INTRODUCTION A LA GESTION DES AFFAIRES ADM1700 A.
Un projet pour tous, un engagement pour chacun Cette épreuve de « compte est bon » permet à tous les élèves, quel que soit leur compétence, de participer.
*Lycée qualifiant Salaheddine al ayoubi-Taourirt 1 L.Q. SalaheddineElAyoubi- Taourirt
Grammaires de dépendance et théorie Sens-Texte (3) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours.
Principes de programmation (suite)
Transcription de la présentation:

Grammaires de dépendance et théorie Sens-Texte (4) Sylvain Kahane Lattice, Université Paris 7 TALN, 5 juillet 2001, Tours

Sylvain Kahane, EHESS, 30 mars Plan du tutoriel (rappel) Séance 1. Dépendance et fonction syntaxiques Séance 2. Théorie Sens-Texte Séance 3. Gramm. d'Unification Sens-Texte Séance 4. Analyse en gramm. de dépendance

Sylvain Kahane, EHESS, 30 mars Séance 4. Analyse en grammaire de dépendance

Sylvain Kahane, EHESS, 30 mars Plan de la 4ème séance n Analyse par contraintes n Analyse CKY –comparaison avec HPSG n Analyse incrémentale –garden-path et cognition –analyseur à pile –ambiguïtés –limitation du flux n Conclusion

Sylvain Kahane, EHESS, 30 mars Analyse par contraintes

Sylvain Kahane, EHESS, 30 mars Analyse par contraintes le boucher sale la tranche A/V N/V D/Cl/ND/Cl mod› obj› ‹obj det ‹suj ‹mod obj ‹det obj ‹det ‹obj det déclencher toutes les règles filtrer

Sylvain Kahane, EHESS, 30 mars Analyse par contraintes le boucher sale la tranche A V NClD mod› ‹suj ‹det‹obj déclencher toutes les règles filtrer

Sylvain Kahane, EHESS, 30 mars Analyse par contraintes le boucher sale la tranche V N NDD obj› ‹suj ‹det déclencher toutes les règles filtrer

Sylvain Kahane, EHESS, 30 mars Analyse par contraintes n Maruyama 1990, Duchier 1999, Blache 1998 n Avantage des grammaires de dépendance : on peut considérer une structure qui contient toutes les structures acceptables après filtrage

Sylvain Kahane, EHESS, 30 mars Méthodes probabilistes n Règles pondérées : poids entre 0.1 et 1 n Chaque dépendance reçoit le poids de la règle qui la valide n Score d'un arbre = produit du poids des dépendances n Menzel & Schröder 1998 n Eisner 1996, Collins 1997

Sylvain Kahane, EHESS, 30 mars Analyse CKY

Sylvain Kahane, EHESS, 30 mars Cocke-Kasami-Younger le boucher sale la tranche n Kasami 1963, Younger 1967 n Analyse montante : identifier les segments analysable en allant des plus petits aux plus grands Temps en O( n 3 )

Sylvain Kahane, EHESS, 30 mars Analyse CKY (1) le boucher sale la tranche [ i, j,X] : segment du i -ème au j -ième mot de tête X n Segments de longueur 1 : [1,1,D], [1,1,Cl], [2,2,N], [2,2,V] …, [5,5,N], [5,5,V] n Segments de longueur 2 : [1,2,N], [1,2,V], [2,3,N], [2,3,V] …, [4,5,N], [4,5,V]

Sylvain Kahane, EHESS, 30 mars Analyse CKY (2) n [1,1,D] + [2,2,N] +  [1,2,N] [ i, j,X] + [ j+1, k,Y] +  [ i, k,X] [ i, j,X] + [ j+1, k,Y] +  [ i, k,Y] Une phrase de longueur n est reconnue si on obtient [1, n,V] (N) (D) -10 dét (Y) (X) + r (Y) (X) - r

Sylvain Kahane, EHESS, 30 mars Complexité en temps Construire les segments de longueur k : C 2 ( n-k ) k couples ( [ i, j,X], [ j+1, i+k-1,Y] ) R règles pour les combiner Construire tous les segments : somme sur k = O( n 3 C 2 R)

Sylvain Kahane, EHESS, 30 mars Améliorations de l'algorithme n 3 améliorations : –placement des co-dépendants –prise en compte de la sous-catégorisation (+ comparaison avec HPSG) –non-projectivité

Sylvain Kahane, EHESS, 30 mars Placement des co-dépendants n Le placement des co-dépendants est géré par le trait de position dans les règles Remplacer [ i, j,X] par [ i, j,X, p, q ] avec : –p position du dernier dépendant à gauche –q position du dernier dépendant à droite Ex : la tranche [4,4,Cl, 0, 0 ] + [5,5,V, 0, 0 ] +  [4,5,V, -4, 0 ] (V) (Cl) -4 dobj

Sylvain Kahane, EHESS, 30 mars Sous-catégorisation (1) n Ajouter la liste de sous-catégorisation Ex : la tranche [4,4,Cl, Ø ] + [5,5,V, {suj,dobj} ] +  [4,5,V, {suj} ] (comparer avec Head-Daughter Schema d'HPSG) Une phrase de longueur n est reconnue si on obtient [1, n,V, Ø ] n On peut voir HPSG comme une version procédurale orientée vers l'analyse CKY d'une grammaire de dépendance (V) (Cl) -4 dobj

Sylvain Kahane, EHESS, 30 mars Sous-catégorisation (2) n Remplacer la liste de sous-cat par la règle lexicalisée Ex : la tranche [4,4, ] + [5,5, ] +  [4,5, ] n Principe de localité TRANCHER (V)present suj dobj (N) LUI (N,pro)acc (N) TRANCHER (V)present suj (N) (V) (N,pro)acc -4 dobj

Sylvain Kahane, EHESS, 30 mars Non projectivité n Règles de "lifting" permettant de remonter un élément sur un ancêtre de son gouverneur : ajouter la liste des éléments liftés (cf. Slash en HPSG) n Variante : garder en mémoire la description de d'autres nœuds que la tête n Si le nombre d'éléments mémorisables est borné, l'algo reste polynomial

Sylvain Kahane, EHESS, 30 mars CKY et incrémentalité n CKY est strictement montant : une fois qu'un élément a été combiné avec son gouverneur, on ne peut plus le combiner avec un dépendant Ex : Le garçon que j'ai rencontré la semaine dernière est étudiant n Conclusion : CKY est simple, mais psycholinguistiquement non motivé

Sylvain Kahane, EHESS, 30 mars Algorithme d'Earley n Earley 1970, Lombardo 1996 Algorithme descendant en O( n 3 ) n Plutôt incrémental, mais oblige à anticiper, dès le premier mot, sur la chaîne complète de ses ancêtres dans l'arbre n Pas adapté aux langages ambigus et donc aux langues naturelles Ex : Où penses-tu que Marie a l'intention d'aller ? (un V peut subordonnner un V qui peut subordonner un V qui …)

Sylvain Kahane, EHESS, 30 mars Analyse incrémentale

Sylvain Kahane, EHESS, 30 mars Analyse incrémentale et choix (1) n Analyse incrémentale = analyse qui se développe au fur et à mesure de la lecture n Traitement de l'ambiguïté : lorsqu'on a le choix entre deux regles, on peut –choisir une des deux règles et revenir en arrière en cas d'échec –mener en parallèle les deux analyses n Analyse incrémentale stricte = analyse incrémentale sans retours en arrière

Sylvain Kahane, EHESS, 30 mars Modèle cognitif n Les humains analysent au fur et à mesure de la réception n Dans certains cas d'ambiguïté, les humains font des retours en arrière (garden-paths) (i) Le diplomate russe reconduit à la frontière un espion international (ii) Le diplomate russe reconduit à la frontière est un espion international Objectif : simuler l'analyse humaine et faire des choix quand un humain en fait ( reconduit : ambiguïté structurale majeure)

Sylvain Kahane, EHESS, 30 mars Analyseur à pile On laisse de côté la question de l'ambiguïté pour l'instant Garder en mémoire dans une pile les descriptions de mots Symboles de pile : [X, ±, p, q] –X = catégorie du mot –± = ± gouverné –p = position du dernier dépendant à gauche –q = position du dernier dépendant à droite (pas de sous-catégorisation pour l'instant) n Relier les mots par des opérations sur la pile

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 0 : initialisation –curseur à gauche –pile vide le boucher sale la tranche

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 1 le boucher sale la tranche [D ] Règle : le  LE (D)masc,sg D

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 2 le boucher sale la tranche D [D ] N [N ] Règle : boucher  BOUCHER (N,masc)sg

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 3 le boucher sale la tranche ND ‹det Règle : (N) (D) -10 dét [D ] [N ]

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 3 le boucher sale la tranche ND ‹det Règle : (N) (D) -10 dét [N ]

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 4 le boucher sale la tranche ND ‹det [N ] A [A ] Règle : sale  SALE (Adj)masc,sg

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 5 le boucher sale la tranche AND mod› ‹det Règle : (A) (N) +5 mod [N ] [A ]

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 5 le boucher sale la tranche AND mod› ‹det [N ] Règle : (A) (N) +5 mod [A ]

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 6 le boucher sale la tranche AND mod› ‹det [Cl ] Règle : la  LUI (Cl)acc,fém,sg Cl [N ] [A ]

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 7 le boucher sale la tranche ANClD mod› ‹det Règle : tranche  TRANCHER (V)ind,prés,3,sg V [Cl ] [N ] [A ] [V ]

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 8 le boucher sale la tranche A V NClD mod› ‹det ‹obj [Cl ] [N ] [A ] [V ] Règle : (V) (Cl) -4 obj

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 8 le boucher sale la tranche A V NClD mod› ‹det ‹obj [N ] [A ] [V ] Règle : (V) (Cl) -4 obj

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 9 le boucher sale la tranche A V NClD mod› ‹det ‹obj [N ] [A ] Règle : dépilement d'un élément gouverné [V ]

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 9 le boucher sale la tranche A V NClD mod› ‹det ‹obj [N ] Règle : dépilement d'un élément gouverné [V ]

Sylvain Kahane, EHESS, 30 mars Analyseur à pile n Etape 10 le boucher sale la tranche A V NClD mod› ‹suj ‹det ‹obj Règle : (V) (N) -10 suj [N ] [V ]

Sylvain Kahane, EHESS, 30 mars YES Analyseur à pile n Etape 10 le boucher sale la tranche A V NClD mod› ‹suj ‹det ‹obj Règle : (V) (N) -10 suj [V ]

Sylvain Kahane, EHESS, 30 mars Transitions de l'analyseur (1) (V) (N) -10 suj Transition: n Ne rien lire n Remplacer par n Produire suj [V q ] [N - p' q' ] [V - p q ]

Sylvain Kahane, EHESS, 30 mars Transitions de l'analyseur (2) n Quatre types de transition –Transition de stockage : lire un nœud, l'empiler et le produire –Transition de liage : produire une dépendance < Poids négatif (gouverneur à droite) : supprimer la deuxième case de la pile < Poids positif (gouverneur à gauche) : indiquer que le nœud de la première case est gouverné –Transition de déstockage : supprimer la première case si le nœud est gouverné

Sylvain Kahane, EHESS, 30 mars Transducteur n L'analyseur construit un arbre projectif –tous les nœuds sont gouvernés sauf un –le dernier nœud entré est le premier sorti (  projectivité + acyclicité) n Beaucoup plus simple de verifier qu'un graphe est un arbre projectif que de vérifier que c'est un arbre

Sylvain Kahane, EHESS, 30 mars Variantes et améliorations (1) n Mettre dans chaque case un chunk (analyseur en flux de Vergne) n Prendre en compte la sous-catégorisation –mettre dans chaque case un nœud et sa valence (Nasr 1995, 96 ; Kahane 2000 ; grammaires catégorielles Adjukiewicz-Bar-Hillel) –mettre un lien potentiel dans chaque case (Link Grammars, Sleator & Temperley 1993) (pas de distinction entre actants et modifieurs)

Sylvain Kahane, EHESS, 30 mars Variantes et améliorations (2) n Traitement de la non-projectivité –garder plus d'un mot en mémoire dans une case (Nasr 1996 ; Kahane 2000) –autoriser des règles de transition permettant d'accéder à des cases plus profondes (Kahane 1996) –ajouter un trait slash la personne à qui je veux parler

Sylvain Kahane, EHESS, 30 mars Ambiguïtés (1) n Ambiguïté (locale) = plusieurs règles peuvent s'appliquer n 1ère technique : choisir une règle et revenir en arrière en cas d'échec et choisir une autre règle  exponentiel dans le pire des cas Pour éviter le problème : –faire un seul choix (traitement linéaire) –mémoïsation : conserver en mémoire les analyses déjà faite pour ne pas les refaire (Link Grammars : compléxité en O( n 3 ))

Sylvain Kahane, EHESS, 30 mars Ambiguïtés (2) n 2ème technique : mener en parallèle les différents choix  exponentiel dans le pire des cas Pour éviter le problème : –dupliquer la pile à chaque ambiguïté et factoriser les opérations effectuées plusieurs fois (pile à structure de graphe : Tomita 1988, Nasr 1996) n “3ème technique” : éviter de proposer des choix inutiles

Sylvain Kahane, EHESS, 30 mars Ambiguïté (3) n Point de vue linguistique et cognitif : il existe des situation où un locuteur fait des choix (garden-path) et d'autres où il n'en fait pas –parler à Marie, parler de Jean, parler à Marie de Jean –Le diplomate reconduit à la frontière …. Conséquence : il faut travailler au niveau de la grammaire et pas seulement au niveau des algos d'analyse

Sylvain Kahane, EHESS, 30 mars Flux et complexité n Flux = nombre de dépendances liant un mot à gauche à un mot à droite n Le flux des phrases d'un langue naturelle est borné (limitations mémorielles)  Le nombre de cases dans la pile est borné  Le nombre de contenu de pile est fini  Equivalence avec un automate fini  Analyse en temps linéaire

Sylvain Kahane, EHESS, 30 mars Conclusion n La dépendance est présente dans tous les formalismes contemporains, mais elle est souvent cachée n Séparation entre dépendance syntaxique et sémantique n Intérêt d'une représentation syntaxique qui ne présuppose pas l'ordre linéaire et le regroupement en syntagme

Sylvain Kahane, EHESS, 30 mars Conclusion n On peut réduire certains problème algorithmique en écrivant mieux les grammaires (et éviter l'explosion combinatoire du nombre de règles lors d'un analyse verticale ou d'un lexicalisation de la grammaire) n Pradoxalement, les grammaires syntagma- tiques présupposent une analyse trop basée sur la dépendance (les seuls syntagmes considérés sont des projections des têtes) (cf. comparaison entre analyse CKY et HPSG)

Sylvain Kahane, EHESS, 30 mars Conclusion n Rôle primordiale de structure communicative: –ordre des mots –prosodie –constructions particulières : clivage, dislocation, … n Les syntagmes (constituants morphologiques) dépendent de la structure de dépendance, de la structure communicative et de la structure topologique (Gerdes & Kahane, ACL 2001) n Synthèse de la prosodie (basée sur les constitunats morphologiques, chunks et autres) : Mertens 1997, Vergne 2000

MERCI