Cours 7 Grammaires algébriques Constituants syntaxiques.

Slides:



Advertisements
Présentations similaires
Les Compléments d’Objets Directs
Advertisements

Déductions logiques et calcul de représentations sémantiques Alain Lecomte UMR SFL Séminaire « Logique, Sémantique, Dialogue » - partie I.
Objectifs de la séance Aujourd'hui, nous allons apprendre à distinguer certains homophones grammaticaux. A la fin de la séance, vous serez capables de.
Chap 1 Grammaires et dérivations.
Les sous-programmes Chapitre n° 5: Objectifs : Activité:
Les Homophones Des mots qui ont le même son mais pas le même orthographe ni la même définition.
Introduction à l'informatique linguistique
INITIATION AU GRAFCET E. HELLOT lycée P. Duez.
Le groupe du nom et ses expansions
Quelques exemples de situations de travail ritualisées brèves...
Le groupe verbal Lis le texte ci-dessous et porte une attention particulière aux groupes verbaux en caractères rouge : Mathis attend impatiemment son résultat.
Leçon de Les Pronoms Relatifs
Pour un système formel de description linguistique
La nouvelle grammaire.
LES REGLES DE BASE DE L’ORTHOGRAPHE
IFT313 Introduction aux langages formels
Python La structure itérative
Notions de base de la théorie des langages
Le français dans tous les sens
4 - Les automates et les lexiques morphologiques : le contenu mot fléchilemmepartie du discourstraits de flexion Habituellement, un lexique morphologique.
Programmation logique Démonstrateur automatique
Nature ou fonction d’un mot
IFT313 Introduction aux langages formels Froduald Kabanza Département dinformatique Université de Sherbrooke Automates à pile LR Notion de poignée.
Rappels de logique des prédicats du 1er ordre
IFT Complexité et NP-complétude
1 CSI3525: Concepts des Languages de Programmation Notes # 3: Description Syntaxique des Languages.
Traduction dirigée par la syntaxe
Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée.
Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques Éric Laporte Université Paris-Est Marne-la- Vallée.
Les applications évoluées (traduction automatique) nécessitent beaucoup d'informations lexicales : délimitation des mots composés, lemmes... Cela fait.
Cours 6 Paires attribut-valeur Structures de traits Unification.
Syntaxe et analyse syntaxique Réseaux sémantiques
Eric Laporte Institut Gaspard-Monge Université de Marne-la-Vallée France Syntaxe et analyse syntaxique.
Syntaxe et analyse syntaxique
Syntaxe et analyse syntaxique
Analyse syntaxique Réseaux sémantiques
Date Le groupe nominal.
Applications des langages hors-contextes Les analyseurs syntactiques ascendants GNU Yacc et Bison.
Chapitre 3 Syntaxe et sémantique.
Partie II Sémantique.
Sémantique dénotationnelle
LA DIFFÉRENCE ENTRE L’ÉTUDE D’UNE PHRASE ET D’UN ENONCÉ
Structures de données IFT-2000 Abder Alikacem La récursivité Département d’informatique et de génie logiciel Édition Septembre 2009.
IFT Complexité et NP-complétude Chapitre 0 Rappels.
Le pluriel des jours de la semaine?
Paradigmes des Langages de Programmation
Le formalisme utilisé pour Lexical Functional Grammar Lionel Clément Signes - Labri Mosaïque 1er décembre 2006.
Algorithmique et programmation (1)‏
Vers une analyse syntaxique à granularité variable Tristan Van rullen
Algorithmes et Programmation
L’EXAMEN de FRANÇAIS Le jeudi, 16 juin 2011.
*Conjugez “Connaître”
Les classes de mots… en bref
Introduction Formalisation de GUST basée sur GUP (GUST = Grammaire d’Unification Sens-Texte, Kahane 2001) (GUP = Grammaire d’Unification Polarisée, Kahane.
Hiver 2004SEG2501 Chapître 41 Chapître 4 SDL – structure d’un système et son comportement.
Chap 1 Grammaires et dérivations.
Module d’auto-apprentissage
La phrase de base Pour avoir une phrase de base, il faut:
Règles d’or à suivre en rédaction
Les différentes sortes.
Par: Liz Moscovici, Eva Pankovska et Yuchen Yang
Prof d’un cours la classe des groupes de mots
La classe des groupes de mots
Construire une phrase de base
Les phrases.
La classe des mots Comment différencier les différentes classes? et
Les relatives infinitives ou la construction d’un inobservable Sylvain Kahane Modyco, Université Paris 10 Lattice, Université Paris 7 COLDOC, Université.
Le syntagme prépositionnel
Construire une phrase. Je réunis des mots : princesse couronne tête porter.
La structure hiérarchique de la phrase
Transcription de la présentation:

Cours 7 Grammaires algébriques Constituants syntaxiques

Syntaxe Je vais fermer l'autre porte * autre fermer je l'porte vais Comment les mots se combinent-ils en phrases qui ont un sens ? Dans quel ordre ? Quelles combinaisons sont possibles ?

Constituants syntaxiques Certaines suites de mots dans une phrase forment des constituants Exemple : groupes nominaux vingt autres journaux l'Inde l'offre une seconde section d'équilibristes l'un des meilleurs bâtiments à voile de la compagnie Exemple de propriété commune à ces groupes Peuvent être suivis d'un verbe dans une phrase

Constituants syntaxiques vingt autres journaux titrent... l'Inde est... l'offre parvient à... une seconde section d'équilibristes arriva l'un des meilleurs bâtiments à voile de la compagnie peut... ce n'est pas vrai de n'importe quelle séquence de mots * journaux titrent... * l'parvient à... * seconde d'équilibristes arriva On doit donc pouvoir spécifier "un groupe nominal peut être suivi d'un verbe"

Constituants syntaxiques Exemple : groupes nominaux prépositionnels depuis quelques mois Déplacement de ce groupe Depuis quelques mois la situation évolue La situation depuis quelques mois évolue La situation évolue depuis quelques mois ce n'est pas vrai de n'importe quelle séquence de mots * Depuis mois la situation quelques évolue * La depuis situation quelques mois évolue * La situation mois évolue depuis quelques

Grammaires algébriques Context-free grammars Outil de manipulation des constituants syntaxiques Règles indiquent la combinaison et l'ordre des éléments GN --> Det N GAdj GN --> Npr GAdj --> GAdv Adj GAdv --> GAdv Adv GAdv --> Adv Lexique Liste des mots (symboles terminaux) Liste des symboles non terminaux GN GAdj GAdv Det...

Grammaires algébriques Les règles peuvent comporter des mots dans le membre droit Npr --> Luc Det --> un N --> bâtiment à voile Adj --> réputé Adv --> assez GN --> Det offre de GN Membre gauche : obligatoirement un non-terminal Membre droit : séquence de symboles terminaux ou non terminaux

Dérivation Réécriture utilisant les règles GN --> Det N GAdj (règle) --> Det N GAdv Adj (règle GAdj --> GAdv Adj ) --> Det N Adv Adj (règle GAdv --> Adv ) --> un N Adv Adj (règle Det --> un ) --> un bâtiment à voile Adv Adj (règle N --> bâtiment à voile ) --> un bâtiment à voile assez Adj (règle Adv --> assez ) --> un bâtiment à voile assez réputé (règle Adj --> réputé ) On peut dériver un bâtiment à voile assez réputé de GN

Arbre de dérivation GN GAdj Det Adj N GAdv Adv un bâtiment à voile assez réputé

Axiome Le langage formel engendré par la grammaire est l'ensemble des séquences de terminaux dérivables à partir de l'axiome Axiome un des non-terminaux Si la grammaire engendre des phrases, l'axiome correspond au symbole "phrase" Phrase grammaticale phrase engendrée par la grammaire Analyse syntaxique associer à une phrase son (ou ses) arbres de dérivation

Règles pour les phrases P --> GN préfère GN Luc préfère cette compagnie P --> GN quitte GN Prép GN Luc quitte Paris vers 10 h P --> GN part Prép GN Luc part après la réunion P GN GN Det N Luc préfère cette compagnie

Règles pour les phrases P --> montrez-PRO GN Montrez-moi tous les vols P --> est-ce que il y a GN Prép GN ? Est-ce qu'il y a un dîner sur le vol 312 ? P --> GN proposent GN ? Quels vols proposent un dîner ? Notation parenthésée (P (GN (Det Quels) (N vols)) proposent (GN (Det un) (N dîner)) ?)

Constituants non récursifs ou chunks Constituants qui ne contiennent pas un constituant de la même catégorie Exemple (GN l'un des meilleurs bâtiments à voile de (GN la compagnie)) Un GN inclus dans un autre Le petit est un chunk, le grand non (GN (GN l'un des meilleurs bâtiments à voile) de (GN la compagnie)) Une suite de deux chunks Si le GN est précédé d'une préposition, on l'inclut dans le chunk

Constituants non récursifs ou chunks [Parmi ces passagers] [du Mongolia], [on comptait] [divers fonctionnaires civils] et [des officiers] [de tout grade] Une phrase est presque une séquence de chunks, surtout nominaux [on comptait] chunk verbal [M. Fogg] [quitta] [l'hôtel], [seul], [après avoir] [recommandé] [à son domestique] [de l'attendre] [seul] chunk adjectival [Oui] ! [oui] ! [répétait] [machinalement] [le pauvre garçon] [machinalement] chunk adverbial

Règles pour les groupes nominaux GN --> Det N un arrêt GN --> Det Adj N une petite attente GN --> Det GAdj N la plus longue attente GN --> Det N GAdj un coût trop élevé GN --> Det de N beaucoup d'attente GN --> Det N Prép GN les vols pour Toulouse GN --> Det N Rel les vols qui arrivent à Toulouse avant midi GN --> Det N Prép GN Prép GN les vols de la soirée pour Toulouse

Ambiguïté La tempête n'a pas eu l'ampleur redoutée en raison de la concomitance d'une forte marée (Le Monde 12 novembre 2007) A paper in this week's Science purports to identify an impact crater as big as the famous "dinosaur killer" at Chicxulub, in Mexico (The Economist 15 mai 2004)

Ambiguïté les vols de (la soirée de lundi) pour Toulouse les réponses de Luc à (plusieurs questions de Marie) GN Det N Prép Prép GN GN les vols de Npr pour Det N Prép GN la soirée de lundi Toulouse

Ambiguïté les vols de (la soirée de lundi) pour Toulouse les réponses de Luc à (plusieurs questions de Marie) GN Det N Prép GN Prép GN Npr les réponses de à Det N Prép GN Luc plusieurs questions de Npr Marie

Ambiguïté le livre de (la fille sur la photo) dans le sac GN Det N Prép GN Prép GN le livre de sur Det N Prép GN Det N la fille la photo dans Det N le sac

Règles pour la coordination GN --> GN Conj GN un arrêt et une attente P --> P Conj P On s'arrête et on attend GAdj --> GAdj Conj GAdj tentant mais dangereux etc. GN --> Det N Prép GN les vols pour Toulouse GN --> Det N Prép GN Conj Prép GN les vols pour Toulouse ou depuis Toulouse

Accord grammatical P --> GN attend Le public attend Le GN est obligatoirement au singulier : * Les spectateurs attend P --> GN attendent Les spectateurs attendent Le GN est obligatoirement au pluriel : * Le public attendent On considère les traits du GN et de attendre comme des paramètres On ajoute des équations aux règles

Accord grammatical P --> GN <attendre> { GN.nombre = <attendre>.nombre ; GN.personne = <attendre>.personne ; } Le public attend Les spectateurs attendent Vous attendez Les équations peuvent être vérifiées par unification

Têtes des constituants Le mot le plus important de chaque constituant est appelé sa tête P (préfère) GN (compagnie) GN (Luc) Det (cette) N (compagnie) Luc préfère cette compagnie

Grammaires de dépendance On remplace chaque symbole non terminal par la tête correspondante, et on supprime le noeud redondant Arbre de dépendance préfère préfère compagnie compagnie Luc Luc compagnie cette cette Luc préfère cette compagnie

Grammaires de dépendance Informations perdues - étiquettes des constituants (on compense en ajoutant des étiquettes aux arêtes) - ordre des mots (on compense si nécessaire en ajoutant des contraintes sur l'ordre des mots) préfère objet sujet compagnie Luc déterminant cette

Lexicalisation Lorsqu'un mot a des compléments, la forme des compléments dépend du mot P --> GN <préférer> GN à GN Luc préfère cette compagnie à la concurrence P --> GN <quitter> GN Luc quitte Paris P --> GN <partir> Prép GN Luc part pour Toulouse Nombre de compléments Prépositions devant les compléments Grammaire lexicalisée Chaque règle comporte au moins un mot du lexique (la tête en général) Nombre de règles = nombre de mots x nombre de constructions

Grammaires non lexicalisées On regroupe tous les mots qui entrent dans une même construction On fait une règle commune P --> GN V GN à GN { V.N1àN2 = "+" ; } Luc préfère cette compagnie à la concurrence P --> GN V GN { V.N1 = "+" ; } Luc quitte Paris Luc préfère cette compagnie P --> GN V Prép GN { V.PrépN1 = "+" ; V.Prép = Prép ; } Luc part pour Toulouse

Analyse syntaxique Parsing Entrées : une phrase étiquetée et une grammaire algébrique Sorties : le ou les arbres de dérivation de la phrase Algorithmes Ascendants Descendants Programmation dynamique Cascade de transducteurs

Transducteurs Un transducteur fini est un automate fini dont les transitions sont étiquetées par des couples de séquences : une séquence d'entrée, une séquence de sortie Entrée : brrr ! Sortie : pfff ! Etats : 0 1 2 3 4 Transitions : 0b/p1 1r/f2 2r/f3 3/2 3!/!4 Etats initiaux : 0 Etats finaux : 4 b/p !/! r/f r/f 4 1 2 3 /

Transducteurs Les règles d'une grammaire algébrique peuvent être représentées par des transducteurs Exemple : GN --> Det N @/@ : l'ensemble des couples a/a pour tout symbole a Entrée : Det N V GN à GN Sortie : GN V GN à GN @/@ @/@ Det/ N/ /GN 3 1 2 @/@

Cascade de transducteurs Mode d'application d'un ensemble de transducteurs à un ensemble de séquences S0 Entrée : S0 i = 0 ; tant que (condition) appliquer un ou plusieurs transducteurs aux séquences de Si, obtenir Si+1 i = i+1 Sortie : Si Variantes - on a n transducteurs T1, T2... Tn et on les applique dans l'ordre - on a un transducteur et on l'applique itérativement jusqu'à ce que Si+1 = Si

Analyse syntaxique par cascade de transducteurs Entrées : une phrase étiquetée S0 et les transducteurs des règles i = 0 ; faire appliquer les transducteurs aux séquences de Si, obtenir Si+1 i = i+1 jusqu'à Si-1 = Si Sortie : Si Si Si contient l'axiome, S0 est conforme à la grammaire Pour construire l'arbre de dérivation, il faut marquer les relations entre les séquences de Si et celles de Si+1