La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Cours 7 Grammaires algébriques Constituants syntaxiques.

Présentations similaires


Présentation au sujet: "Cours 7 Grammaires algébriques Constituants syntaxiques."— Transcription de la présentation:

1 Cours 7 Grammaires algébriques Constituants syntaxiques

2 Syntaxe Je vais fermer l'autre porte *autre fermer je l'porte vais Comment les mots se combinent-ils en phrases qui ont un sens ? Dans quel ordre ? Quelles combinaisons sont possibles ?

3 Constituants syntaxiques Certaines suites de mots dans une phrase forment des constituants Exemple : groupes nominaux vingt autres journaux l'Inde l'offre une seconde section d'équilibristes l'un des meilleurs bâtiments à voile de la compagnie Exemple de propriété commune à ces groupes Peuvent être suivis d'un verbe dans une phrase

4 Constituants syntaxiques vingt autres journaux titrent... l'Inde est... l'offre parvient à... une seconde section d'équilibristes arriva l'un des meilleurs bâtiments à voile de la compagnie peut... ce n'est pas vrai de n'importe quelle séquence de mots *journaux titrent... * l'parvient à... * seconde d'équilibristes arriva On doit donc pouvoir spécifier "un groupe nominal peut être suivi d'un verbe"

5 Constituants syntaxiques Exemple : groupes nominaux prépositionnels depuis quelques mois Déplacement de ce groupe Depuis quelques mois la situation évolue La situation depuis quelques mois évolue La situation évolue depuis quelques mois ce n'est pas vrai de n'importe quelle séquence de mots * Depuis mois la situation quelques évolue * La depuis situation quelques mois évolue * La situation mois évolue depuis quelques

6 Grammaires algébriques Context-free grammars Outil de manipulation des constituants syntaxiques Règlesindiquent la combinaison et l'ordre des éléments GN--> Det N GAdj GN--> Npr GAdj--> GAdv Adj GAdv--> GAdv Adv GAdv--> Adv LexiqueListe des mots (symboles terminaux) Liste des symboles non terminauxGN GAdj GAdv Det...

7 Grammaires algébriques Les règles peuvent comporter des mots dans le membre droit Npr--> Luc Det--> un N--> bâtiment à voile Adj--> réputé Adv--> assez GN--> Det offre de GN Membre gauche : obligatoirement un non-terminal Membre droit : séquence de symboles terminaux ou non terminaux

8 Dérivation Réécriture utilisant les règles GN--> Det N GAdj(règle) --> Det N GAdv Adj(règleGAdj--> GAdv Adj ) --> Det N Adv Adj(règleGAdv--> Adv ) --> un N Adv Adj(règle Det--> un ) --> un bâtiment à voile Adv Adj(règle N--> bâtiment à voile ) --> un bâtiment à voile assez Adj(règle Adv--> assez ) --> un bâtiment à voile assez réputé(règle Adj--> réputé ) On peut dériver un bâtiment à voile assez réputé de GN

9 Arbre de dérivation GN Det N GAdj Adj GAdv Adv unbâtiment à voileassezréputé

10 Axiome Le langage formel engendré par la grammaire est l'ensemble des séquences de terminaux dérivables à partir de l'axiome Axiome un des non-terminaux Si la grammaire engendre des phrases, l'axiome correspond au symbole "phrase" Phrase grammaticale phrase engendrée par la grammaire Analyse syntaxique associer à une phrase son (ou ses) arbres de dérivation

11 Règles pour les phrases P--> GN préfère GNLuc préfère cette compagnie P--> GN quitte GN Prép GN Luc quitte Paris vers 10 h P--> GN part Prép GN Luc part après la réunion P GN préfère GN N Det cetteLuccompagnie

12 Règles pour les phrases P--> montrez-PRO GNMontrez-moi tous les vols P--> est-ce que il y a GN Prép GN ? Est-ce qu'il y a un dîner sur le vol 312 ? P--> GN proposent GN ? Quels vols proposent un dîner ? Notation parenthésée ( P ( GN ( Det Quels) ( N vols)) proposent ( GN ( Det un) ( N dîner)) ?)

13 Constituants non récursifs ou chunks Constituants qui ne contiennent pas un constituant de la même catégorie Exemple ( GN l'un des meilleurs bâtiments à voile de ( GN la compagnie)) Un GN inclus dans un autre Le petit est un chunk, le grand non ( GN ( GN l'un des meilleurs bâtiments à voile) de ( GN la compagnie)) Une suite de deux chunks Si le GN est précédé d'une préposition, on l'inclut dans le chunk

14 Constituants non récursifs ou chunks [Parmi ces passagers] [du Mongolia], [on comptait] [divers fonctionnaires civils] et [des officiers] [de tout grade] Une phrase est presque une séquence de chunks, surtout nominaux [on comptait] chunk verbal [M. Fogg] [quitta] [l'hôtel], [seul], [après avoir] [recommandé] [à son domestique] [de l'attendre] [seul] chunk adjectival [Oui] ! [oui] ! [répétait] [machinalement] [le pauvre garçon] [machinalement] chunk adverbial

15 Règles pour les groupes nominaux GN--> Det Nun arrêt GN--> Det Adj Nune petite attente GN--> Det GAdj Nla plus longue attente GN--> Det N GAdjun coût trop élevé GN--> Det de Nbeaucoup d'attente GN--> Det N Prép GNles vols pour Toulouse GN--> Det N Rel les vols qui arrivent à Toulouse avant midi GN--> Det N Prép GN Prép GN les vols de la soirée pour Toulouse

16 Ambiguïté La tempête n'a pas eu l'ampleur redoutée en raison de la concomitance d'une forte marée (Le Monde 12 novembre 2007) A paper in this week's Science purports to identify an impact crater as big as the famous "dinosaur killer" at Chicxulub, in Mexico (The Economist 15 mai 2004)

17 Ambiguïté les vols de (la soirée de lundi) pour Toulouse les réponses de Luc à (plusieurs questions de Marie) GN DetN lesvolsde Prép pour Prép DetNGN lundiToulousela Npr soiréede Prép GN

18 Ambiguïté les vols de (la soirée de lundi) pour Toulouse les réponses de Luc à (plusieurs questions de Marie) GN DetN lesréponsesde Prép à DetNGN Marie Luc plusieurs Npr questionsde Prép GN Npr

19 Ambiguïté le livre de (la fille sur la photo) dans le sac le livre de la fille sur (la photo dans le sac) GN DetN lelivrede Prép sur Prép DetNGN laphotodans Prép GN DetN lafille DetN lesac

20 Règles pour la coordination GN--> GN Conj GNun arrêt et une attente P--> P Conj POn s'arrête et on attend GAdj--> GAdj Conj GAdjtentant mais dangereux etc. GN--> Det N Prép GNles vols pour Toulouse GN--> Det N Prép GN Conj Prép GN les vols pour Toulouse ou depuis Toulouse

21 Accord grammatical P--> GN attendLe public attend Le GN est obligatoirement au singulier : *Les spectateurs attend P--> GN attendentLes spectateurs attendent Le GN est obligatoirement au pluriel : *Le public attendent On considère les traits du GN et de attendre comme des paramètres On ajoute des équations aux règles

22 Accord grammatical P--> GN { GN.nombre =.nombre ; GN.personne =.personne ; } Le public attend Les spectateurs attendent Vous attendez Les équations peuvent être vérifiées par unification

23 Têtes des constituants Le mot le plus important de chaque constituant est appelé sa tête P (préfère) GN (Luc) préfère GN (compagnie) N (compagnie) Det (cette) cetteLuccompagnie

24 Grammaires de dépendance On remplace chaque symbole non terminal par la tête correspondante, et on supprime le noeud redondant Arbre de dépendance préfère Luc compagnie cette préfère Luc préfère compagnie cette Luc compagnie

25 Grammaires de dépendance Informations perdues - étiquettes des constituants (on compense en ajoutant des étiquettes aux arêtes) - ordre des mots (on compense si nécessaire en ajoutant des contraintes sur l'ordre des mots) préfère Luc compagnie cette sujet objet déterminant

26 Lexicalisation Lorsqu'un mot a des compléments, la forme des compléments dépend du mot P--> GN GN à GN Luc préfère cette compagnie à la concurrence P--> GN GNLuc quitte Paris P--> GN Prép GNLuc part pour Toulouse Nombre de compléments Prépositions devant les compléments Grammaire lexicalisée Chaque règle comporte au moins un mot du lexique (la tête en général) Nombre de règles = nombre de mots x nombre de constructions

27 Grammaires non lexicalisées On regroupe tous les mots qui entrent dans une même construction On fait une règle commune P--> GN V GN à GN{ V.N1àN2 = "+" ; } Luc préfère cette compagnie à la concurrence P--> GN V GN{ V.N1 = "+" ; } Luc quitte Paris Luc préfère cette compagnie P--> GN V Prép GN{ V.PrépN1 = "+" ; V.Prép = Prép ; } Luc part pour Toulouse

28 Analyse syntaxique Parsing Entrées : une phrase étiquetée et une grammaire algébrique Sorties : le ou les arbres de dérivation de la phrase Algorithmes Ascendants Descendants Programmation dynamique Cascade de transducteurs

29 Transducteurs Un transducteur fini est un automate fini dont les transitions sont étiquetées par des couples de séquences : une séquence d'entrée, une séquence de sortie Entrée : brrr ! Sortie : pfff ! Etats : Transitions : 0b/p1 1r/f2 2r/f3 3 / 2 3!/!4 Etats initiaux : 0 Etats finaux : b/p r/f !/! /

30 Transducteurs Les règles d'une grammaire algébrique peuvent être représentées par des transducteurs Exemple :GN --> Det N : l'ensemble des couples a/a pour tout symbole a Entrée : Det N V GN à GN Sortie : GN V GN à GN Det/ N/ /GN

31 Cascade de transducteurs Mode d'application d'un ensemble de transducteurs à un ensemble de séquences S 0 Entrée : S 0 i = 0 ; tant que (condition) appliquer un ou plusieurs transducteurs aux séquences de S i, obtenir S i+1 i = i+1 Sortie : S i Variantes - on a n transducteurs T 1, T 2... T n et on les applique dans l'ordre - on a un transducteur et on l'applique itérativement jusqu'à ce que S i+1 = S i

32 Analyse syntaxique par cascade de transducteurs Entrées : une phrase étiquetée S 0 et les transducteurs des règles i = 0 ; faire appliquer les transducteurs aux séquences de S i, obtenir S i+1 i = i+1 jusqu'à S i-1 = S i Sortie : S i Si S i contient l'axiome, S 0 est conforme à la grammaire Pour construire l'arbre de dérivation, il faut marquer les relations entre les séquences de S i et celles de S i+1


Télécharger ppt "Cours 7 Grammaires algébriques Constituants syntaxiques."

Présentations similaires


Annonces Google