La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Ressources électroniques pour l’analyse syntaxique

Présentations similaires


Présentation au sujet: "Ressources électroniques pour l’analyse syntaxique"— Transcription de la présentation:

1 Ressources électroniques pour l’analyse syntaxique
Amalia Todirascu

2 Plan Quelles ressources pour une analyse syntaxique «classique»?
Utilisations possibles Les grammaires d’arbres adjoints lexicalisés Lexique Grammaire Un exemple d’analyseur: LTAG

3 Analyse syntaxique « classique »
identifier les formes des mots et les parties du discours un lexique complet (toutes les formes) Ou un étiqueteur + dérivation de formes fléchies construire les arbres syntaxiques pour un texte donné Un ensemble de règles de grammaires et des contraintes associés Accord sujet-prédicat, dépendences à distance etc. modèles linguistiques

4 Utilisation des ressources
analyse syntaxique et sémantique aide à la traduction phénomènes linguistiques à traiter: règles d'accord, verbes transitives et intransitives, dépendences à distance lexique (expressions figées) traduction automatique systèmes à base d'arbre syntaxiques apprentissage d'une langue etrangère consulter les règles de grammaire

5 Lexique Informations unités lexicales vs. mots composés exhausitivité
Toutes les formes lemmes Propriétés morphologiques sémantiques unités lexicales vs. mots composés exhausitivité

6 Exemples de lexiques Sur le CNRTL (Centre national de ressources textuelles et lexicales) Morphalou formes fléchies Format XML Propriétés mophologiques et lemmes Prolex : un lexique de noms propres

7 Exemples de lexiques Anglais
  Multext-EAST :dictionnaires pour plusieurs langues de l’Europe Centrale et de l’Est

8 Grammaires Plusieurs aspects Plusieurs modèles pour la grammaire
organisation du lexique stratégies d'analyse automatique Plusieurs modèles pour la grammaire GPSG (Generalized Phrase Structure Grammar) (Gazdar) LFG (Lexical Function Grammar) (Kaplan) HPSG (Head Phrase Structure Grammar) (Pollard, Sag, 1994) TAG (Joshi, 1985), LTAG (Joshi, 1995)

9 Exemples de ressources
Une grammaire HPSG pour plusieurs langues ERG: pour l'anglais espagnol LFG (anglais, allemand, norvégien)

10 TAG Tree Adjoining Grammars (Joshi, 1975, 1995)
l'hypothèse: représenter les contextes syntaxiques locales (des arbres syntaxiques) contraintes sur les combinaisons entre ces arbres syntaxiques justification linguistique (structure prédicat-argument) prise en compte de l'ordre locale des mots

11 TAG (II) La grammaire: un symbole initial, des symboles non-terminaux, des symboles terminaux Les règles de réécriture: un ensemble d'arbres arbre initial: un arbre ayant le noeud racine étiqueté avec le symbole initial noeuds feuilles: symboles terminaux arbre auxiliaire: un seul noeud feuille étiqueté X, la même étiquete que l'étiquette du noeud racine

12 Arbre initial et arbre auxiliaire
W1, W2 T* (T l'ensemble de symboles terminaux) X  NT (NT – symbole non-terminal)  : Phrase W T* (T l'ensemble de symboles terminaux) α : X W1 W2 W Arbre initial α Arbre auxiliaire 

13 Adjonction ' : X  : X  : Phrase X X t X X t
t – sous arbre avec la racine X  : X X t X X t

14 Lexicalized Tree Adjoining Grammars (LTAG)
association entrée lexicale - arbres description complète de l'environnement syntaxique possibilité de traiter les expressions figées modifications par rapport au TAG ancrage lexical deux opérations: substitution (obligatoire) et adjonction (facultative)

15 Arbres LTAG Arbres élémentaires – décrivent des arguments obligatoires avec d'autres arbres: tête-complément au moins un noeud ancre (l'unité lexicale) des noeuds de substitution () Arbres auxiliaires – relations tête-modifieurs un noeud ancre un noeud pied (*), l'étiquette est identique au noeud racine

16 Exemples nv1: nvn1: S V  GN GN  S V  GN adv1: np1: GN V Adv  V*

17 Propriétés Grammaire lexicalisée: localité
arbres unités lexicales associées aux arbres opérations localité un arbre élémentaire contient tous les arguments dans la même structure pour chaque unité lexicale, on associe plusieurs arbres recursivité: arbres auxiliaires

18 Arbres dérivés et arbres de dérivation
le résultat obtenu suite aux opération de substitution et d'adjonction, sur les arbres associés aux unités lexicales de la phrase d'entrée arbres de dérivation les noeuds étiquetés avec le nom de l'arbre et l'ancre (le lemme) les liens – opérations d'adjonction ou de substitution arbre de dépendances on supprime les noms des arbres dans l'arbre de dérivation

19 Ressources XTAG (Doran et al, 1994) FTAG (Abeillé, 2002)
grammaire de grande couverture étiqueteur, analyseur morphologique, analyseur syntaxique FTAG (Abeillé, 2002) grammaire de grande couverture pour le français

20 L'analyseur syntaxique LTAG
développé par Langue et Dialogue, LORIA, INRIA-Lorraine utilise un lexique et une grammaire d'arbres adjoints (Joshi 1995) chaque mot est associé à une famille d'arbres un arbre décrit le comportement syntaxique de chaque mot grammaire d'arbres adjoints lexicalisée (LTAG) (Abeillé et al, 2001) possible extensions pour les structures de traits

21 L'analyseur syntaxique LTAG (II)
Combiner les arbres associés aux mots de la phrase opération de substitution: structure prédicat-argument opération d'adjonction: les modifieurs coût important d'adaptation des ressources aux domaines nouveaux

22 V Adv V* énormément Jean dort énormément N Jean S V N Arbres S V N N Np  Lexique substitution dort S V N Jean dort énormément adjonction V Adv  V* Jean S V N Jean dort énormément dormir Adv

23 Ressources une DTD qui décrit les familles d'arbres, de lemmes et d'unités lexicales un arbre: au moins un noeud ancre (attribut type) un noeud tête (l'élément central qui porte les propriétés du constituant) des noeuds de type substitution (subst) ou adjonction (foot) lien avec le lemme: lexicalisation unités lexicales: morphoLib

24 Exemple d'arbre <tree id="prep_mod_temp"> <node cat="VP">
<node cat="VP" type="foot"/> <node cat="PP"> <node cat="Prep" name="_head" type="anchor"> </node> <node cat="N" type="subst"> </tree>

25 Exemples de ancrage <lexicalization>
<family> <tree id="for_n_adj"/> </family> <anchor noderef="_head"> <lemmaref cat="Prep" name="FOR"/> </anchor> </lexicalization>

26 Exemple d'entrée <morph lex="for"> <fs>
<f name="cat"> <sym value="prep"/> </f> </fs> <lemmaref cat="Prep" name="FOR"/> </morph>

27 Autres outils French MetaGrammar parser autres parseurs XTAG parser (Bangalore, 1997) utilisant des informations statistiques pour réduire le nombre d'arbres

28 Avantages et Limites avantages limites modèle opérationnel
adaptable pour l'analyse partielle motivation linguistique limites coût important pour créer les ressources nécessite une sélection préalable des arbres

29 Réferences Abeillé, A., L. Clément, and F. Toussenel `Building a treebank for French', in A. Abeillé (ed) Treebanks , Kluwer, Dordrecht Abeillé, A., Schabes, Y., Joshi, A Using Lexicalized Tags for Machine Translation. COLING 1990: 1-6 Abeillé, A Une grammaire électronique du français, CNRS Editions, Paris. Doran et al XTAG System – A Wide Coverage Grammar for English. In Proceedings of COLING'94.

30 Réferences (II) Kaplan, R., Bresnan, J Lexical Functional Grammar: A Formal System for Grammatical Representation. In J.Bresnan (ed.) The Mental Representation of Grammatical Relations. MIT Press, Cambridge, Massachusetts Joshi, A Introduction to Tree Adjoining Grammars. In Computational Intelligence Joshi, A., Levy, L., Takahashi, M Tree Adjunct Grammars. J. Comput. Syst. Sci. 10(1):

31 Sujet Réalisez un dossier de 6-8 pages qui présente un outil d'analyse automatique (étiqueteur, analyseur syntaxique) ou une ressources (lexique, grammaire), avec les avantages et les inconvenients de chaque modèle.


Télécharger ppt "Ressources électroniques pour l’analyse syntaxique"

Présentations similaires


Annonces Google