La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

9 octobre 2009ATALA1 Lanalyseur syntaxique Fips Eric Wehrli, Luka Nerima LATL-Département de linguistique Université de Genève

Présentations similaires


Présentation au sujet: "9 octobre 2009ATALA1 Lanalyseur syntaxique Fips Eric Wehrli, Luka Nerima LATL-Département de linguistique Université de Genève"— Transcription de la présentation:

1 9 octobre 2009ATALA1 Lanalyseur syntaxique Fips Eric Wehrli, Luka Nerima LATL-Département de linguistique Université de Genève

2 LATLLATL 9 octobre 2009 ATALA 2 La recherche en TAL au LATL v Développement dune plateforme multilingue pour le traitement automatique des langues vAnalyseurs, étiqueteurs, phonétiseurs, extracteurs terminologiques, générateurs de phrases, etc. vCœur du système : lanalyseur Fips vAnalyseur syntaxique « profond », basé sur une interprétation assez libre de la théorie de la grammaire générative chomskyenne vQuelques propriétés de Fips v analyseur ascendant, avec une stratégie dattachement à droite v traitement parallèle des alternatives v recours à des heuristiques pour limiter le nombre dalternatives

3 LATLLATL 9 octobre 2009 ATALA 3 Le modèle de grammaire vBasée sur le modèle chomskyen des principes et paramètres, ainsi quen partie sur le modèle minimaliste. vToutes les structures syntaxiques obéissent au même schéma: où X ( {N, V, A, D, P, Adv,Conj}) est la tête de la projection XP, L et R sont des listes de projections maximales (les sous-constituants gauches et droits du syntagme XP). vLes attachements à gauche et à droite sont décrits dans un (pseudo) formalisme, à la fois relativement intuitif et facile à encoder. [ XP L X R ]

4 LATLLATL 9 octobre 2009 ATALA 4 vCrée une projection syntaxique vsoit à partir dun item lexical: X --> XP X {N, V, A, D, P, Adv, Conj} vprojection étendue (métaprojection): verbe conjugué --> pronoms et noms propres --> DP Le mécanisme de projection VPT TP

5 LATLLATL 9 octobre 2009 ATALA 5 Combinaison (merge) vCombine deux projections adjacentes A et B vattache A comme sous-constituant de B (=attachement à gauche) ; vattache B comme sous-constituant dun nœud actif sur larête droite de A (attachement à droite) : A B AB

6 LATLLATL 9 octobre 2009 ATALA 6 Procédure dattachement « coin droit » TP VPDP Jeanalu un Pile de nœuds actifs : … poème NP

7 LATLLATL 9 octobre 2009 ATALA 7 Exemples de règles dattachement à gauche vAP + NP a.AgreeWith(b, {number, gender}) a.HasFeature( prenominalAdj) vDP + TP a.AgreeWith(b, {number, person}) a.IsArgumentOf(b, subject) vDP + PP b.HasFeature(postposition)

8 LATLLATL 9 octobre 2009 ATALA 8 Exemples de règles dattachement à droite vNP + AP a.AgreeWith(b, {number, gender}) ~b.HasFeature( prenominalAdj) vVP + DP b.IsArgumentOf(a, {directObject}) v PP + DP a.HasFeature(preposition) a.EmptyRight()

9 LATLLATL 9 octobre 2009 ATALA 9 Grammaire procédurale vLa partie procédurale de la grammaire de Fips comprend : vUn mécanisme de construction de chaînes (mouvement-wh, constructions clitiques dans les langues romanes, etc.) vUn mécanisme de traitement des structures prédicat-arguments (verbes, noms, adjectifs prédicatifs) v La structure argumentale est spécifiée dans lentrée lexicale (nombre et type des arguments – fonction grammaticale et attributs, par ex. type de la préposition pour un argument de catégorie PP, type de phrase pour un argument S, etc.).

10 LATLLATL 9 octobre 2009 ATALA 10 Opérations sur la structure argumentale vCertains processus grammaticaux modifient la structure argumentale dun prédicat : vLe passif peut être vu comme un processus dabsorption du sujet, soit en syntaxe (anglais, langues romanes, etc.), soit dans la morphologie (hongrois, japonais, latin, etc.). vConstructions causatives En français, la construction faire + V inf est analysée comme un processus de modification de la structure argumentale du verbe infinitif par ladjonction dun argument supplémentaire (le sujet du verbe « faire »), ce qui provoque le reclassement du sujet du verbe infinitif sous la forme dun objet direct ou dun objet indirect. Paul corrige cette épreuve Jean a fait corriger cette épreuve à Paul Jean lui a fait corriger cette épreuve

11 LATLLATL 9 octobre 2009 ATALA 11 Identification des collocations vLes collocations associent deux unités lexicales qui entretiennent un rapport syntaxique étroit, soit de modification, soit de complémentation. vLa procédure de reconnaissance intervient au moment de lattachement dun constituant. vPaul est un gros fumeur vPaul a battu son record du saut en longueur vLe mécanisme de chaînage permet dexprimer la relation entre position de « surface » et position « profonde ». vLe record quelle a battu datait dune dizaine dannées vCe record, Jean le considère comme difficile à battre

12 LATLLATL 9 octobre 2009 ATALA 12 Catalogue des lexiques vlexique monolingue vmots vmots composés (mots contigus) vlexique des collocations vcombinaison arbitraire et récurrente de mots, non nécessairement adjacents, nombreuses configurations syntaxiques vp.e. exercer - profession, république bananière, code de la route vcontient aussi les idiomes - avaler la pilule, promettre la lune

13 LATLLATL 9 octobre 2009 ATALA 13 Schéma conceptuel du lexique monolingue Mot chaîne orthographique chaîne phonétique Paradigme flexionnel NomVerbeAdj DetAdvConjInterj pers. temps mode genre nombre genre nombre Lexème NomVerbe Adj type V traits syn traits sem type Nom traits Nom 1 * traits Adj * forme de base 1 autre forme Arg NArg V Prep Arg Adj 0..1(0) fct gram fct thema traits sel fct gram fct thema traits sel fct gram fct thema traits sel Prep type Det type < est réalisé par association généralisation (est un) composition « xor » Variante graphie alternative type variante * varie 1

14 LATLLATL 9 octobre 2009 ATALA 14 Le lexique des collocations vensemble d'associations binaires ditems lexicaux Item lexical associe ^ 2 * Lexème Collocation chaîne orthographique type (configuration syntaxique) traits de figement v définition récursive de la collocation v permet de prendre en compte des collocations > 2 termes v p.e. tomber en panne sèche, arme de destruction massive

15 LATLLATL 9 octobre 2009 ATALA 15 Interface monolingue

16 LATLLATL 9 octobre 2009 ATALA 16 Interface monolingue

17 LATLLATL 9 octobre 2009 ATALA 17 Interface monolingue - insertion

18 LATLLATL 9 octobre 2009 ATALA 18 Interface monolingue - insertion

19 LATLLATL 9 octobre 2009 ATALA 19 Interface monolingue - insertion

20 LATLLATL 9 octobre 2009 ATALA 20 Interface monolingue - insertion

21 LATLLATL 9 octobre 2009 ATALA 21 Interface collocation v pour l'entrée manuelle des collocations v outil d'assistance sophistiqué v 1) analyse de la collocation entrée (Fips) v 2) propose les unités lexicales (base et collocatif) v 3) détermine le type de la collocation v 4) détermine les traits de la collocation

22 LATLLATL 9 octobre 2009 ATALA 22 Interface collocation - insertion

23 LATLLATL 9 octobre 2009 ATALA 23 Lexiques - quelques chiffres vlexèmes vfr: entrées vmots vfr: entrées vcollocations vfr: entrées

24 LATLLATL 9 octobre 2009 ATALA 24 Conclusion vLexpérience accumulée avec les différentes versions de lanalyseur Fips a permis daffiner (et souvent de simplifier) par étapes la structure et limplémentation de ce modèle danalyseur, jusquà la version actuelle. vLe double choix dun modèle linguistique abstrait (théorie chomskyenne) et dune modélisation basée sur la notion dobjets se révèle judicieux pour la réalisation dun analyseur multilingue. vLévaluation dun analyseur syntaxique est une opération difficile, qui na pas encore été entreprise pour lanalyseur Fips. En attendant les résultats de la campagne dévaluation PASSAGE, nous pouvons faire état des quelques chifffres suivants : v> 80% danalyses complètes (anglais et français) sur des corpus journalistiques ; v~0,2% de mots inconnus (hors noms propres) ; vTemps de traitement : mots/seconde.


Télécharger ppt "9 octobre 2009ATALA1 Lanalyseur syntaxique Fips Eric Wehrli, Luka Nerima LATL-Département de linguistique Université de Genève"

Présentations similaires


Annonces Google