La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Génération dun analyseur syntaxique basé sur HPSG avec le LKB Sirine BOUKEDI, Noureddine LOUKIL & Kais HADDAR.

Présentations similaires


Présentation au sujet: "1 Génération dun analyseur syntaxique basé sur HPSG avec le LKB Sirine BOUKEDI, Noureddine LOUKIL & Kais HADDAR."— Transcription de la présentation:

1 1 Génération dun analyseur syntaxique basé sur HPSG avec le LKB Sirine BOUKEDI, Noureddine LOUKIL & Kais HADDAR

2 2 Introduction (1/2) TALN (Traitement Automatique des Langues Naturelles) Tester les hypothèses sur la communication humaine Traiter les informations naturelles TALN couvre quatre niveaux de traitement : Niveau lexical Niveau syntaxique Niveau sémantique Niveau pragmatique

3 3 L analyse syntaxique est une phase fondamentale Introduction (2/2) Insuffisance des recherches pour la langue arabe Choix d un formalisme adéquat Complexit é de la phase d analyse beaucoup defforts et de temps Vérification de plusieurs contraintes Simplification de la construction d un analyseur (i.e., Outils de g é n é ration, Heuristiques)

4 4 Objectifs Élaboration dune grammaire HPSG pour la langue arabe : Identification dune hiérarchie de types Spécification TDL (Type Description Language) de la grammaire conçue Expérimentation avec loutil de génération LKB (Linguistic Knowledge Building)

5 5 Plan Introduction Objectif État de lart Identification dune hiérarchie de type HPSG arabisée Spécification TDL de la grammaire conçue Expérimentation avec LKB Évaluation Conclusion et perspectives

6 6 État de lart Il existe deux principales approches : Construction propre dun analyseur syntaxique Génération dun analyseur syntaxique Extensibilité du code Maintenance facile Choix de lalgorithme Coût élevé (plus de temps et defforts) Résultats et efficacité non garantis Extensibilité difficile Problème de maintenance Algorithmes expérimentés Coût moins cher et efficacité garantie Ergonomie testée Entrées sorties bien définis Génération dun analyseur syntaxique (Bahou, 2005), (Maaloul, 2005), (Abdelkader, 2006) (Oscar, 2005), (Laurens, 2007)

7 7 Deux systèmes pour limplémentation de HPSG : LKB : Linguistic Knowledge Building TRALE : extension de ALE (Attribute Logic Engine) Générateurs disponibles Deux systèmes différents mais de résultats similaires En terme daccessibilité : LKB = TRALE simplifiée Interface LKB plus ergonomique LKB …État de lart

8 8 Plan Introduction Objectif État de lart Identification dune hiérarchie de type HPSG arabisée Spécification TDL de la grammaire conçue Expérimentation avec LKB Évaluation Conclusion et perspectives

9 9 Identification dune hiérarchie de types En se basant sur plusieurs théories grammaticales telles que celles proposées par (Abdelwahed, 2004) et (Dahdeh, 1992) Unités simples : des mots Unités composées : des syntagmes Signe SyntagmeMot PrépositionnelVerbal Nominal Nom Décliné Non décliné Particule opérative Non opérative Verbe Quadrilitère Trilitère

10 10 Verbe Quadrilatère Trilitère DéfectueuxSain Défectueux Sain سالم مهموز مضعف مثال ناقص أجوف لفيف مضعف واوي مضعف يائي Différents critères de catégorisation Catégorisation suivant le nombre de lettres Pour les verbes …Identification dune hiérarchie de types

11 11 Différents critères de catégorisation Pour les noms …Identification dune hiérarchie de types Catégorisation suivant la déclinaison Nom Décliné Non décliné VariableNon Variable Pronoms Non Significatif بارز مستتر اسم الاشارة اسم الموصول

12 12 Différents critères de catégorisation Pour les particules …Identification dune hiérarchie de types Particule opérative Non opérative Nom Verbe الجر النسخ الاستثناء الجزم النصب العطف النفي Opératives ( عاملة ) ou non opérative ( مهملة )

13 13 Plan Introduction Objectif État de lart Identification dune hiérarchie de type HPSG arabisée Spécification TDL de la grammaire conçue Expérimentation avec LKB Évaluation Conclusion et perspectives

14 14 HPSG : Head-driven Phrase Structure Grammar HPSG arabisée Une grammaire dunification à base de contraintes Deux composants de base : Structures Attributs Valeurs Entrées lexicales Schémas de Domination Immédiate (DI) Arbres de dérivation Entrées lexicales (SAV) Entrées lexicales élargies Syntagmes Règles lexicales Schémas de DI Aperçu sur HPSG

15 15 Structure générale dune SAV Une SAV se compose dun ensemble de traits A chaque type de mot est associé un ensemble de traits PHON SS LOC NONLOC CONT CAT VAL S-ARG <> TETE MAJ …HPSG arabisée

16 16 HPSG se base sur un nombre limité de schémas DI (i.e., règles de spécifications ) Chaque schéma décrit un phénomène syntaxique bien déterminé La composition des syntagmes se fait par vérification des contraintes : Principes Les schémas de DI …HPSG arabisée

17 17 Un ensemble de contraintes à vérifier Principe des traits de tête Principe de valence Principe de spécification Les valeurs de traits de tête dun syntagme et celles du fils tête doivent être identiques PHON SS LOC CAT TETE S-ARG PHON SS LOC CAT TETE VAL [SPR | SUJ ] PHON SS LOC CAT TÊTE [] 2 Les principes …HPSG arabisée

18 18 HPSG a été conçue pour des langues latines Adaptation de HPSG à la langue arabe : Au niveau des traits Au niveau des schémas …HPSG arabisée Modifications apportées

19 19 VFORM : Sain / Défectueux RADICAL : Trilitère / Quadrilatère TYPE : صحيح مهموزالفاء, صحيح مهموزالعين, صحيح مهموز اللام VOIX : Passif /Actif ASPECT : Accompli / Inaccompli / Impératif RACINE : pour déterminer la racine ( جذر ) du verbe Pour les verbes …HPSG arabisée PHON SS CAT TETE VAL S – ARG SPR COMPS MAJ VFORM RADICAL TYPE VOIX ASPECT RACINE DEC verbe Sain Trilitère Intact sain َ Actif Inaccompli ش. ر. ب élidé Opérative-verbe, حرف جزم 2 1 masc 21 LOC

20 20 NFORM : Décliné ( معرب )/ Non Décliné( مبني ) DEFINI : oui / non NAT : Variable, non Variable, pronom démonstratif, pronom caché, pronom apparent, pronom relatif TOPIC, ATTRIBUT : au niveau du trait VALENCE Pour les noms …HPSG arabisée PHON SS CAT TETE MAJ NFORM DEFINI NAT DEC SPEC nom non décliné nul p.demonstratif َ saturée CONT RESTIND 1 Décliné, masc, sing SPR PHON SS CAT TETE VAL MAJ NFORM DEFINI NAT DEC nom décliné oui variable َ régulière Non décliné مبني, non significatif مبهم 1 1

21 21 Pour les particules …HPSG arabisée PFORM : opérative_nom, opérative_verbe, non_opérative NATP : حرف جر, حرف نسخ, حرف نصب, حرف عطف PHON SSCAT TETE MAJ PFORM NATP DEC SPEC Particule Opèrative_verbe حرف جزم saturée َ 1 LOC

22 22 Adaptation de HPSG à la langue arabe: Au niveau des traits Au niveau des schémas …HPSG arabisée Modifications apportées

23 23 Règle de spécification 1 PHON SS LOC CAT S-ARG <> TETE PHON SS LOC CAT TETE 1 1 VAL [SPR ] 2 PHON SS LOC CAT TETE NFORM non déc DEFINI non NAT p.dem 2

24 24 Règle de spécification 2 PHON SS LOC CAT VAL TETE 1 2 PHON SS LOC CAT TETE NFORM décliné DEFINI non PHON SS LOC CAT TETE 1 VAL ATTRIBUT 2 Fils – tête Fils – non tête

25 25 Règle de complémentation PHON SS LOC CAT VAL TETE PHON SS LOC CAT TETE 1 1 VAL [COMPS ] 2 NFORM décliné DEFINI non ADJ non PHON SS LOC CAT TETE NFORM décliné DEFINI oui ADJ non DEC réduite 2 Fils – têteFils – comps

26 26 Règle de modification PHON SS LOC CAT VAL TETE 1 2 PHON SS LOC CAT VAL TETE 1 2 PHON SS LOC CAT VAL TETE 3 [MOD ] 3 Fils – tête Fils – modifieur

27 27 Plan Introduction Objectif État de lart Identification dune hiérarchie de type HPSG arabisée Spécification TDL de la grammaire conçue Expérimentation avec LKB Évaluation Conclusion et perspectives

28 28 Spécification TDL TDL : Type Description Language OPÉRATEUR : = &., [ ] # [a-z] #|... |# FONCTION Lélément à gauche est une instance de celui de droite Adjonction de constraintes Fin dune description de type. Aussi équivalent de [ ] Séparation des couples attribut-valeur dans une SAV SAV Liste Ettiquette pour indiquer la coréference Commentaires de plusieurs lignes

29 29 PHON SS LOC CAT TETE MAJ nom NFORM non déc DEFINI non NAT p.dem CONT IND NOMB sing GEN masc hadha:=lex-nom-non-decline & [PHON, SS[LOC[ CAT[ TÊTE [ MAJ nom, NFORM non dec, DEFINI non, NAT P.dem]], CONT[ IND[NOMB sing, GEN masc ] ]]]. Spécification dune SAV …Spécification TDL

30 30 PHON SS LOC CAT VAL TETE PHON SS LOC CAT TETE 1 1 VAL [COMPS] 2 NFORM décliné DEFINI non ADJ non PHON SS LOC CAT TETE NFORM décliné DEFINI oui ADJ non DEC réduite 2 …Spécification TDL Spécification dun schéma regle_annexion := regle-bin-t-init & [SS.LOC.CAT.TETE nom, BRS [BR-TETE[ SS [LOC[CAT[TETE nom & [NFORM decline_variable, DEFINI non], VAL [SPR,COMPS ] ]]]], BRS-NTETE < [SS #nontete & [LOC [CAT [TETE nom & [NFORM decline, DEFINI oui, ADJ non, DEC reduite] ]]]]>]].

31 31 Plan Introduction Objectif État de lart Identification dune hiérarchie de type HPSG arabisée Spécification TDL de la grammaire conçue Expérimentation avec LKB Évaluation Conclusion et perspectives

32 32 LKB (Linguistic Knowledge Building) Outil de g é n é ration Deux types de fichiers Fichiers TDL (i.e., types.tdl, rsynt.tdl) Fichiers LISP (i.e., script.lsp) Expérimentation avec LKB Aperçu sur LKB

33 33 É tape 1 : Chargement de la grammaire con ç ue Étape 2 : Expérimentation de lanalyseur syntaxique généré Etapes danalyses …Expérimentation avec LKB

34 34 Analyse complète …Expérimentation avec LKB

35 35 …Expérimentation avec LKB Fichier in : « test.txt » Fichier out : « résultat.txt »

36 36 Plan Introduction Objectif État de lart Identification dune hiérarchie de type HPSG arabisée Spécification TDL de la grammaire conçue Expérimentation avec LKB Évaluation Conclusion et perspectives

37 37 Évaluation Corpus de 200 phrases découpées et translittérées Phrases simples verbales et nominales phrases nominales : SN + SN phrases nominales : SN + SV phrases verbales : SV + Sujet phrases verbales : SV + Sujet + Comps lexique de 781 mots

38 38 …Évaluation Nbre danalyse (n)Nbre de phrases ayant n analyse(s) % des phrases sont analysées correctement

39 39 …Évaluation Cas déchec : Le phénomène de coordination Le phénomène des relatives Le phénomène de lellipse Absence de règles syntaxiques Ambiguïté

40 40 Plan Introduction Objectif État de lart Identification dune hiérarchie de type HPSG arabisée Spécification TDL de la grammaire conçue Expérimentation avec LKB Évaluation Conclusion et perspectives

41 41 Conclusion et perspectives Identification dune hiérarchie de types pour larabe Élaboration dune grammaire HPSG arabisée Spécification TDL Expérimentation sur le système LKB Spécification plus précise des contraintes Couvrir dautres phénomènes syntaxiques Spécification de règles flexionnelles

42 42 Merci pour votre attention


Télécharger ppt "1 Génération dun analyseur syntaxique basé sur HPSG avec le LKB Sirine BOUKEDI, Noureddine LOUKIL & Kais HADDAR."

Présentations similaires


Annonces Google