Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Vers des composants TAL réutilisables
Amalia Todirascu & Eric Kow Langue et Dialogue LORIA, Nancy
2
Objectifs (I) Intégrer l ’analyseur LTAG
dans une architecture ouverte de dialogue homme-machine (projet MIAMM) dans une application d ’extraction d ’information sur un corpus spécifique (sur la sécurité) - projet Vulcain
3
Objectifs (II) proposer une méthodologie de transformation d ’un outil TAL vers une composante réutilisable, portable un exemple complexe à étudier: l’analyseur LTAG validation de la méthodologie par l ’intégration des modules TAL dans une architecture ouverte
4
Architecture Analyseur Meta- grammaire Interface utilisateur
texte Interface utilisateur Arbres élémentaires Texte annoté Analyseur Mise à jour des ressources Forêt de dérivation Requête Arbres élémentaires Corpus annoté Ressources linguistiques Arbres Serveur de forêts de dérivation Lexique
5
Méthodologie Standardisation des entrée/sorties
Analyseur texte Arbres de dérivation et dérivés Ressources Linguistiques XML TAGML XML: u/seg (TEI) TAGML Standardisation des entrée/sorties choisir un format standard pour représenter les ressources un protocole communication
6
XML & TAGML XML : format et outils standard W3C TAGML
portabilité et compatibilité avec d ’autres modules TAL TAGML proposée comme standard pour représenter des ressources TAG outils de transformation d’autres formats en TAGML:ATOLL disponibilité des ressources (serveur de grammaire, de forêt de dérivation:ATOLL)
7
SOAP (Simple Object Access Protocol)
compatible XML implémentation standard; référence sur les objets par les XML namespace une API pour gérer les erreurs
8
Problèmes l’analyseur n’était pas suffisamment modulaire
optimisations nécessaires factorisation de la grammaire fournir en sortie une forêt de dérivation trop dépendant du format des ressources
9
Etat actuel Architecture modulaire standardisation
des entrées/sorties: format XML des ressources: format TAGML protocole SOAP de communication entre l ’analyseur et l’interface
10
Conclusion et futur Valider la méthodologie pour l ’analyseur TAG
séparer les ressources et l’analyseur analyseur TAG - optimisations appliquer la méthodologie pour d ’autres modules TAL intégrer l’analyseur dans une architecture plus complexe (projet MIAMM, Vulcain)
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.