Vers des composants TAL réutilisables Amalia Todirascu & Eric Kow Langue et Dialogue LORIA, Nancy
Objectifs (I) Intégrer l ’analyseur LTAG dans une architecture ouverte de dialogue homme-machine (projet MIAMM) dans une application d ’extraction d ’information sur un corpus spécifique (sur la sécurité) - projet Vulcain
Objectifs (II) proposer une méthodologie de transformation d ’un outil TAL vers une composante réutilisable, portable un exemple complexe à étudier: l’analyseur LTAG validation de la méthodologie par l ’intégration des modules TAL dans une architecture ouverte
Architecture Analyseur Meta- grammaire Interface utilisateur texte Interface utilisateur Arbres élémentaires Texte annoté Analyseur Mise à jour des ressources Forêt de dérivation Requête Arbres élémentaires Corpus annoté Ressources linguistiques Arbres Serveur de forêts de dérivation Lexique
Méthodologie Standardisation des entrée/sorties Analyseur texte Arbres de dérivation et dérivés Ressources Linguistiques XML TAGML XML: u/seg (TEI) TAGML Standardisation des entrée/sorties choisir un format standard pour représenter les ressources un protocole communication
XML & TAGML XML : format et outils standard W3C TAGML portabilité et compatibilité avec d ’autres modules TAL TAGML proposée comme standard pour représenter des ressources TAG outils de transformation d’autres formats en TAGML:ATOLL disponibilité des ressources (serveur de grammaire, de forêt de dérivation:ATOLL)
SOAP (Simple Object Access Protocol) compatible XML implémentation standard; référence sur les objets par les XML namespace une API pour gérer les erreurs
Problèmes l’analyseur n’était pas suffisamment modulaire optimisations nécessaires factorisation de la grammaire fournir en sortie une forêt de dérivation trop dépendant du format des ressources
Etat actuel Architecture modulaire standardisation des entrées/sorties: format XML des ressources: format TAGML protocole SOAP de communication entre l ’analyseur et l’interface
Conclusion et futur Valider la méthodologie pour l ’analyseur TAG séparer les ressources et l’analyseur analyseur TAG - optimisations appliquer la méthodologie pour d ’autres modules TAL intégrer l’analyseur dans une architecture plus complexe (projet MIAMM, Vulcain)