La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Vers des composants TAL réutilisables Amalia Todirascu & Eric Kow Langue et Dialogue LORIA, Nancy.

Présentations similaires


Présentation au sujet: "Vers des composants TAL réutilisables Amalia Todirascu & Eric Kow Langue et Dialogue LORIA, Nancy."— Transcription de la présentation:

1 Vers des composants TAL réutilisables Amalia Todirascu & Eric Kow Langue et Dialogue LORIA, Nancy

2 Objectifs (I) Intégrer l analyseur LTAG –dans une architecture ouverte de dialogue homme-machine (projet MIAMM) –dans une application d extraction d information sur un corpus spécifique (sur la sécurité) - projet Vulcain

3 Objectifs (II) proposer une méthodologie de transformation d un outil TAL vers une composante réutilisable, portable –un exemple complexe à étudier: lanalyseur LTAG validation de la méthodologie par l intégration des modules TAL dans une architecture ouverte

4 Architecture Analyseur Ressources linguistiques Requête Arbres élémentaires Interface utilisateur texte Forêt de dérivation Meta- grammaire Arbres élémentaires Arbres Corpus annoté Lexique Mise à jour des ressources Texte annoté Serveur de forêts de dérivation

5 Méthodologie Standardisation des entrée/sorties choisir un format standard pour représenter les ressources un protocole communication Analyseur texte Arbres de dérivation et dérivés Ressources Linguistiques XML: u/seg (TEI) TAGML XML

6 XML & TAGML XML : format et outils standard W3C –portabilité et compatibilité avec d autres modules TAL TAGML –proposée comme standard pour représenter des ressources TAG –outils de transformation dautres formats en TAGML:ATOLL –disponibilité des ressources (serveur de grammaire, de forêt de dérivation:ATOLL)

7 SOAP (Simple Object Access Protocol) Simple compatible XML implémentation standard; référence sur les objets par les XML namespace une API pour gérer les erreurs

8 Problèmes lanalyseur nétait pas suffisamment modulaire optimisations nécessaires –factorisation de la grammaire –fournir en sortie une forêt de dérivation trop dépendant du format des ressources

9 Etat actuel Architecture modulaire standardisation –des entrées/sorties: format XML –des ressources: format TAGML protocole SOAP de communication entre l analyseur et linterface

10 Conclusion et futur Valider la méthodologie pour l analyseur TAG – séparer les ressources et lanalyseur – analyseur TAG - optimisations appliquer la méthodologie pour d autres modules TAL intégrer lanalyseur dans une architecture plus complexe (projet MIAMM, Vulcain)


Télécharger ppt "Vers des composants TAL réutilisables Amalia Todirascu & Eric Kow Langue et Dialogue LORIA, Nancy."

Présentations similaires


Annonces Google