La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Vers des composants TAL réutilisables

Présentations similaires


Présentation au sujet: "Vers des composants TAL réutilisables"— Transcription de la présentation:

1 Vers des composants TAL réutilisables
Amalia Todirascu & Eric Kow Langue et Dialogue LORIA, Nancy

2 Objectifs (I) Intégrer l ’analyseur LTAG
dans une architecture ouverte de dialogue homme-machine (projet MIAMM) dans une application d ’extraction d ’information sur un corpus spécifique (sur la sécurité) - projet Vulcain

3 Objectifs (II) proposer une méthodologie de transformation d ’un outil TAL vers une composante réutilisable, portable un exemple complexe à étudier: l’analyseur LTAG validation de la méthodologie par l ’intégration des modules TAL dans une architecture ouverte

4 Architecture Analyseur Meta- grammaire Interface utilisateur
texte Interface utilisateur Arbres élémentaires Texte annoté Analyseur Mise à jour des ressources Forêt de dérivation Requête Arbres élémentaires Corpus annoté Ressources linguistiques Arbres Serveur de forêts de dérivation Lexique

5 Méthodologie Standardisation des entrée/sorties
Analyseur texte Arbres de dérivation et dérivés Ressources Linguistiques XML TAGML XML: u/seg (TEI) TAGML Standardisation des entrée/sorties choisir un format standard pour représenter les ressources un protocole communication

6 XML & TAGML XML : format et outils standard W3C TAGML
portabilité et compatibilité avec d ’autres modules TAL TAGML proposée comme standard pour représenter des ressources TAG outils de transformation d’autres formats en TAGML:ATOLL disponibilité des ressources (serveur de grammaire, de forêt de dérivation:ATOLL)

7 SOAP (Simple Object Access Protocol)
compatible XML implémentation standard; référence sur les objets par les XML namespace une API pour gérer les erreurs

8 Problèmes l’analyseur n’était pas suffisamment modulaire
optimisations nécessaires factorisation de la grammaire fournir en sortie une forêt de dérivation trop dépendant du format des ressources

9 Etat actuel Architecture modulaire standardisation
des entrées/sorties: format XML des ressources: format TAGML protocole SOAP de communication entre l ’analyseur et l’interface

10 Conclusion et futur Valider la méthodologie pour l ’analyseur TAG
séparer les ressources et l’analyseur analyseur TAG - optimisations appliquer la méthodologie pour d ’autres modules TAL intégrer l’analyseur dans une architecture plus complexe (projet MIAMM, Vulcain)


Télécharger ppt "Vers des composants TAL réutilisables"

Présentations similaires


Annonces Google