La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

ARIANE et son utilisation via l’interface CASH

Présentations similaires


Présentation au sujet: "ARIANE et son utilisation via l’interface CASH"— Transcription de la présentation:

1 ARIANE et son utilisation via l’interface CASH

2 INTRODUCTION

3 Propos centré sur l’utilisation d’ARIANE via son interface.
Objectif : - non utilisateurs de TA : permettre de faire connaissance avec ARIANE en l’utilisant de façon élémentaire (envoi de textes à la traduction, visualisation des diverses phases du traitement, enrichissement des dictionnaires…) - utilisateurs de TA : proposer un outil de développement complémentaire du moniteur. Ce n’est donc pas un cours sur ARIANE, mais seulement sur son utilisation pratique. Le niveau d’utilisation dépendra des connaissances préalables sur ARIANE. Pour les néophytes complets, les éléments suffisants (?) pour une utilisation élémentaire seront donnés.

4 ARIANE : Un générateur de systèmes de TA
Conçu pour le développement de systèmes de TA Utilise des langages spécialisés de programmation linguistique Traite l’unité de traduction sous forme d’arbre décoré Particulièrement adapté à la méthode de transfert Version actuelle implantée sur ordinateurs IBM

5 CASH : Une interface de commande d’ARIANE
(Commande d’ARIANE Sous Hypertexte) Écrite dans l’environnement « REVOLUTION » Utilisable sous Mac, PC, Unix Offre pratiquement toutes les fonctionnalité du moniteur original d’ARIANE Utilisation plus simple que le moniteur Liaison par sockets avec ARIANE

6 Premier aperçu d’un traitement ARIANE vu à travers CASH

7 Principe d’un système de TA de Transfert construit avec ARIANE
G E N R A T I O T R A N S F E R L Y S Arbre Sémantique cible Arbre Multiniveau source Arbre Multiniveau cible This is an overall view of a MT transfer system designed on ARIANE; Starting from the source text, the translation proce"ss is performed in 3 steps : The analysis steps elaborates a so called 'multilievel' tree. This tree reflects the syntagmatic structure of the input sentence, but bears 3 levels of information : the morphologic, syntactic and semantic ones. The transfer step is mainly lexical : it translate the source words into the target ones. The morphologic and syntactic informations are no more relevant in the target language, it is the reason I described the tre at the input of the generation step as a semantic tree. The generation step builds the multilevel target tree, and finally the target text. Texte source Texte cible Arbre multiniveau : structure syntagmatique, 3 niveaux d’info (morphologique, syntactique, logico-semantique)

8 Environnement Revolution : écriture du texte source et envoi à la carte de communication avec ARIANE

9 Choix du type de traitement et envoi à ARIANE

10 Retour du résultat de traitement et accès à la visualisation de la trace

11 Résultat de l’Analyse Morphologique (AM)
« Arbre plat », chaque nœud terminal correspond à une occurrence et comporte le résultat de l’analyse morphologique. Module essentiel : le dictionnaire monolingue. Langage de programmation : ATEF.

12 Résultat de l’Analyse Structurale (AS)
« Arbre structuré », voisin d’un arbre de dépendance. Structure syntagmatique. Trois niveaux de décoration (morphologique, syntactique, logico-sémantique). Module principal : grammaires. Langage de programmation : ROBRA.

13 Résultat du transfert lexical (TL) et structural (TS)
TL : Noeuds de l’arbre d’entrée (en langue source) sont transformés en nœuds (ou sous-arbres) en langue cible. Module principal : dictionnaires. Langage de programmation : EXPANS. TS : Ajustements de structure. Grammaires. ROBRA

14 Résultat de la génération structurale (GS)
Construction de l’arbre syntaxique cible. Les nœuds terminaux portent les mots (non fléchis) de la phrase cible, dans l’ordre de la phrase. Module principal : grammaires. Langage de programmation : ROBRA.

15 Résultat de la génération morphologique (GM)
Extraction des nœuds terminaux et flexions. Module principal : dictionnaires. Langage de programmation : SYGMOR.

16 Visualisation/Edition des copies locales des modules de traitement (dictionnaires et grammaires)

17 La pile principale CASH.rev
Boutons d’accès : Fenêtres de sélection : machine virtuelle couple de langues phase module (gram, dic, etc) chaîne d’exécu- tion corpus de textes

18 Visualisation/Edition de modules d’une phase de Transfert Lexical

19 Extrait d’un dictionnaire de TL
Procédure de condition et accès à sa description.

20 Une procédure de condition en TL
Procédure de condition et accès à sa description.

21 Extrait d’un dictionnaire de TL
Procédure d’ affectation et accès à sa description.

22 Une procédure d’affectation en TL
Procédure d’ affectation et accès à sa description.

23 Visualisation/Edition de modules d’une phase d’Analyse Structurale

24 Premières lignes du graphe de contrôle d’une grammaire d’Analyse Structurale
Grammaire élémentaire Nom de règle, et accès à la règle

25 Visualisation d’une règle ROBRA
Texte de la règle Arbre objet Arbre image

26 Visualisation d’une Procédure de Condition Intersommet
Nom et accès à la PCIS Description de la PCIS

27 Utilisation des corpus

28 Principe des corpus ARIANE offre un système de gestion des corpus contenant les textes à traiter ou déjà traités. CASH utilise un système de corpus locaux plus rapide d’accès. On peut créer un nombre quelconque de corpus. Chaque corpus est attaché à une machine donnée et à un couple de langues donné. Bien que ce ne soit pas obligatoire, la méthode recommandée pour traiter un texte est de l’insérer préalablement dans un corpus. On se limite pour le moment à décrire l’utilisation des corpus. Leur création sera vue lorsque l’on décrira la structure de fichiers de CASH.

29 Accès à un corpus 2.Accès 1.Sélection : machine virtuelle couple de
langues 1.Sélection : corpus

30 La carte d’index d’un corpus et l’entrée d’un nouveau texte
Commande d’entrée d’un nouveau texte

31 Ecriture du nouveau texte et envoi à la carte de communication avec ARIANE

32 Choix du type de traitement et envoi à ARIANE

33 Rangement du résultat et accès à la trace

34 Exploitation d’une trace ROBRA : accès à une grammaire

35 Exploitation d’une trace ROBRA : accès à une règle

36 Enrichissement de dictionnaires

37 Accès à la pile d’échange de fichiers avec ARIANE
1. Sélection machine, langue, phase 2. Item up/downloading du menu « ARIANE »

38 La pile d’échange de fichiers avec ARIANE
Accès au fichier pour édition Réception du fichier présent dans ARIANE Envoi à ARIANE de la copie locale Sélection du fichier

39 Aide à l’enrichissement des dictionnaires
L’ajout d’un nouveau terme nécessite l’enrichissement d’au moins 3 dictionnaires dans la chaîne de traitement (dictionnaires d’AM, TL, GM), et éventuellement l’enrichissement des dictionnaires d’expansion lexicale (AX, AY,TX,TY,GX,GY). Ce travail peut être facilité dans l’environnement Revolution par la création d’une pile d’entrée de nouveaux termes. Cette pile, qui peut être associée à un dictionnaire classique bilingue, entre les caractéristiques du nouveau terme (entrée facilitée par l’utilisation d’un tableau de sélection), crée les nouveaux articles des différents dictionnaires, et les envoie à ARIANE. De telles piles n’ont été réalisées pour l’instant que dans le cadre du traitement UNL, pour lequel le nombre de dictionnaires est moindre.

40 Les chaînes d’exécution

41 Sélection des chaînes d’exécution dans la carte d’envoi d’une demande d’exécution

42 Accès à la visualisation d’une chaîne d’exécution
1. Sélection de la chaîne 2. Accès à la chaîne

43 Visualisation de la chaîne d’exécution

44 Accès à la préparation d’une chaîne d’exécution
1. Sélection 2. Accès

45 Préparation d’une chaîne d’exécution : choix des phases et des grammaires et dictionnaires
Exemple : sélection des dictionnaires de TL en cliquant ici

46 Préparation d’une chaîne d’exécution : choix des paramètres d’exécution
Exemple : demande d’une trace AS en cliquant ici


Télécharger ppt "ARIANE et son utilisation via l’interface CASH"

Présentations similaires


Annonces Google