ARIANE et son utilisation via l’interface CASH

Slides:



Advertisements
Présentations similaires
Le débogage Semaine 12 Version A15. Plan de leçon - Débogage  Commentaire javadoc  Définition  Fonctionnement  Point d’arrêt  Exécution  Contrôler.
Advertisements

UML EPITECH 2009 UML1 - Introduction UML – Définition – Historique – UML en entreprise – Couverture Concepts – Objet – Classe –
Catalog fonctionne sur vos données Catalog est préconfiguré pour fonctionner directement avec les données – WinBooks Accounting – WinBooks Logistics –
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
Sphinx Logiciel d'enquêtes ● Version 4,0 ● Aide à la rédaction ● Aide à l'analyse (croisement des données...)
Présentation stages 2009 (INRA) Développement des interfaces du projet VLE: GVLE & VLE-WEB.
AUTO - EVALUATION DE L'ELEVE GENERALITES POURQUOI ? - Permettre à l'élève de mesurer ses réussites, ses difficultés et d'identifier ses besoins. - L 'élève.
Développement à l'Aide de Langages Dynamiques : Smalltalk module IT308: Méthodologies et outils logiciels Nada Ayad, Damien Cassou et Annabelle Souc.
Présentation du programme
Utilisation du logiciel EduStat © Construire une épreuve.
Cycle élémentaire Année scolaire: Classe : CM1 Discipline: Français Éducatrice: Maya Madi.
Cycle élémentaire Année scolaire: Classe: CE1 Discipline: Français Éducatrice: Mme. Bernadette Melhem.
Livre numérique augmenté
Après 3 séances Tous les binômes ont commencé l'exercice « Formes »
Utilisation du logiciel EduStat©
Livret Scolaire Unique Numérique.
Programmation d'un aspirateur robot connecté
Classement alphabétique
Communication client-serveur
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Mise en place d’un système de partage de fichiers
Missions maîtrise de la langue et maternelle Année scolaire
EPREUVES HISTOIRE ET GEOGRAPHIE
Acquisition Rapide Multivoies
Application Réfractaires
Introduction aux Systèmes de Gestion de Bases de données
Guide d’utilisation Juin 2017.
Utiliser le dossier Mon EBSCOhost
de la productivité individuelle au travail collaboratif
Visite guidée - session 3 Les postes de charge et les gammes
Partie 3 : Google analytics : structure et principes de navigation
FLEx 1 Introduction et installation
Visite guidée - session 8 L’ordonnancement Métier : Fabrication
Exploitation d’albums au cycle 1
Production de documents pédagogiques et chaîne éditoriale
Chantier industriel Encaisseuse semi-automatique de chez CERMEX
Javadoc et débogueur Semaine 03 Version A17.
OWL-S.
Principes de programmation (suite)
Adapte, un logiciel pour aider l’enseignant à proposer des activités personnalisées à chacun de ses apprenants Marie Lefevre, Stéphanie Jean-Daubias, Nathalie.
GOBO Ne pas partir de zéro
Buffer Overflow Anatomy of an exploit.
Outils Statistiques pour la Sémantique Décembre 2013
Réalisation d’une application web sous le thème: «Mon vétérinaire » par : Benzineb Asmaa et Meftahi Oualid Présentation à Université Saad Dahlab Blida.
Programmation système
Commande d’une voiture par LABVIEW/ ARDUINO / Bluetooth
VALMEM Traduction automatique d'une description comportementale VHDL + annotations temporelles en automates temporisés A. Bara, E. Encrenaz LIP6 VALMEM.
Modélisation avec UML 2.0 Partie II Diagramme de classes.
Calcul Scientifique Initiation à SCILB
ACP Analyse en Composantes Principales
Outils et principes de base. Exemple d’application  Gestion de données d’enquête : Interface de saisie en ligne  insère directement les données dans.
Présentation de la base Frantext
La gestion des habilitations par le partenaire
Transfert d’IHM de PC vers PDA
Introduction à l’utilisation des corpus
TGV Trigger Générique Vme Face avant Tri d’événements de physique
FORMATIONS SAP Offres de formations.
Créer un diaporama avec Open Office Impress
BIOS- OS Environnement logiciel PC / Traitement numérique / Contrôle.
ANNÉE SCOLAIRE Carte d’extension Realisé par : FATIHA ESSADEQ Encadré par : MR TANARI.
Outils numérique pour la chimie Logiciel ChemSketch Réalisé par : Abdillahi Robleh Mohamed Martin Julien.
Lecture/Écriture de fichiers (I/O)
Tableaux croisés dynamiques sous Excel et Tableau Software :
Les nouveaux programmes de français 2019 Étude de la langue
FORMATIONS SAP Offres de formations.
Definition de html sommaire. Présentation de html, css et javascript Module 1.
Contenu Systèmes de test parallèles Multithreading Synchronisation
Implémentation de FTP Rappel sur FTP Relation entre un site Web et FTP
DONNÉE DE BASE QM Manuel de formation. Agenda 2  Introduction  Objectif de la formation  Données de base QM: Caractéristique de contrôle Catalogue.
Transcription de la présentation:

ARIANE et son utilisation via l’interface CASH

INTRODUCTION

Propos centré sur l’utilisation d’ARIANE via son interface. Objectif : - non utilisateurs de TA : permettre de faire connaissance avec ARIANE en l’utilisant de façon élémentaire (envoi de textes à la traduction, visualisation des diverses phases du traitement, enrichissement des dictionnaires…) - utilisateurs de TA : proposer un outil de développement complémentaire du moniteur. Ce n’est donc pas un cours sur ARIANE, mais seulement sur son utilisation pratique. Le niveau d’utilisation dépendra des connaissances préalables sur ARIANE. Pour les néophytes complets, les éléments suffisants (?) pour une utilisation élémentaire seront donnés.

ARIANE : Un générateur de systèmes de TA Conçu pour le développement de systèmes de TA Utilise des langages spécialisés de programmation linguistique Traite l’unité de traduction sous forme d’arbre décoré Particulièrement adapté à la méthode de transfert Version actuelle implantée sur ordinateurs IBM

CASH : Une interface de commande d’ARIANE (Commande d’ARIANE Sous Hypertexte) Écrite dans l’environnement « REVOLUTION » Utilisable sous Mac, PC, Unix Offre pratiquement toutes les fonctionnalité du moniteur original d’ARIANE Utilisation plus simple que le moniteur Liaison par sockets avec ARIANE

Premier aperçu d’un traitement ARIANE vu à travers CASH

Principe d’un système de TA de Transfert construit avec ARIANE G E N R A T I O T R A N S F E R L Y S Arbre Sémantique cible Arbre Multiniveau source Arbre Multiniveau cible This is an overall view of a MT transfer system designed on ARIANE; Starting from the source text, the translation proce"ss is performed in 3 steps : The analysis steps elaborates a so called 'multilievel' tree. This tree reflects the syntagmatic structure of the input sentence, but bears 3 levels of information : the morphologic, syntactic and semantic ones. The transfer step is mainly lexical : it translate the source words into the target ones. The morphologic and syntactic informations are no more relevant in the target language, it is the reason I described the tre at the input of the generation step as a semantic tree. The generation step builds the multilevel target tree, and finally the target text. Texte source Texte cible Arbre multiniveau : structure syntagmatique, 3 niveaux d’info (morphologique, syntactique, logico-semantique)

Environnement Revolution : écriture du texte source et envoi à la carte de communication avec ARIANE

Choix du type de traitement et envoi à ARIANE

Retour du résultat de traitement et accès à la visualisation de la trace

Résultat de l’Analyse Morphologique (AM) « Arbre plat », chaque nœud terminal correspond à une occurrence et comporte le résultat de l’analyse morphologique. Module essentiel : le dictionnaire monolingue. Langage de programmation : ATEF.

Résultat de l’Analyse Structurale (AS) « Arbre structuré », voisin d’un arbre de dépendance. Structure syntagmatique. Trois niveaux de décoration (morphologique, syntactique, logico-sémantique). Module principal : grammaires. Langage de programmation : ROBRA.

Résultat du transfert lexical (TL) et structural (TS) TL : Noeuds de l’arbre d’entrée (en langue source) sont transformés en nœuds (ou sous-arbres) en langue cible. Module principal : dictionnaires. Langage de programmation : EXPANS. TS : Ajustements de structure. Grammaires. ROBRA

Résultat de la génération structurale (GS) Construction de l’arbre syntaxique cible. Les nœuds terminaux portent les mots (non fléchis) de la phrase cible, dans l’ordre de la phrase. Module principal : grammaires. Langage de programmation : ROBRA.

Résultat de la génération morphologique (GM) Extraction des nœuds terminaux et flexions. Module principal : dictionnaires. Langage de programmation : SYGMOR.

Visualisation/Edition des copies locales des modules de traitement (dictionnaires et grammaires)

La pile principale CASH.rev Boutons d’accès : Fenêtres de sélection : machine virtuelle couple de langues phase module (gram, dic, etc) chaîne d’exécu- tion corpus de textes

Visualisation/Edition de modules d’une phase de Transfert Lexical

Extrait d’un dictionnaire de TL Procédure de condition et accès à sa description.

Une procédure de condition en TL Procédure de condition et accès à sa description.

Extrait d’un dictionnaire de TL Procédure d’ affectation et accès à sa description.

Une procédure d’affectation en TL Procédure d’ affectation et accès à sa description.

Visualisation/Edition de modules d’une phase d’Analyse Structurale

Premières lignes du graphe de contrôle d’une grammaire d’Analyse Structurale Grammaire élémentaire Nom de règle, et accès à la règle

Visualisation d’une règle ROBRA Texte de la règle Arbre objet Arbre image

Visualisation d’une Procédure de Condition Intersommet Nom et accès à la PCIS Description de la PCIS

Utilisation des corpus

Principe des corpus ARIANE offre un système de gestion des corpus contenant les textes à traiter ou déjà traités. CASH utilise un système de corpus locaux plus rapide d’accès. On peut créer un nombre quelconque de corpus. Chaque corpus est attaché à une machine donnée et à un couple de langues donné. Bien que ce ne soit pas obligatoire, la méthode recommandée pour traiter un texte est de l’insérer préalablement dans un corpus. On se limite pour le moment à décrire l’utilisation des corpus. Leur création sera vue lorsque l’on décrira la structure de fichiers de CASH.

Accès à un corpus 2.Accès 1.Sélection : machine virtuelle couple de langues 1.Sélection : corpus

La carte d’index d’un corpus et l’entrée d’un nouveau texte Commande d’entrée d’un nouveau texte

Ecriture du nouveau texte et envoi à la carte de communication avec ARIANE

Choix du type de traitement et envoi à ARIANE

Rangement du résultat et accès à la trace

Exploitation d’une trace ROBRA : accès à une grammaire

Exploitation d’une trace ROBRA : accès à une règle

Enrichissement de dictionnaires

Accès à la pile d’échange de fichiers avec ARIANE 1. Sélection machine, langue, phase 2. Item up/downloading du menu « ARIANE »

La pile d’échange de fichiers avec ARIANE Accès au fichier pour édition Réception du fichier présent dans ARIANE Envoi à ARIANE de la copie locale Sélection du fichier

Aide à l’enrichissement des dictionnaires L’ajout d’un nouveau terme nécessite l’enrichissement d’au moins 3 dictionnaires dans la chaîne de traitement (dictionnaires d’AM, TL, GM), et éventuellement l’enrichissement des dictionnaires d’expansion lexicale (AX, AY,TX,TY,GX,GY). Ce travail peut être facilité dans l’environnement Revolution par la création d’une pile d’entrée de nouveaux termes. Cette pile, qui peut être associée à un dictionnaire classique bilingue, entre les caractéristiques du nouveau terme (entrée facilitée par l’utilisation d’un tableau de sélection), crée les nouveaux articles des différents dictionnaires, et les envoie à ARIANE. De telles piles n’ont été réalisées pour l’instant que dans le cadre du traitement UNL, pour lequel le nombre de dictionnaires est moindre.

Les chaînes d’exécution

Sélection des chaînes d’exécution dans la carte d’envoi d’une demande d’exécution

Accès à la visualisation d’une chaîne d’exécution 1. Sélection de la chaîne 2. Accès à la chaîne

Visualisation de la chaîne d’exécution

Accès à la préparation d’une chaîne d’exécution 1. Sélection 2. Accès

Préparation d’une chaîne d’exécution : choix des phases et des grammaires et dictionnaires Exemple : sélection des dictionnaires de TL en cliquant ici

Préparation d’une chaîne d’exécution : choix des paramètres d’exécution Exemple : demande d’une trace AS en cliquant ici