La coédition langueUNL pour partager la révision entre les langues d'un document multilingue : un concept unificateur TALN-02, Nancy, 24-27 juin 2002.

Slides:



Advertisements
Présentations similaires
19/06/02Kikiteam-ASI3n°1 / 21 Lenchere est en hausse… Forum, FAQ, Stats ! By KiKiTeam : Maxime Chambreuil, Minh LeHoai, Samy Fouilleux, Soizic Geslin.
Advertisements

Possibilités de Facebook dans votre club Toastmasters Samedi, le 12 juin 2010 Michel Beaulieu
Le moteur
Présentation du Stage en Entreprise
AUTRES ASPECTS DU GPS Partie I : tolérance de Battement
Proposition de recherches sur ABI (Pro Quest) Lise Herzhaft (Urfist de Lyon) et MH Prévoteau (Bibliothèque Université Paris 2) Mise en forme par Nolwenn.
Classe : …………… Nom : …………………………………… Date : ………………..
INTROIIIIIIIVCONC p. 1 La coédition langue UNL pour partager la révision entre les langues d'un document multilingue Wang-Ju Tsai GETA, laboratoire CLIPS,
Les numéros
ACTIVITES Le calcul littéral (3).
Les Prepositions.
Les 3 dimensio ns de la morale et de léthique (activité)
Exercice #14 Quel âge as-tu? Quel âge a ton frère/ta sœur? Translate:
Cours MIAGE « Architectures Orientées Services » Henry Boccon-Gibod 1 Architectures Orientées Services Composants de Service Exemple pratique de développement.
1. 2 Informations nécessaires à la création dun intervenant 1.Sa désignation –Son identité, ses coordonnées, son statut 2.Sa situation administrative.
JXDVDTEK – Une DVDthèque en Java et XML
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
Défi écriture BEF Couverture. Défi écriture BEF Page 1.
Autorisations Utilisation eCATT
What is todays date and when is your birthday Ask someone what star sign they are and answer Say and ask for the time Say what you do for your birthday.
Page 1 Introduction à ATEasy 3.0 Page 2 Quest ce quATEasy 3.0? n Ensemble de développement très simple demploi n Conçu pour développer des bancs de test.
CALENDRIER PLAYBOY 2020 Cliquez pour avancer.

1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
OLAP : Un pas vers la navigation
Unit 2, lesson A : Objectif
Internet : la mémoire courte ? Capture de sites Web en ligne Conférence B.N.F, Avril 2004 Xavier Roche(HTTrack)
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
La Saint-Valentin Par Matt Maxwell.
2 TP avec l ’aide d ’un modeleur 3D :

Développer en C avec Eclipse Introduction Création d'un projet Ajout de fichiers Compilation Exécution Utiliser le débogueur Département dinformatique.
1. 2 PLAN DE LA PRÉSENTATION - SECTION 1 : Code HTML - SECTION 2.1. : CSS (Méthode 1) - SECTION 2.2. : CSS (Méthode 2) - SECTION 3 : JavaScript - SECTION.
Match-up the numbers to the letters
Notre calendrier français MARS 2014
Objectives Revise the numbers Say and ask for the time in French Say when you do different activities Ecrivez la date.
Comment choisir un métier…
Quelle heure est-il ??. THE TIME: OCLOCK IL EST HEURE IL EST + + HEURES etc.
C'est pour bientôt.....
Les nombres.
Veuillez trouver ci-joint
DISCRIMINATION VISUELLE
F L T R Université catholique de Louvain-la-Neuve Faculté de philosophie et lettres FLTR Faculté de Philosophie et Lettres Présentation décembre 2002 Réalisation:
LA GESTION COLLABORATIVE DE PROJETS Grâce aux outils du Web /03/2011 Académie de Créteil - Nadine DUDRAGNE 1.
Page 1 © Jean Elias Gagner en agilité numérique. Page 2 © Jean Elias Les fournisseurs.
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI

ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Stage 2A CS80 pour Origin 1/28. 1) Presentation of the internship 2) The Multi-Oscillator 3) Connection-GUI’s API Conclusion Stage 2A CS80 pour Origin.
Page 1 © Jean Elias Recherche et veille. Page 2 © Jean Elias Les fournisseurs.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Création et présentation d’un tableau avec Word 2007
Objectives Revise the numbers Say and ask for the time in French Tell what part of the day it is Ecrivez la date Aujourd’hui c’est _________, le _____.
CALENDRIER-PLAYBOY 2020.

1. Présentation générale du système
6 Nombres et Heures 20 vingt 30 trente 40 quarante.
Slide 1 of 39 Waterside Village Fête ses 20 ans.
Leçon 3.
Quel est l’intérêt d’utiliser le diagramme de Gantt dans la démarche de projet A partir d’un exemple concret, nous allons pouvoir exploiter plusieurs parties.
Dr. KHERRI Abdenacer 2014/ ECOLE DES HAUTES ETUDES COMMERCIALES.
Les Chiffres Prêts?
Université de Sherbrooke
22 Visual Studio Tools et Office 2010 Thomas LEBRUN Architecte Access It Sebastien BOVO Application Dev Consultant Microsoft France
1 Formation à l’usage éco-performant de votre pc 1 ère Partie.
Tirer le meilleur parti d’Office /10/ Vincent Bippus IT/OIS 07 octobre 2014.
BREVET A CENTRE DE TUBIZE
Transcription de la présentation:

La coédition langueUNL pour partager la révision entre les langues d'un document multilingue : un concept unificateur TALN-02, Nancy, 24-27 juin 2002 Christian BOITET & TSAI Wang-Ju GETA, CLIPS, IMAG, Grenoble Christian.Boitet@imag.fr, Wang-Ju.Tsai@imag.fr http://www-clips.imag.fr/geta/User/wang-ju.tsai/welcome.html

Plan Motivation : la TA de qualité multisource & multicible Pourquoi prendre UNL comme pivot pour cela ? Le prototype en cours de construction principe : diviser en 3 la correspondance (graphetexte) interface : nécessité de modes allant du « naïf » à « expert » Un problème : calculer la 2° correspondance arbre-UNL  treille morphosyntaxique

Motivation : TA de qualité multisource & multicible limites intrinsèques du processus classique 30 pages standard de 250 mots, en heures (trad+rév): 40*n en THum, (12+24/3)*n = 20 n en THAM (6=,12≈,12≠) 8*n avec THAM + TAO-R, et (30/3)*n = 10*n si TAO-R seule ==> (30/3)*n = 10 ou même (30/2)*n = 15, en éliminant n ? L0 L1 … L2 Ln L0 L1 … L2 Ln P

Idée de base : éditer un « pivot » indirectement, en éditant un texte exemples de « coédition » réussie Ambassador (ancien), Multimétéo 2 problèmes: établir la correspondance stucture abstraite  texte concret sans devoir créer de nouvelles ressources coûteuses construire une interface réellement utilisable

Pourquoi prendre UNL comme pivot pour cela ? bref rappel UNL comme projet langage format de document multilingue qualités uniques du langage UNL même s’il est perfectible !

Langage : un graphe UNL simple Ronaldo has headed the ball into the left corner of the goal”

Un graphe UNL avec récursion et arbre auxiliaire UNL Isaac sees that an apple falls and he explains it. agt(explain(icl>do).@entry,Isaac(icl>proper noun)) obj(explain(icl>do).@entry,:01) obj:01(fall(icl>occur).@entry,apple) and(explain(icl>do).@entry,see(icl>do)) agt(see(icl>do),Isaac(icl>proper noun) obj(see(icl>do),:01) explain Isaac agt see :01 obj and apple fall (Hyper)graphe UNL explain Isaac:01 agt see :01 obj and apple fall Arbre UNL (auxiliaire)

Que dire du langage UNL ? Petite controverse en cours… Une façon de voir un (hyper)graphe UNL : il correspond à un énoncé U-L en langue L en représentant la structure abstraite d’un énoncé anglais équivalent U-E comme « vu depuis L » ==> les attributs sémantiques non nécessairement exprimés en L peuvent être absents : sous-spécification fréquente aspect en venant du français, détermination ou nombre en venant du japonais, etc.

Raisons d’utiliser UNL en TAO (il est utilisable pour bien plus !) Réussite technique de la TAO par pivot (ATLAS, PIVOT, ULTRA, KANT) UNL dérive du pivot d’ATLAS-II (Fujitsu) conçu par le même auteur (H. Uchida) Qualité et couverture possibles : ATLAS-II est le meilleur système E J depuis > 10 ans il a 586.000 termes dans chaque dico Certes moins bien à la limite que le transfert par structures « multiniveau » MAIS on peut « coéditer » UNL à partir de toute langue

Le format UNL-html original <HTML><HEAD><TITLE> Example 1 El/UNL </TITLE></HEAD><BODY> [D:dn=Mar Example 1, on= UNL French, mid=First.Author@here.com] [P] [S:1] {org:el}I ran in the park yesterday.{/org} {unl} agt(run(icl>do).@entry.@past,i(icl>person)) plc(run(icl>do).@entry.@past,park(icl>place).@def) tim(run(icl>do).@entry.@past,yesterday) {/unl} {cn dtime=20020130-2030, deco=man} 我昨天在公園裡跑步{/cn} {de dtime=20020130-2035, deco=man} Ich lief gestern im Park. {/de} {es dtime=20020130-2031, deco=UNL-SP} Yo corri ayer en el parque.{/es} {fr dtime=20020131-0805, deco=UNL-FR} J’ai couru dans le parc hier. {/fr}[/S] [S:2] {org:el}My dog barked at me.{/org} agt(bark(icl>do).@entry.@past,dog(icl>animal)) gol(bark(icl>do).@entry.@past,i(icl>person)) pos(dog(icl>animal),i(icl>person)) {/unl}{de dtime=20020130-2036, deco=man} Mein Hund bellte zu mir.{/de} {fr dtime=20020131-0806, deco=UNL-FR} Mon chien aboya pour moi. [/S] [/P][/D] </BODY></HTML>

Le format UNL-xml équivalent même simplicité que UNL-html ouverture à tous les outils liés à xml <unl:GS lang=“cn”> 我昨天在公園裡跑步</unl:GS> <unl:GS lang=“de”> Ich lief in den Park gestern. </unl:GS> <unl:GS lang=“el”> I ran in the pary yesterday.</unl:GS> <unl:GS lang=“es”> Yo corri ayer en el parque.</unl:GS> <unl:GS lang=“fr”> J’ai couru dans le parc hier. </unl:GS> </unl:S></unl:P></unl:D> <unl:D on=“WJT” dt=“04032002”> <unl:P number=“1”> <unl:S number=“1’> <unl:org: lang=“cn”> 我昨天在公園裡跑步 </unl:org> <unl:unl sn=“Ariane” pn=“WJT” dt=“04032002”> agt(run.@entry.@past,i) plc(run.@entry.@past,park.@def) tim(run.@entry.@past,yesterday) </unl:unl>

Sortie du visualiseur et affichage dans un navigateur Output from viewer <HTML><HEAD><TITLE> Example 1 El/UNL </TITLE></HEAD><BODY> J’ai couru dans le parc hier. Mon chien aboya pour moi. </BODY></HTML> Display J’ai couru dans le parc hier. Mon chien aboya pour moi.

Scénario lecture d’un document multilingue en langue Li désir de corriger des erreurs en Li passage dans l’environnement de coédition corrections retardées sur le texte immédiates sur le graphe déconversion en Li itération si non satisfaisant, déconversion vers L1…Ln si OK retour à la lecture

Exemple de « FB2004 » cité dans l’article FB2204 = Forum Barcelona 2004 projet de « normalisation d’usage » d’UNL espagnol, italien, russe, français, hindi 6-8 mois en 2001

Exemple Une cité retrouvera une zone côtière après un forum La cité retrouvera une zone côtière après le Forum

Le graphe UNL initial agt(retrieve(icl>do).@entry.@future.@complete, city) tim(retrieve(icl>do).@entry.@future.@complete, after) obj(retrieve(icl>do).@entry.@future.@complete, zone(icl>place).@indef ) obj(after, forum) mod(zone(icl>place).@indef , coastal)

Modifications à faire ajouter ".@def" sur les nœuds contenant "city", “forum". ajouter « icl>proper name » comme restriction de l’UW “forum”.

L’interface Accessible depuis un navigateur Mode normal sans voir de structure Mode expert (fanas, jeunes…)

Le graphe UNL corrigé agt(retrieve(icl>do).@entry.@future.@complete, city.@def) tim(retrieve(icl>do).@entry.@future.@complete, after) obj(retrieve(icl>do).@entry.@future.@complete, zone(icl>place).@indef ) obj(after, forum(icl>proper name).@def) mod(zone(icl>place).@indef , coastal)

Save Graph Quit Save Multiple text view Simple text view Original text Possible Modifications Second Deconversion Manual Insertion Une cité retrouvera une zone côtière après un forum. Show Graph La cité retrouvera une zone côtière après le Forum. Deconversion Find Lemma Spanish Italian Japanese Chinese Find Correspondence Save Graph English After a Forum, a city will retrieve a coastal zone. Ciudad recobrarà una zona de costal después Foro. Città ricuperarà une zona costiera dopo Forum. フォーラムの後で, 都市は沿岸水域を取り出 在博覽會之後,城市 將獲得一片海岸域 After the Forum, the city will have recovered a coastal zone. La ciudad habrá recobrado una zona de costal después el Foro La città ha ricuperarà une zona costiera dopo il Forum. フォーラムの後で, 都市は沿 岸水域を取り出すことを 持っている。 在博覽會之後,城市 將獲得 一片海岸域 Quit Save Multiple text view Simple text view

English Spanish Italian Japanese Chinese Graph : lemma, lattice Original text Possible Modifications Second Deconversion Manual Insertion Une cité retrouvera une zone côtière après un forum. Show Graph Deconversion Find Lemma English After a Forum, a city will retrieve a coastal zone. Spanish Ciudad recobrarà una zona de costal después Foro. Italian Città ricuperarà une zona costiera dopo Forum. Japanese フォーラムの後で, 都市は沿岸水域を取り出 Chinese 在博覽會之後,城市 將獲得一片海岸域 Graph : lemma, lattice Quit Save Find Correspondence Save Graph After the Forum, the city will have retrieved a coastal zone. La ciudad habrá una zona de costal después el Foro La città ha ricuperarà une zona costiera dopo il Forum. フォーラムの後で, 都市は沿 岸水域を取り出すことを 持っている。 在博覽會之後,城市 將獲得 一片海岸域 un cité retrouver zone côtier après Forum a dormatory city retrieve find remember coastal after area

Quit Save Multiple text view Simple text view Save Graph Original text To Do Second Deconversion Manual Insertion Une cité retrouvera une zone côtière après un forum. la La cité retrouvera une zone côtière après le Forum. Graph : correspondence un cité retrouver zone côtier après Forum a dormitory city retrieve find remember coastal after area retrieve (icl>do)(.@entry.@future) city(agt) zone(icl>place)(.@indef, obj) coastal(mod) after(tim) Forum(obj) indef art noun verb indef art noun adj prop indef art noun sin sin future sin sin sin sin sin Show Graph Deconversion Find Lemma Find Correspondence Save Graph English After a Forum, a city will retrieve a coastal zone. Ciudad recobrará una zona de costal después Foro. Città ricuperarà une zona costiera dopo Forum. フォーラムの後で, 都市は沿岸水域を取り出 在博覽會之後,城市 將獲得一片海岸域 After the Forum, the city will have recovered a coastal zone. La ciudad habrá recobrado una zona de costal después el Foro. La città ha ricuperato une zona costiera dopo il Forum. フォーラムの後で, 都市は沿 岸水域を取り出すことを 持っている。 在博覽會之後,城市 將獲得 一片海岸域 Spanish Italian Japanese Chinese le Maj

Principes de la coédition Il est impossible en principe de déduire une modification sur le graphe d’une modification sur le texte Par exemple, remplacer "un" ("a") par "le" ("the") n’implique pas que le nom suivant soit déterminé (.@def) "il aime la montagne" = "he likes mountains" La révision n’est pas faite en modifiant directement le texte, mais en utilisant un système de menus Les items de menu ont un « côté langue » et un « côté UNL » caché

Construction de la correspondance Division en trois sous-correspondances Graphe UNL =1= Arbre UNL obtenu par dépliement du graphe =2= SMS treille ou automate morphosyntaxique =3= Texte Pour =2=, calcul des liaisons en utilisant 1 ou 2 dictionnaires L0anglais ou UNL Relations connues entre attributs L0 et attributs UNL Principe de projectivité maximale (rotation de l’arbre)

Suite sous Internet Explorer Scénario Vue des structures Construction de la correspondance Conclusion anticipée La « révision partagée » semble possible Coédition = concept unificateur entre TAO et génération multilingue