La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

La coédition langueUNL pour partager la révision entre les langues d'un document multilingue : un concept unificateur TALN-02, Nancy, 24-27 juin 2002.

Présentations similaires


Présentation au sujet: "La coédition langueUNL pour partager la révision entre les langues d'un document multilingue : un concept unificateur TALN-02, Nancy, 24-27 juin 2002."— Transcription de la présentation:

1 La coédition langueUNL pour partager la révision entre les langues d'un document multilingue : un concept unificateur TALN-02, Nancy, juin 2002 Christian BOITET & TSAI Wang-Ju GETA, CLIPS, IMAG, Grenoble

2 Plan Motivation : la TA de qualité multisource & multicible
Pourquoi prendre UNL comme pivot pour cela ? Le prototype en cours de construction principe : diviser en 3 la correspondance (graphetexte) interface : nécessité de modes allant du « naïf » à « expert » Un problème : calculer la 2° correspondance arbre-UNL  treille morphosyntaxique

3 Motivation : TA de qualité multisource & multicible
limites intrinsèques du processus classique 30 pages standard de 250 mots, en heures (trad+rév): 40*n en THum, (12+24/3)*n = 20 n en THAM (6=,12≈,12≠) 8*n avec THAM + TAO-R, et (30/3)*n = 10*n si TAO-R seule ==> (30/3)*n = 10 ou même (30/2)*n = 15, en éliminant n ? L0 L1 L2 Ln L0 L1 L2 Ln P

4 Idée de base : éditer un « pivot » indirectement, en éditant un texte
exemples de « coédition » réussie Ambassador (ancien), Multimétéo 2 problèmes: établir la correspondance stucture abstraite  texte concret sans devoir créer de nouvelles ressources coûteuses construire une interface réellement utilisable

5 Pourquoi prendre UNL comme pivot pour cela ?
bref rappel UNL comme projet langage format de document multilingue qualités uniques du langage UNL même s’il est perfectible !

6 Langage : un graphe UNL simple
Ronaldo has headed the ball into the left corner of the goal”

7 Un graphe UNL avec récursion et arbre auxiliaire UNL
Isaac sees that an apple falls and he explains it. noun)) agt(see(icl>do),Isaac(icl>proper noun) obj(see(icl>do),:01) explain Isaac agt see :01 obj and apple fall (Hyper)graphe UNL explain Isaac:01 agt see :01 obj and apple fall Arbre UNL (auxiliaire)

8 Que dire du langage UNL ? Petite controverse en cours…
Une façon de voir un (hyper)graphe UNL : il correspond à un énoncé U-L en langue L en représentant la structure abstraite d’un énoncé anglais équivalent U-E comme « vu depuis L » ==> les attributs sémantiques non nécessairement exprimés en L peuvent être absents : sous-spécification fréquente aspect en venant du français, détermination ou nombre en venant du japonais, etc.

9 Raisons d’utiliser UNL en TAO
(il est utilisable pour bien plus !) Réussite technique de la TAO par pivot (ATLAS, PIVOT, ULTRA, KANT) UNL dérive du pivot d’ATLAS-II (Fujitsu) conçu par le même auteur (H. Uchida) Qualité et couverture possibles : ATLAS-II est le meilleur système E J depuis > 10 ans il a termes dans chaque dico Certes moins bien à la limite que le transfert par structures « multiniveau » MAIS on peut « coéditer » UNL à partir de toute langue

10 Le format UNL-html original
<HTML><HEAD><TITLE> Example 1 El/UNL </TITLE></HEAD><BODY> [D:dn=Mar Example 1, on= UNL French, [P] [S:1] {org:el}I ran in the park yesterday.{/org} {unl} {/unl} {cn dtime= , deco=man} 我昨天在公園裡跑步{/cn} {de dtime= , deco=man} Ich lief gestern im Park. {/de} {es dtime= , deco=UNL-SP} Yo corri ayer en el parque.{/es} {fr dtime= , deco=UNL-FR} J’ai couru dans le parc hier. {/fr}[/S] [S:2] {org:el}My dog barked at me.{/org} pos(dog(icl>animal),i(icl>person)) {/unl}{de dtime= , deco=man} Mein Hund bellte zu mir.{/de} {fr dtime= , deco=UNL-FR} Mon chien aboya pour moi. [/S] [/P][/D] </BODY></HTML>

11 Le format UNL-xml équivalent
même simplicité que UNL-html ouverture à tous les outils liés à xml <unl:GS lang=“cn”> 我昨天在公園裡跑步</unl:GS> <unl:GS lang=“de”> Ich lief in den Park gestern. </unl:GS> <unl:GS lang=“el”> I ran in the pary yesterday.</unl:GS> <unl:GS lang=“es”> Yo corri ayer en el parque.</unl:GS> <unl:GS lang=“fr”> J’ai couru dans le parc hier. </unl:GS> </unl:S></unl:P></unl:D> <unl:D on=“WJT” dt=“ ”> <unl:P number=“1”> <unl:S number=“1’> <unl:org: lang=“cn”> 我昨天在公園裡跑步 </unl:org> <unl:unl sn=“Ariane” pn=“WJT” dt=“ ”> </unl:unl>

12 Sortie du visualiseur et affichage dans un navigateur
Output from viewer <HTML><HEAD><TITLE> Example 1 El/UNL </TITLE></HEAD><BODY> J’ai couru dans le parc hier. Mon chien aboya pour moi. </BODY></HTML> Display J’ai couru dans le parc hier. Mon chien aboya pour moi.

13 Scénario lecture d’un document multilingue en langue Li
désir de corriger des erreurs en Li passage dans l’environnement de coédition corrections retardées sur le texte immédiates sur le graphe déconversion en Li itération si non satisfaisant, déconversion vers L1…Ln si OK retour à la lecture

14 Exemple de « FB2004 » cité dans l’article
FB2204 = Forum Barcelona 2004 projet de « normalisation d’usage » d’UNL espagnol, italien, russe, français, hindi 6-8 mois en 2001

15 Exemple Une cité retrouvera une zone côtière après un forum
La cité retrouvera une zone côtière après le Forum

16 Le graphe UNL initial city) after) ) obj(after, forum) , coastal)

17 Modifications à faire ajouter sur les nœuds contenant "city", “forum". ajouter « icl>proper name » comme restriction de l’UW “forum”.

18 L’interface Accessible depuis un navigateur
Mode normal sans voir de structure Mode expert (fanas, jeunes…)

19 Le graphe UNL corrigé after) ) obj(after, forum(icl>proper , coastal)

20 Save Graph Quit Save Multiple text view Simple text view
Original text Possible Modifications Second Deconversion Manual Insertion Une cité retrouvera une zone côtière après un forum. Show Graph La cité retrouvera une zone côtière après le Forum. Deconversion Find Lemma Spanish Italian Japanese Chinese Find Correspondence Save Graph English After a Forum, a city will retrieve a coastal zone. Ciudad recobrarà una zona de costal después Foro. Città ricuperarà une zona costiera dopo Forum. フォーラムの後で, 都市は沿岸水域を取り出 在博覽會之後,城市 將獲得一片海岸域 After the Forum, the city will have recovered a coastal zone. La ciudad habrá recobrado una zona de costal después el Foro La città ha ricuperarà une zona costiera dopo il Forum. フォーラムの後で, 都市は沿 岸水域を取り出すことを 持っている。 在博覽會之後,城市 將獲得 一片海岸域 Quit Save Multiple text view Simple text view

21 English Spanish Italian Japanese Chinese Graph : lemma, lattice
Original text Possible Modifications Second Deconversion Manual Insertion Une cité retrouvera une zone côtière après un forum. Show Graph Deconversion Find Lemma English After a Forum, a city will retrieve a coastal zone. Spanish Ciudad recobrarà una zona de costal después Foro. Italian Città ricuperarà une zona costiera dopo Forum. Japanese フォーラムの後で, 都市は沿岸水域を取り出 Chinese 在博覽會之後,城市 將獲得一片海岸域 Graph : lemma, lattice Quit Save Find Correspondence Save Graph After the Forum, the city will have retrieved a coastal zone. La ciudad habrá una zona de costal después el Foro La città ha ricuperarà une zona costiera dopo il Forum. フォーラムの後で, 都市は沿 岸水域を取り出すことを 持っている。 在博覽會之後,城市 將獲得 一片海岸域 un cité retrouver zone côtier après Forum a dormatory city retrieve find remember coastal after area

22 Quit Save Multiple text view Simple text view Save Graph
Original text To Do Second Deconversion Manual Insertion Une cité retrouvera une zone côtière après un forum. la La cité retrouvera une zone côtière après le Forum. Graph : correspondence un cité retrouver zone côtier après Forum a dormitory city retrieve find remember coastal after area retrieve city(agt) obj) coastal(mod) after(tim) Forum(obj) indef art noun verb indef art noun adj prop indef art noun sin sin future sin sin sin sin sin Show Graph Deconversion Find Lemma Find Correspondence Save Graph English After a Forum, a city will retrieve a coastal zone. Ciudad recobrará una zona de costal después Foro. Città ricuperarà une zona costiera dopo Forum. フォーラムの後で, 都市は沿岸水域を取り出 在博覽會之後,城市 將獲得一片海岸域 After the Forum, the city will have recovered a coastal zone. La ciudad habrá recobrado una zona de costal después el Foro. La città ha ricuperato une zona costiera dopo il Forum. フォーラムの後で, 都市は沿 岸水域を取り出すことを 持っている。 在博覽會之後,城市 將獲得 一片海岸域 Spanish Italian Japanese Chinese le Maj

23

24

25

26 Principes de la coédition
Il est impossible en principe de déduire une modification sur le graphe d’une modification sur le texte Par exemple, remplacer "un" ("a") par "le" ("the") n’implique pas que le nom suivant soit déterminé "il aime la montagne" = "he likes mountains" La révision n’est pas faite en modifiant directement le texte, mais en utilisant un système de menus Les items de menu ont un « côté langue » et un « côté UNL » caché

27 Construction de la correspondance
Division en trois sous-correspondances Graphe UNL =1= Arbre UNL obtenu par dépliement du graphe =2= SMS treille ou automate morphosyntaxique =3= Texte Pour =2=, calcul des liaisons en utilisant 1 ou 2 dictionnaires L0anglais ou UNL Relations connues entre attributs L0 et attributs UNL Principe de projectivité maximale (rotation de l’arbre)

28 Suite sous Internet Explorer
Scénario Vue des structures Construction de la correspondance Conclusion anticipée La « révision partagée » semble possible Coédition = concept unificateur entre TAO et génération multilingue


Télécharger ppt "La coédition langueUNL pour partager la révision entre les langues d'un document multilingue : un concept unificateur TALN-02, Nancy, 24-27 juin 2002."

Présentations similaires


Annonces Google