La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

© Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/2002 1 TALN-02, Nancy, 24-27 juin 2002 Christian BOITET & TSAI Wang-Ju GETA, CLIPS, IMAG,

Présentations similaires


Présentation au sujet: "© Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/2002 1 TALN-02, Nancy, 24-27 juin 2002 Christian BOITET & TSAI Wang-Ju GETA, CLIPS, IMAG,"— Transcription de la présentation:

1

2 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ TALN-02, Nancy, juin 2002 Christian BOITET & TSAI Wang-Ju GETA, CLIPS, IMAG, Grenoble La coédition langue  UNL pour partager la révision entre les langues d'un document multilingue : un concept unificateur

3 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Plan Motivation : la TA de qualité multisource & multicible Pourquoi prendre UNL comme pivot pour cela ? Le prototype en cours de construction principe : diviser en 3 la correspondance (graphe  texte) interface : nécessité de modes allant du « naïf » à « expert » Un problème : calculer la 2° correspondance arbre-UNL  treille morphosyntaxique

4 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Motivation : TA de qualité multisource & multicible limites intrinsèques du processus classique 30 pages standard de 250 mots, en heures (trad+rév):  40*n en THum, (12+24/3)*n = 20 n en THAM (6=,12≈,12≠)  8*n avec THAM + TAO-R, et (30/3)*n = 10*n si TAO-R seule ==> (30/3)*n = 10 ou même (30/2)*n = 15, en éliminant n ? L0 L1 … L2 Ln P L0 L1 … L2 Ln

5 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Idée de base : éditer un « pivot » indirectement, en éditant un texte exemples de « coédition » réussie Ambassador (ancien), Multimétéo 2 problèmes:  établir la correspondance stucture abstraite  texte concret sans devoir créer de nouvelles ressources coûteuses  construire une interface réellement utilisable

6 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Pourquoi prendre UNL comme pivot pour cela ? bref rappel UNL comme  projet  langage  format de document multilingue qualités uniques du langage UNL même s’il est perfectible !

7 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Langage : un graphe UNL simple Ronaldo has headed the ball into the left corner of the goal”

8 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Un graphe UNL avec récursion et arbre auxiliaire UNL Isaac sees that an apple falls and he explains it. noun)) agt(see(icl>do),Isaac(icl>proper noun) obj(see(icl>do),:01) explain Isaac:01 agt see :01 obj and apple fall obj Isaac:01 agt :01 obj Arbre UNL (auxiliaire) explain Isaac agt see agt :01 obj and :01 apple fall obj (Hyper)graphe UNL

9 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Que dire du langage UNL ? Petite controverse en cours… Une façon de voir un (hyper)graphe UNL : il correspond à un énoncé U-L en langue L en représentant la structure abstraite  d’un énoncé anglais équivalent U-E  comme « vu depuis L » ==> les attributs sémantiques non nécessairement exprimés en L peuvent être absents : sous-spécification fréquente  aspect en venant du français,  détermination ou nombre en venant du japonais,  etc.

10 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Raisons d’utiliser UNL en TAO (il est utilisable pour bien plus !) Réussite technique de la TAO par pivot (ATLAS, PIVOT, ULTRA, KANT) UNL dérive du pivot d’ATLAS-II (Fujitsu) conçu par le même auteur (H. Uchida) Qualité et couverture possibles : ATLAS-II est le meilleur système E  J depuis > 10 ans il a termes dans chaque dico Certes moins bien à la limite que le transfert par structures « multiniveau » MAIS on peut « coéditer » UNL à partir de toute langue

11 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Le format UNL-html original Example 1 El/UNL [D:dn=Mar Example 1, on= UNL French, [P] [S:1] {org:el}I ran in the park yesterday.{/org} {unl} def) {/unl} {cn dtime= , deco=man} 我昨天在公園裡跑步 {/cn} {de dtime= , deco=man} Ich lief gestern im Park. {/de} {es dtime= , deco=UNL-SP} Yo corri ayer en el parque.{/es} {fr dtime= , deco=UNL-FR} J’ai couru dans le parc hier. {/fr}[/S] [S:2] {org:el}My dog barked at me.{/org} {unl} pos(dog(icl>animal),i(icl>person)) {/unl}{de dtime= , deco=man} Mein Hund bellte zu mir.{/de} {fr dtime= , deco=UNL-FR} Mon chien aboya pour moi. [/S] [/P][/D]

12 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Le format UNL-xml équivalent même simplicité que UNL-html ouverture à tous les outils liés à xml 我昨天在公園裡跑步 我昨天在公園裡跑步 Ich lief in den Park gestern. I ran in the pary yesterday. Yo corri ayer en el parque. J’ai couru dans le parc hier.

13 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Sortie du visualiseur et affichage dans un navigateur Output from viewer Example 1 El/UNL J’ai couru dans le parc hier. Mon chien aboya pour moi. Display Example 1 El/UNL J’ai couru dans le parc hier. Mon chien aboya pour moi.

14 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Scénario lecture d’un document multilingue en langue Li désir de corriger des erreurs en Li passage dans l’environnement de coédition corrections retardées sur le texte immédiates sur le graphe déconversion en Li itération si non satisfaisant, déconversion vers L1…Ln si OK retour à la lecture

15 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Exemple de « FB2004 » cité dans l’article FB2204 = Forum Barcelona 2004 projet de « normalisation d’usage » d’UNL espagnol, italien, russe, français, hindi 6-8 mois en 2001

16 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Exemple Une cité retrouvera une zone côtière après un forum  La cité retrouvera une zone côtière après le Forum

17 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Le graphe UNL initial city) after) ) obj(after, forum) coastal)

18 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Modifications à faire ajouter sur les nœuds contenant "city", “forum". ajouter « icl>proper name » comme restriction de l’UW “forum”.

19 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ L’interface Accessible depuis un navigateur Mode normal sans voir de structure Mode expert (fanas, jeunes…)

20 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Le graphe UNL corrigé after) ) obj(after, forum(icl>proper coastal)

21 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Original text Possible Modifications Second Deconversion Manual Insertion Une cité retrouvera une zone côtière après un forum. Show Graph La cité retrouvera une zone côtière après le Forum. DeconversionFind Lemma Une cité retrouvera une zone côtière après un forum. Spanish Italian Japanese Chinese Find CorrespondenceSave Graph English After a Forum, a city will retrieve a coastal zone. Ciudad recobrarà una zona de costal después Foro. Città ricuperarà une zona costiera dopo Forum. フォーラムの後で, 都市は沿 岸水域を取り出 在博覽會之後,城市 將獲得 一片海岸域 After the Forum, the city will have recovered a coastal zone. La ciudad habrá recobrado una zona de costal después el Foro La città ha ricuperarà une zona costiera dopo il Forum. フォーラムの後で, 都市は沿 岸水域を取り出すことを 持っている。 在博覽會之後,城市 將獲得 一片海岸域 QuitSaveMultiple text viewSimple text view

22 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/

23 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/

24 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/

25 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/

26 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/

27 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Principes de la coédition Il est impossible en principe de déduire une modification sur le graphe d’une modification sur le texte Par exemple, remplacer "un" ("a") par "le" ("the") n’implique pas que le nom suivant soit déterminé  "il aime la montagne" = "he likes mountains" La révision n’est pas faite en modifiant directement le texte, mais en utilisant un système de menus Les items de menu ont un « côté langue » et un « côté UNL » caché

28 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Construction de la correspondance Division en trois sous-correspondances Graphe UNL =1= Arbre UNL obtenu par dépliement du graphe =2= SMStreille ou automate morphosyntaxique =3= Texte Pour =2=, calcul des liaisons en utilisant 1 ou 2 dictionnaires L0  anglais ou UNL Relations connues entre attributs L0 et attributs UNL Principe de projectivité maximale (rotation de l’arbre)

29 © Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/ Suite sous Internet Explorer Scénario Vue des structures Construction de la correspondance Conclusion anticipée La « révision partagée » semble possible Coédition = concept unificateur entre TAO et génération multilingue


Télécharger ppt "© Ch. Boitet & Wang-Ju Tsai (GETA, CLIPS) TALN-02, Nancy, 26/6/2002 1 TALN-02, Nancy, 24-27 juin 2002 Christian BOITET & TSAI Wang-Ju GETA, CLIPS, IMAG,"

Présentations similaires


Annonces Google