La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

INTROIIIIIIIVCONC p. 1 La coédition langue UNL pour partager la révision entre les langues d'un document multilingue Wang-Ju Tsai GETA, laboratoire CLIPS,

Présentations similaires


Présentation au sujet: "INTROIIIIIIIVCONC p. 1 La coédition langue UNL pour partager la révision entre les langues d'un document multilingue Wang-Ju Tsai GETA, laboratoire CLIPS,"— Transcription de la présentation:

1

2 INTROIIIIIIIVCONC p. 1 La coédition langue UNL pour partager la révision entre les langues d'un document multilingue Wang-Ju Tsai GETA, laboratoire CLIPS, IMAG Université Joseph Fourier Thèse préparée sous la direction de Ch. Boitet

3 INTROIIIIIIIVCONC p. 2 Un exemple: difficulté de gérer une page d'accueil multilingue Cinq langues correctement produites sur la page daccueil du site Papillon grâce à une coopération académique

4 INTROIIIIIIIVCONC p. 3 Exemple (suite) Comment ajouter "hindi" à la liste des langues ? Comment ajouter le paragraphe de présentation en malais ? Comment corriger une erreur en français et la répercuter ?

5 INTROIIIIIIIVCONC p. 4 Original: Pivot (anglais) : The potato has prevented the cholesterol advances function Fr: La pomme de terre a empêché la fonction à l'avance de cholestérol Jp: Ru: Картошка предотвращала функцию выдвижений холестерола Es: La patata ha prevenido la función de los avances del colesterol Ce qu'on arrive à faire en pratique On crée un document multilingue « patchwork » via Systran On utilise le texte anglais généré comme "pivot" :-(; Impossible de corriger sans connaître le chinois ET langlais

6 INTROIIIIIIIVCONC p. 5 Analyse En utilisant une langue naturelle comme pivot, les erreurs s'accumulent LS Langue naturelle pivot LC1 LC2 LC3 Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération Erreur en LC3 2*(analyse+transfert+génération) **La pomme de terre a empêché la fonction à l'avance de cholestérol *The potato has prevented the cholesterol advances function

7 INTROIIIIIIIVCONC p. 6 Améliorer (au moins un peu) la version anglaise Les résultats sont moins mauvais, mais pas bons Désir : corriger à partir des versions lues et non de l'anglais Original: Pivot (anglais) : The potato can prevent cholesterol buildup Fr: La pomme de terre peut empêcher l'accroissement de cholestérol Jp: Ru: Картошка может предотвратить нарастание холестерола Es: La patata puede prevenir la acumulación del colesterol Une possibilité d'amélioration corriger

8 INTROIIIIIIIVCONC p. 7 Problème avec une LN pivot (1) Il faut une bonne connaissance de cette langue naturelle pour faire la révision LS Langue naturelle "pivot" LC1 LC2 LC3 Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération révision *The potato has prevented the cholesterol advances function The potato can prevent the cholesterol buildup

9 INTROIIIIIIIVCONC p. 8 Problèmes d'une LN pivot (2) Même si le lecteur peut réviser en anglais et dans sa langue, il ne peut pas réviser dans toutes les langues ! LS Langue naturelle "pivot" LC1 LC2 LC3 Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération révision *La pomme de terre peut empêcher l'habillage de cholestérol

10 INTROIIIIIIIVCONC p. 9 D'où l'idée de faire "monter" le pivot intermédiaire Langue source (LS)Langue cible (LC) génération analysetransfert Structure abstraite

11 INTROIIIIIIIVCONC p. 10 Unification de la base de correction LN1 LN2 LN3 LN4 LN5 LN6 LN1 LN2 LN3 LN4 LN5 LN6

12 INTROIIIIIIIVCONC p. 11 1ère idée pour implémenter cette solution Remplacer la langue naturelle pivot par un langage pivot abstrait : texte structure Éditer cette structure (éventuellement "localisée") pour l'améliorer, par édition et manipulation directes Inconvénient : cette structure intermédiaire sera sans doute difficile à comprendre pour le « grand public » LS Structure pivot LC1 LC2 LC3 Analyse Génération Révision?

13 INTROIIIIIIIVCONC p. 12 2ième idée : éditer "indirectement" ce pivot Réviser directement dans la langue de lutilisateur Descendre linterface dédition de la structure pivot vers le texte : coédition LS structure pivot LC1 LC2 LC3 Analyse Génération Révision (O) Révision (X)

14 INTROIIIIIIIVCONC p. 13 3ième idée : partager les modifications Regénérer dans toutes les langues Voir que certaines corrections ont amélioré d'autres langues… :-); LS structure pivot LC1 LC2 LC3 Analyse Génération Révision Édition

15 INTROIIIIIIIVCONC p. 14 3 idées essentielles dans notre approche Mutualisation et collaboration Chacun peut réviser des fragments dans sa langue maternelle, tous bénéficient des révisions Toutes les révisions sont gardées et identifiées : fonctionnement monotone Révision/génération à la demande À l'utilisateur (lecteur) de décider Inutile de perfectionner des passages jugés inessentiels par les lecteurs Partage de la révision Réviser un fragment dans une langue l'améliorera dans d'autres

16 INTROIIIIIIIVCONC p. 15 Plan de la présentation Problèmes en création et amélioration de documents multilingues I.Idée de coédition II.Pivot choisi (UNL) III.Construction de la correspondance IV.Scénarios dun système de coédition Conclusion et perspectives

17 INTROIIIIIIIVCONC p. 16 Idée de base : coédition Coédition : éditer un « pivot » (objet 01) indirectement, en éditant un texte (objet 02) édition « multiple » « descendre » linterface dédition Exemples de « coédition » réussie : Ambassador - logiciel dédition de lettres commerciales bilingues Multimétéo - génération automatique multilingue de bulletins météo Objet 1 Objet 2

18 INTROIIIIIIIVCONC p. 17 Défis de notre système de coédition - I Établir la correspondance entre une structure abstraite et le texte concret, sans devoir créer de nouvelles ressources coûteuses En rouge ce qui est à construire, en souligné ce que nous avons La pomme de terre peut empêcher laccroissement de cholestérol (objet 2) Structure abstraite ? (objet 1) correspondance

19 INTROIIIIIIIVCONC p. 18 Défis de notre système de coédition - II Construire une interface utilisable Économiser du côté dutilisateur - on doit donc annoter le texte (partiellement), pas le corriger Ex: les grandschevaux [sing] le grandcheval à construire ce que nous avons La pomme de terre peut empêcher l'accroissement de cholestérol (objet 2) [pl] Les pommes de terre [indef] une pomme de terre

20 INTROIIIIIIIVCONC p. 19 Plan de la présentation Problèmes en création et amélioration de documents multilingues I.Idée de coédition II.Pivot choisi (UNL) III. Construction de la correspondance IV. Scénarios dun système de coédition Conclusion et perspectives

21 INTROIIIIIIIVCONC p. 20 Graphe UNL (Universal Networking Language) {unl} agt(regret(icl>do).@entry, he) obj(regret(icl>do).@entry, :01) agt:01(come(agt>human,gol>place).@entry.@future.@not, you) and(regret(icl>do).@entry, know(agt>human,icl>event)) agt(know(agt>human,icl>event), he) obj(know(agt>human,icl>event), :01) {/unl} {fr}il sait que tu ne viendras pas et il le regrette.{/fr} {el}he knows that you will not come and he regrets it.{/el} regret(icl>do).@entry he know(agt>human,icl>event) you come(agt>human,gol>place).@entry.@future.@not agt :01 and obj agt obj Headword restriction Universal Word attribut relation scope

22 INTROIIIIIIIVCONC p. 21 UNL : un projet, un langage, un format UNL – Universal Networking Language Enconversion & d é conversion Document multilingue Document chinois Serveur UNL-cn Encon- version Example 1 [D:on=WJT, dt=04032002][P:1] [S:1] agt(run(icl>do).@entry.@past,i) plc(run(icl>do).@entry.@past,park.@def) tim(run(icl>do).@entry.@past,yesterday) [/S][/P][/D] Serveur UNL-de UNL-el UNL-es UNL-fr …… D é con- version Example 1 [D:on=WJT, dt=04032002][P:1] [S:1] agt(run(icl>do).@entry.@past,i) plc(run(icl>do).@entry.@past,park.@def) tim(run(icl>do).@entry.@past,yesterday) Ich lief in den Park gestern. I ran in the pary yesterday. Yo corri ayer en el parque. J ai couru dans le parc hier. [/S][/P][/D] Document UNL-html

23 INTROIIIIIIIVCONC p. 22 Utilisation d'un document multilingue UNL-html Visualisation dans une des langues contenues Example 1 [D:on=WJT, dt=04032002][P:1] [S:1] agt(run(icl>do).@entry.@past,i) plc(run(icl>do).@entry.@past,park.@def) tim(run(icl>do).@entry.@past,yesterday) Ich lief in den Park gestern. I ran in the pary yesterday. Yo corri ayer en el parque. J ai couru dans le parc hier. [/S][/P][/D] UNL-viewer XSLT+Javascript

24 INTROIIIIIIIVCONC p. 23 Création distribuée de documents UNL

25 INTROIIIIIIIVCONC p. 24 Ressources UNL construites Déconvertisseurs (13 langues) arabe, brésilien, chinois, anglais, français, hindi, italien, indonésien, japonais, russe, espagnol, thaï, lithuanien Enconvertisseurs arabe, russe, français Dictionnaires autant que de déconvertisseurs Graph editor / UNL Viewer / UNL proxy / UNL vérificateur

26 INTROIIIIIIIVCONC p. 25 Document UNL-xml (notre proposition) agt(run(icl>do).@entry.@past,i) plc(run(icl>do).@entry.@past,park.@def) tim(run(icl>do).@entry.@past,yesterday) Ich lief in den Park gestern. I ran in the park yesterday. Yo corri ayer en el parque. Jai couru dans le parc hier. Même simplicité que UNL-html Ouverture à tous les outils liés à xml création aisée de UNL-xml Viewer

27 INTROIIIIIIIVCONC p. 26 Erreurs corrigibles par coédition texte-UNL Erreurs de déconversion/enconversion (non) Déconvertisseurs utilisés comme des « boîtes noires » Ordre des mots, mots manquants dans les dicos, etc. On peut toujours signaler les erreurs aux LC Erreurs syntaxiques (non) Graphe ne respectant pas les spécifications Présence d'un scope non connexe, faute décriture Erreurs sémantiques (oui) Sous-spécification détermination, nombre, genre, temps, voix, aspect Emploi erroné des relations ou des attributs

28 INTROIIIIIIIVCONC p. 27 Sous-spécification (chinois) (thaï) (japonais) {unl} agt(wash(icl>do).@entry.@past, he) obj(wash(icl>do).@entry.@past, car(icl>thing).@pl) pos(car(icl>thing).@pl, he) tim(wash(icl>do).@entry.@past, yesterday) {/unl} {unl} agt(wash(icl>do).@entry.@past, he) obj(wash(icl>do).@entry.@past, car(icl>thing)) pos(car(icl>thing), he) tim(wash(icl>do).@entry.@past, yesterday) {/unl} Il a lavé ses voitures hier. Он вымыл свои автомобили вчера. él aseó sus coches ayer. Il a lavé sa voiture hier. Он вымыл свой автомобиль вчера. él aseó su coche ayer. {unl} agt(wash(icl>do).@entry, he) obj(wash(icl>do).@entry, car(icl>thing)) pos(car(icl>thing), he) tim(wash(icl>do).@entry, yesterday) {/unl} Il lave sa voiture hier. Он моет свой автомобиль вчера. él asea su coche ayer.

29 INTROIIIIIIIVCONC p. 28 Plan de la présentation Problèmes en création et amélioration de documents multilingues I. Idée de coédition II. Pivot choisi (UNL) III. Construction de la correspondance IV.Scénarios dun système de coédition Conclusion et perspectives

30 INTROIIIIIIIVCONC p. 29 Comment établir la correspondance ? he(icl>human) regret(icl>do).@entry :01 come.@entry.@not.@future you know (agt>human, obj>event) obj agt and obj agt Il sait que tu ne viendras pas et il le regrette. Correspondance? On a choisi UNL comme le langage pivot

31 INTROIIIIIIIVCONC p. 30 Procédure détablissement de la correspondance enrichir la correspondance s il y a plusieurs trajectoires provisoires, calculer la pénalité de croisement dico UNL/Li, ang/Li graphe UNL arbre UNL arbre UNL étendu meilleure trajectoire correspondance arbre - treillis enrichie texte en Li treillis LMS treillis LMS étendu AMS/segmenteur graphe arbre construire les liaisons lexicales dico Li/UNL, Li/ang trajectoire(s) provisoire(s)

32 INTROIIIIIIIVCONC p. 31 Côté graphe : graphe UNL arbre UNL étendu he(icl>human) regret(icl>do).@entry :01 come.@entry.@not.@future you know (agt>human, obj>event) obj agt and obj agt 2 he(icl>human) agt (il, pper) inst=2 1 regret(icl>do).@entry (regretter, verb) 4 :S01 obj inst=4 5 come.@entry.@not.@future (venir, verb) 6 you agt (tu, pper) 3 know (agt>human, obj>event) and (savoir, verb)/(connaître, verb) 7 he(icl>human) agt (il, pper) inst=2 8 :S01 obj inst=4 Copier les nœuds qui ont plus dun arc entrant Inverser le moins d'arcs possible Créer un pseudo-nœud par scope Le nœud porte la relation pseudo-nœud nœud dupliqué

33 INTROIIIIIIIVCONC p. 32 Procédure détablissement de la correspondance enrichir la correspondance s il y a plusieurs trajectoires provisoires, calculer la pénalité de croisement dico UNL/Li, ang/Li graphe UNL arbre UNL arbre UNLétendu meilleure trajectoire correspondance arbre - treillis enrichie texte en Li treillis LMS treillis LMS étendu AMS/segmenteur graphe arbre construire les liaisons lexicales dico Li/UNL, Li/ang trajectoire(s) provisoire(s)

34 INTROIIIIIIIVCONC p. 33 Côté texte : texte treillis LMS étendu Il sait que tu ne viendras pas et il le regrette. S1S1 1 il pper he 2 savoir verb know 4 tu pper you 5 tu ppas quiet 3 que prlc that 6 ne ne not 7venir verb come 8 pas pas not 9 et coco and 10 il pper he 11 le detp it/he 12 regretter verb ind regret < > 13 regretter verb sub regret 14 regretter verb imp regret S2S2 « LMS » = lexico-morpho-syntaxique « étendu » = portant les lemmes anglais correspondants Sortie du lemmatiseur PILAF (serveur de Damien Genthial)

35 INTROIIIIIIIVCONC p. 34 Définitions Une « liaison » est un lien créé entre deux éléments de deux structures de niveaux différents. Une « correspondance » est un ensemble de liaisons vérifiant une certaine propriété. Arbre UNL Treillis LMS départ arrivée

36 INTROIIIIIIIVCONC p. 35 Division en trois sous-correspondances Graphe UNL arbre UNL Utiliser l'algorithme de G. Sérasset ou de E. Blanc Arbre UNL treillis LMS Etablir la correspondance lexicale Ajuster (rotation) la structure de larbre pour quil y ait le moins de croisements possible Appliquer les patrons de correspondances non lexicales Treillis LMS texte Utiliser un segmenteur ou un lemmatiseur "libre"

37 INTROIIIIIIIVCONC p. 36 Procédure détablissement de la correspondance enrichir la correspondance s il y a plusieurs trajectoires provisoires, calculer la pénalité de croisement dico UNL/Li, ang/Li graphe UNL arbre UNL arbre UNLétendu meilleure trajectoire correspondance arbre - treillis enrichie texte en Li treillis LMS treillis LMS étendu AMS/segmenteur graphe arbre construire les liaisons lexicales dico Li/UNL, Li/ang trajectoire(s) provisoire(s)

38 INTROIIIIIIIVCONC p. 37 Liaisons lexicales entre arbre UNL et treillis LMS 1 il pper he 2 savoir verb know 4 tu pper you 5 tu ppas quiet 3 que prlc that 6 ne ne not 7 venir verb come 8 pas pas not 9 et coco and 10 il pper he 11 le detp it/he 12 regretter verb ind regret < > 2 he(icl>human) agt (il, pper) inst=2 1 regret(icl>do).@entry (regretter, verb) 4 :S01 obj inst=4 5 come.@entry.@not.@future (venir, verb) 6 you agt (tu, pper) 3 know (agt>human, obj>event) and (savoir, verb)/(connaître, verb) 7 he(icl>human) agt (il, pper) inst=2 8 :S01 obj inst=4 13 regretter verb sub regret 14 regretter verb imp regret S3S3 S2S2 l1l1 l2l2 l3l3 l4l4 l5l5 l6l6 l7l7 Il sait que tu ne viendras pas et il le regrette

39 INTROIIIIIIIVCONC p. 38 Patrons de liaisons identifiés : UNL français Poids d une p é nalit é de croisement10 Poids d une liaison lexicale s û re10 Poids d une liaison lexicale secondaire5 PILAFUNLpoids cat é gories (*/5) advAdverbe(icl>how)5 subcsubstantif commun(icl>thing)5 adjqAdjectif qualificatif(mod thing)4 verbVerbe(icl>do)/(icl>occur)/(icl>state)5 detpDéterminant-ponom@def3,5 ideIndéfini@indef3,5 locpLocution prépositionnelleplc, tim3 vetVerbe êtreaoj3 xet/xav & ppas Auxiliaire être/ Auxiliaire avoir & Participe passé.@complete/.@past4 ne pasNégation ne &2ème négation pas.@not5 variables impImpératif.@imperative4 futFutur.@future4 prePrésent.@present3 imiImparfait de l indicatif.@past3 cdlConditionnel.@request/.@unreal2 subSubjonctif pluPluriel.@pl5

40 INTROIIIIIIIVCONC p. 39 Correspondance enrichie 1il pper he 2savoir verb ind know 4 tu pper you 5 tu ppas quiet 3 que prlc that 6 ne ne not 7venir verb fut come 8 pas pas not 9 et coco and 10 il pper he 11 le detp it/he 12 regretter verb ind regret < > 2 he(icl>human) agt (il, pper) inst=2 1 regret(icl>do).@entry (regretter, verb) 4 :S01 obj inst=4 5 come.@entry.@not.@future (venir, verb) 6 you agt (tu, pper) 3 know (agt>human, obj>event) and (savoir, verb)/(connaître, verb) 7 he(icl>human) agt (il, pper) inst=2 8 :S01 obj inst=4 13 regretter verb sub regret 14 regretter verb imp regret S3S3 S2S2 l1l1 l2l2 l3l3 l4l4 l6l6 Il sait que tu ne viendras pas et il le regrette

41 INTROIIIIIIIVCONC p. 40 Ajouter une autre langue? Coéditer en chinois? Il suffit : davoir le dictionnaire UNL-chinois/ anglais-chinois de connaître et comprendre les variables de l'AMS chinois Catégories StandardCatégories du chinois moderneExplication AA épithète ADVD, Da, Dfa, Dfb, Dk adverbe ASPDi particule daspect C Caa, Cbb conjonction DETNep, Neqa, Nes, Neu déterminant FW mot étranger MNf spécificatif NNa, Nb, Nc, Ncd, Nd, Nh nom PP préposition POSTCab, Cba, Neqb Ng postposition TDe, I, T particule ViVA, VB, VH, VI verbe intransitif VtSHI, VAC, VC, VCL, VD, VE, VF, VG, VHC, VJ, VK, VL, V_2 verbe transitif NAV prédicat nominal utilisé par AUTOTAG

42 INTROIIIIIIIVCONC p. 41 Plan de la présentation Problèmes en création et amélioration de documents multilingues I. Idée de coédition II. Pivot choisi (UNL) III.Construction de la correspondance IV.Scénarios dun système de coédition Conclusion et perspectives

43 INTROIIIIIIIVCONC p. 42 Scénario de coédition avec UNL lecture en Li (sur le web) désir de corriger les erreurs en Li passage dans lenvironnement de coédition corrections (modes expert et normal) retardées sur le texte immédiates sur le graphe déconversion en Li itération si résultat non satisfaisant, déconversion vers L1… Ln si OK retour à la lecture

44 INTROIIIIIIIVCONC p. 43 Lecture en français dun document UNL-xml Page web fabriquée à la « UNL » origine = anglais, avec le graphe UNL derrière

45 INTROIIIIIIIVCONC p. 44 Sélection dun fragment à coéditer

46 INTROIIIIIIIVCONC p. 45 État initial de la coédition

47 INTROIIIIIIIVCONC p. 46 Trois cadres dans lenvironnement de coédition

48 INTROIIIIIIIVCONC p. 47 Choix de visualisation des autres langues

49 INTROIIIIIIIVCONC p. 48 On peut insérer manuellement les corrections

50 INTROIIIIIIIVCONC p. 49 Si on coédite (pour partager), les modifications possibles sont proposées par le système

51 INTROIIIIIIIVCONC p. 50 Modifications proposées par le système Contraintes langue coéditée liaisons établies spécifications dUNL sortie de l'AMS Exemples Chinois – majuscule/minuscule (x), détermination (?), bonne segmentation (o) Arabe – duel (pas possible pour linstant) Japonais – plusieurs niveaux de politesse (pas possible pour linstant)

52 INTROIIIIIIIVCONC p. 51 État après avoir fait une modification

53 INTROIIIIIIIVCONC p. 52 Obtention de la nouvelle déconversion

54 INTROIIIIIIIVCONC p. 53 Lecture du nouveau texte

55 INTROIIIIIIIVCONC p. 54 Déconversion vers lespagnol

56 INTROIIIIIIIVCONC p. 55 Déconversion vers lespagnol El UNIFEM asegura la participación de mujeres (avant : mujer)

57 INTROIIIIIIIVCONC p. 56 Plan de la présentation Problèmes en création et amélioration de documents multilingues I. Idée de coédition II. Pivot choisi (UNL) III. Construction de la correspondance IV. Scénarios dun système de coédition Conclusion et perspectives

58 INTROIIIIIIIVCONC p. 57 Résultats avant et après coédition étapefrançaisitalienespagnolchinoisrusse 0Des enfants regardent un phénomène du monde véritable proche et sensible. Bambini guardare fenomeno del vero il mondo percettibile. Niño miran a el fenómeno del mundo real de cercano y perceptible Дети наблюдают явление близкого и заметного настоящего мира. 1 (.@def) Les enfants regardent un phénomène du monde véritable proche et sensible. I bambini guardare fenomeno del vero il mondo percettibile. Los niño miran a el fenómeno del mundo real de cercano y perceptible. Дети наблюдают явление близкого и заметного настоящего мира. 2 (.@not) Les enfants ne regardent pas un phénomène du monde véritable proche et sensible. I bambini non guardare fenomeno del vero il mondo percettibile Los niño no miran a el fenómeno del mundo real de cercano y perceptible Дети не наблюдают явление близкого и заметного настоящего мира

59 INTROIIIIIIIVCONC p. 58 Encore quelques mots sur la coédition Certaines modifications ne sexpriment pas dans certaines langues Il faut signaler systématiquement les modifications faites au propriétaire du document Lutilisateur devrait pouvoir donner des retours aux développeurs des déconvertisseurs

60 INTROIIIIIIIVCONC p. 59 Apports de la thèse Nouvelle approche de la TAO coédition permettant de partager la révision amélioration à la demande, partielle (coût moindre) mutualisation démocratisation de la qualité Modélisation des correspondances UNL LN Calcul d'une telle correspondance sans ressources lourdes Site web SWIIVRE-UNL pour l'information, l'initiation, la validation, la recherche et l'expérimentation d'UNL

61 INTROIIIIIIIVCONC p. 60 Perspectives de recherche Construire une maquette 100% opérationnelle Évaluer la « couverture » de la correspondance Compléter l'architecture, de façon à pouvoir : traiter une nouvelle langue de coédition sans programmer à bas niveau (outil générique à inventer) éditer les graphes UNL par manipulation directe avec "localisation" dans la langue de coédition calculer et visualiser la correspondance entre deux versions (dans 2 LN) en passant par UNL Créer un graphe UNL au moment de lédition dune phrase en langue naturelle en intégrant la désambiguïsation interactive

62 INTROIIIIIIIVCONC p. 61 Je vous remercie pour votre attention Je vous remercie de votre attention Я влагодарю вас из-за вашего attention Ringraziare te per la tua attenzione Yo os agradezco por vuestras atención thank(icl>do).@entry I you.@pl attention(icl>awareness) agt obj rsn pos

63 INTROIIIIIIIVCONC p. 62 Expressivité du langage UNL (I) Comment désambiguïser une UW (sous-spécification)? state state(icl>do(obj>thing)) – constater state(icl>nation) – lEtat state(icl>situation) – la situation, le stade state(icl>government) – le gouvernement answer answer(icl>do) – répondre answer(icl>thing) – réponse marry marry(agt>male) – (chinois), женитья (russe) marry(agt>female) – (chinois), выходить замуж(russe) Comment ajouter un nouveau concept? samba(icl>dance) – un genre de danse ikebana(icl>art, obj>flower) – art floral japonais Expressivité du langage UNL (II) 41 relations sémantiques insuffisantes? Décomposition la conjonction anglaise On ne trouve pas la relation sémantique pour exprimer malgré man(come(icl>do), although) obj(although, rain(icl>natural phenomenon)) il vient malgré la pluie Expériences – corpus codés assez variés Document de lONU FB2004, sport, mode demploi

64 INTROIIIIIIIVCONC p. 63 Expressivité du langage UNL (II) 41 relations sémantiques insuffisantes? non Décomposition de conjonction anglaise (malgré) On ne trouve pas la relation sémantique pour exprimer malgré, mais on peut écrire comme ça: man(come(icl>do), although) obj(although, rain(icl>natural phenomenon)) il vient malgré la pluie Corpus codés assez variés Document de lONU FB2004, sport, manuel dutilisation

65 INTROIIIIIIIVCONC p. 64 Site web SWIIVRE-UNL – page daccueil

66 INTROIIIIIIIVCONC p. 65 Site web SWIIVRE-UNL - expérimentation

67 INTROIIIIIIIVCONC p. 66 Effet de la coédition sur les autres langues Déconversion vers la langue originale est déconseillée. Pour garder le sens original On suppose que les utilisateurs nabusent pas Sur-spécifications possibles marry(agt>male) pour le français, langlais.@past,.@pl pour le chinois, le thaï À déconvertisseur de juger Plus de renseignements corrects, plus de chance de générer une phrase correcte

68 INTROIIIIIIIVCONC p. 67 Effet de la coédition sur les autres langues - II étapefrançaisespagnolrussechinois 0 Il lave sa voiture hier. él asea su coche ayer. Он моет свой автомобиль вчера. 1.@past Il a lavé sa voiture hier. él aseó su coche ayer. Он вымыл свой автомобиль вчера. 2.@pl Il a lavé ses voitures hier. él aseó sus coches ayer. Он вымыл свои автомобили вчера. Sur-spécifications pour le chinois Versions générées par les déconvertisseurs

69 INTROIIIIIIIVCONC p. 68 Rotation de larbre UNL - I La mer dAral était la quatrième plus grande mer dans le monde.

70 INTROIIIIIIIVCONC p. 69 Rotation de larbre UNL - II La mer dAral était la quatrième plus grande mer dans le monde.

71 INTROIIIIIIIVCONC p. 70 Treillis LMS - I terre verb terrer des det des pommes verb pommer mange verb manger De de Je pper je terre subc terre pommes subc pomme pommes de terre subc pomme de terre des prep des Je mange des pommes de terre.

72 INTROIIIIIIIVCONC p. 71 Treillis LMS - II. Les États-Unis vont donner leur accord. Le parlement américain a donné son accord. guo2hui4 parlement tong2yi4 donner son accord mei3guo2 Les Etats-Unis hui4 particule de futur mei3 américain mei3 beau, beauté

73 INTROIIIIIIIVCONC p. 72 Le post-doc Activités Spécifications des données linguistiques et syntaxiques Tests et validation des données et des traitements linguistiques Méthodologies de segmentation et danalyse des textes chinois Contribution à des études sur le TAL du chinois Mise en place dun environement déditioin des idéogrammes Contribution à lidentification des applications du TALN en Chine Participatioin à des projets collaboratifs internationaux Rôle dinterface avex une équipe basée à Pékin

74 INTROIIIIIIIVCONC p. 73 Le post-doc Profils souhaités Linguistique et informatique Programmation C, C++ TALN du chinois Connaissances en représentation formelle des données linguistiaues Connaissances en édition de textes multilingues Sensibilité aux applications du TALN Esprit de la communication et du travail en équipe Esprit du travail multildisciplinaire Langues : chinois et anglais


Télécharger ppt "INTROIIIIIIIVCONC p. 1 La coédition langue UNL pour partager la révision entre les langues d'un document multilingue Wang-Ju Tsai GETA, laboratoire CLIPS,"

Présentations similaires


Annonces Google