Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parAlayna Guegan Modifié depuis plus de 10 années
2
INTROIIIIIIIVCONC p. 1 La coédition langue UNL pour partager la révision entre les langues d'un document multilingue Wang-Ju Tsai GETA, laboratoire CLIPS, IMAG Université Joseph Fourier Thèse préparée sous la direction de Ch. Boitet
3
INTROIIIIIIIVCONC p. 2 Un exemple: difficulté de gérer une page d'accueil multilingue Cinq langues correctement produites sur la page daccueil du site Papillon grâce à une coopération académique
4
INTROIIIIIIIVCONC p. 3 Exemple (suite) Comment ajouter "hindi" à la liste des langues ? Comment ajouter le paragraphe de présentation en malais ? Comment corriger une erreur en français et la répercuter ?
5
INTROIIIIIIIVCONC p. 4 Original: Pivot (anglais) : The potato has prevented the cholesterol advances function Fr: La pomme de terre a empêché la fonction à l'avance de cholestérol Jp: Ru: Картошка предотвращала функцию выдвижений холестерола Es: La patata ha prevenido la función de los avances del colesterol Ce qu'on arrive à faire en pratique On crée un document multilingue « patchwork » via Systran On utilise le texte anglais généré comme "pivot" :-(; Impossible de corriger sans connaître le chinois ET langlais
6
INTROIIIIIIIVCONC p. 5 Analyse En utilisant une langue naturelle comme pivot, les erreurs s'accumulent LS Langue naturelle pivot LC1 LC2 LC3 Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération Erreur en LC3 2*(analyse+transfert+génération) **La pomme de terre a empêché la fonction à l'avance de cholestérol *The potato has prevented the cholesterol advances function
7
INTROIIIIIIIVCONC p. 6 Améliorer (au moins un peu) la version anglaise Les résultats sont moins mauvais, mais pas bons Désir : corriger à partir des versions lues et non de l'anglais Original: Pivot (anglais) : The potato can prevent cholesterol buildup Fr: La pomme de terre peut empêcher l'accroissement de cholestérol Jp: Ru: Картошка может предотвратить нарастание холестерола Es: La patata puede prevenir la acumulación del colesterol Une possibilité d'amélioration corriger
8
INTROIIIIIIIVCONC p. 7 Problème avec une LN pivot (1) Il faut une bonne connaissance de cette langue naturelle pour faire la révision LS Langue naturelle "pivot" LC1 LC2 LC3 Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération révision *The potato has prevented the cholesterol advances function The potato can prevent the cholesterol buildup
9
INTROIIIIIIIVCONC p. 8 Problèmes d'une LN pivot (2) Même si le lecteur peut réviser en anglais et dans sa langue, il ne peut pas réviser dans toutes les langues ! LS Langue naturelle "pivot" LC1 LC2 LC3 Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération Analyse Transfert Génération révision *La pomme de terre peut empêcher l'habillage de cholestérol
10
INTROIIIIIIIVCONC p. 9 D'où l'idée de faire "monter" le pivot intermédiaire Langue source (LS)Langue cible (LC) génération analysetransfert Structure abstraite
11
INTROIIIIIIIVCONC p. 10 Unification de la base de correction LN1 LN2 LN3 LN4 LN5 LN6 LN1 LN2 LN3 LN4 LN5 LN6
12
INTROIIIIIIIVCONC p. 11 1ère idée pour implémenter cette solution Remplacer la langue naturelle pivot par un langage pivot abstrait : texte structure Éditer cette structure (éventuellement "localisée") pour l'améliorer, par édition et manipulation directes Inconvénient : cette structure intermédiaire sera sans doute difficile à comprendre pour le « grand public » LS Structure pivot LC1 LC2 LC3 Analyse Génération Révision?
13
INTROIIIIIIIVCONC p. 12 2ième idée : éditer "indirectement" ce pivot Réviser directement dans la langue de lutilisateur Descendre linterface dédition de la structure pivot vers le texte : coédition LS structure pivot LC1 LC2 LC3 Analyse Génération Révision (O) Révision (X)
14
INTROIIIIIIIVCONC p. 13 3ième idée : partager les modifications Regénérer dans toutes les langues Voir que certaines corrections ont amélioré d'autres langues… :-); LS structure pivot LC1 LC2 LC3 Analyse Génération Révision Édition
15
INTROIIIIIIIVCONC p. 14 3 idées essentielles dans notre approche Mutualisation et collaboration Chacun peut réviser des fragments dans sa langue maternelle, tous bénéficient des révisions Toutes les révisions sont gardées et identifiées : fonctionnement monotone Révision/génération à la demande À l'utilisateur (lecteur) de décider Inutile de perfectionner des passages jugés inessentiels par les lecteurs Partage de la révision Réviser un fragment dans une langue l'améliorera dans d'autres
16
INTROIIIIIIIVCONC p. 15 Plan de la présentation Problèmes en création et amélioration de documents multilingues I.Idée de coédition II.Pivot choisi (UNL) III.Construction de la correspondance IV.Scénarios dun système de coédition Conclusion et perspectives
17
INTROIIIIIIIVCONC p. 16 Idée de base : coédition Coédition : éditer un « pivot » (objet 01) indirectement, en éditant un texte (objet 02) édition « multiple » « descendre » linterface dédition Exemples de « coédition » réussie : Ambassador - logiciel dédition de lettres commerciales bilingues Multimétéo - génération automatique multilingue de bulletins météo Objet 1 Objet 2
18
INTROIIIIIIIVCONC p. 17 Défis de notre système de coédition - I Établir la correspondance entre une structure abstraite et le texte concret, sans devoir créer de nouvelles ressources coûteuses En rouge ce qui est à construire, en souligné ce que nous avons La pomme de terre peut empêcher laccroissement de cholestérol (objet 2) Structure abstraite ? (objet 1) correspondance
19
INTROIIIIIIIVCONC p. 18 Défis de notre système de coédition - II Construire une interface utilisable Économiser du côté dutilisateur - on doit donc annoter le texte (partiellement), pas le corriger Ex: les grandschevaux [sing] le grandcheval à construire ce que nous avons La pomme de terre peut empêcher l'accroissement de cholestérol (objet 2) [pl] Les pommes de terre [indef] une pomme de terre
20
INTROIIIIIIIVCONC p. 19 Plan de la présentation Problèmes en création et amélioration de documents multilingues I.Idée de coédition II.Pivot choisi (UNL) III. Construction de la correspondance IV. Scénarios dun système de coédition Conclusion et perspectives
21
INTROIIIIIIIVCONC p. 20 Graphe UNL (Universal Networking Language) {unl} agt(regret(icl>do).@entry, he) obj(regret(icl>do).@entry, :01) agt:01(come(agt>human,gol>place).@entry.@future.@not, you) and(regret(icl>do).@entry, know(agt>human,icl>event)) agt(know(agt>human,icl>event), he) obj(know(agt>human,icl>event), :01) {/unl} {fr}il sait que tu ne viendras pas et il le regrette.{/fr} {el}he knows that you will not come and he regrets it.{/el} regret(icl>do).@entry he know(agt>human,icl>event) you come(agt>human,gol>place).@entry.@future.@not agt :01 and obj agt obj Headword restriction Universal Word attribut relation scope
22
INTROIIIIIIIVCONC p. 21 UNL : un projet, un langage, un format UNL – Universal Networking Language Enconversion & d é conversion Document multilingue Document chinois Serveur UNL-cn Encon- version Example 1 [D:on=WJT, dt=04032002][P:1] [S:1] agt(run(icl>do).@entry.@past,i) plc(run(icl>do).@entry.@past,park.@def) tim(run(icl>do).@entry.@past,yesterday) [/S][/P][/D] Serveur UNL-de UNL-el UNL-es UNL-fr …… D é con- version Example 1 [D:on=WJT, dt=04032002][P:1] [S:1] agt(run(icl>do).@entry.@past,i) plc(run(icl>do).@entry.@past,park.@def) tim(run(icl>do).@entry.@past,yesterday) Ich lief in den Park gestern. I ran in the pary yesterday. Yo corri ayer en el parque. J ai couru dans le parc hier. [/S][/P][/D] Document UNL-html
23
INTROIIIIIIIVCONC p. 22 Utilisation d'un document multilingue UNL-html Visualisation dans une des langues contenues Example 1 [D:on=WJT, dt=04032002][P:1] [S:1] agt(run(icl>do).@entry.@past,i) plc(run(icl>do).@entry.@past,park.@def) tim(run(icl>do).@entry.@past,yesterday) Ich lief in den Park gestern. I ran in the pary yesterday. Yo corri ayer en el parque. J ai couru dans le parc hier. [/S][/P][/D] UNL-viewer XSLT+Javascript
24
INTROIIIIIIIVCONC p. 23 Création distribuée de documents UNL
25
INTROIIIIIIIVCONC p. 24 Ressources UNL construites Déconvertisseurs (13 langues) arabe, brésilien, chinois, anglais, français, hindi, italien, indonésien, japonais, russe, espagnol, thaï, lithuanien Enconvertisseurs arabe, russe, français Dictionnaires autant que de déconvertisseurs Graph editor / UNL Viewer / UNL proxy / UNL vérificateur
26
INTROIIIIIIIVCONC p. 25 Document UNL-xml (notre proposition) agt(run(icl>do).@entry.@past,i) plc(run(icl>do).@entry.@past,park.@def) tim(run(icl>do).@entry.@past,yesterday) Ich lief in den Park gestern. I ran in the park yesterday. Yo corri ayer en el parque. Jai couru dans le parc hier. Même simplicité que UNL-html Ouverture à tous les outils liés à xml création aisée de UNL-xml Viewer
27
INTROIIIIIIIVCONC p. 26 Erreurs corrigibles par coédition texte-UNL Erreurs de déconversion/enconversion (non) Déconvertisseurs utilisés comme des « boîtes noires » Ordre des mots, mots manquants dans les dicos, etc. On peut toujours signaler les erreurs aux LC Erreurs syntaxiques (non) Graphe ne respectant pas les spécifications Présence d'un scope non connexe, faute décriture Erreurs sémantiques (oui) Sous-spécification détermination, nombre, genre, temps, voix, aspect Emploi erroné des relations ou des attributs
28
INTROIIIIIIIVCONC p. 27 Sous-spécification (chinois) (thaï) (japonais) {unl} agt(wash(icl>do).@entry.@past, he) obj(wash(icl>do).@entry.@past, car(icl>thing).@pl) pos(car(icl>thing).@pl, he) tim(wash(icl>do).@entry.@past, yesterday) {/unl} {unl} agt(wash(icl>do).@entry.@past, he) obj(wash(icl>do).@entry.@past, car(icl>thing)) pos(car(icl>thing), he) tim(wash(icl>do).@entry.@past, yesterday) {/unl} Il a lavé ses voitures hier. Он вымыл свои автомобили вчера. él aseó sus coches ayer. Il a lavé sa voiture hier. Он вымыл свой автомобиль вчера. él aseó su coche ayer. {unl} agt(wash(icl>do).@entry, he) obj(wash(icl>do).@entry, car(icl>thing)) pos(car(icl>thing), he) tim(wash(icl>do).@entry, yesterday) {/unl} Il lave sa voiture hier. Он моет свой автомобиль вчера. él asea su coche ayer.
29
INTROIIIIIIIVCONC p. 28 Plan de la présentation Problèmes en création et amélioration de documents multilingues I. Idée de coédition II. Pivot choisi (UNL) III. Construction de la correspondance IV.Scénarios dun système de coédition Conclusion et perspectives
30
INTROIIIIIIIVCONC p. 29 Comment établir la correspondance ? he(icl>human) regret(icl>do).@entry :01 come.@entry.@not.@future you know (agt>human, obj>event) obj agt and obj agt Il sait que tu ne viendras pas et il le regrette. Correspondance? On a choisi UNL comme le langage pivot
31
INTROIIIIIIIVCONC p. 30 Procédure détablissement de la correspondance enrichir la correspondance s il y a plusieurs trajectoires provisoires, calculer la pénalité de croisement dico UNL/Li, ang/Li graphe UNL arbre UNL arbre UNL étendu meilleure trajectoire correspondance arbre - treillis enrichie texte en Li treillis LMS treillis LMS étendu AMS/segmenteur graphe arbre construire les liaisons lexicales dico Li/UNL, Li/ang trajectoire(s) provisoire(s)
32
INTROIIIIIIIVCONC p. 31 Côté graphe : graphe UNL arbre UNL étendu he(icl>human) regret(icl>do).@entry :01 come.@entry.@not.@future you know (agt>human, obj>event) obj agt and obj agt 2 he(icl>human) agt (il, pper) inst=2 1 regret(icl>do).@entry (regretter, verb) 4 :S01 obj inst=4 5 come.@entry.@not.@future (venir, verb) 6 you agt (tu, pper) 3 know (agt>human, obj>event) and (savoir, verb)/(connaître, verb) 7 he(icl>human) agt (il, pper) inst=2 8 :S01 obj inst=4 Copier les nœuds qui ont plus dun arc entrant Inverser le moins d'arcs possible Créer un pseudo-nœud par scope Le nœud porte la relation pseudo-nœud nœud dupliqué
33
INTROIIIIIIIVCONC p. 32 Procédure détablissement de la correspondance enrichir la correspondance s il y a plusieurs trajectoires provisoires, calculer la pénalité de croisement dico UNL/Li, ang/Li graphe UNL arbre UNL arbre UNLétendu meilleure trajectoire correspondance arbre - treillis enrichie texte en Li treillis LMS treillis LMS étendu AMS/segmenteur graphe arbre construire les liaisons lexicales dico Li/UNL, Li/ang trajectoire(s) provisoire(s)
34
INTROIIIIIIIVCONC p. 33 Côté texte : texte treillis LMS étendu Il sait que tu ne viendras pas et il le regrette. S1S1 1 il pper he 2 savoir verb know 4 tu pper you 5 tu ppas quiet 3 que prlc that 6 ne ne not 7venir verb come 8 pas pas not 9 et coco and 10 il pper he 11 le detp it/he 12 regretter verb ind regret < > 13 regretter verb sub regret 14 regretter verb imp regret S2S2 « LMS » = lexico-morpho-syntaxique « étendu » = portant les lemmes anglais correspondants Sortie du lemmatiseur PILAF (serveur de Damien Genthial)
35
INTROIIIIIIIVCONC p. 34 Définitions Une « liaison » est un lien créé entre deux éléments de deux structures de niveaux différents. Une « correspondance » est un ensemble de liaisons vérifiant une certaine propriété. Arbre UNL Treillis LMS départ arrivée
36
INTROIIIIIIIVCONC p. 35 Division en trois sous-correspondances Graphe UNL arbre UNL Utiliser l'algorithme de G. Sérasset ou de E. Blanc Arbre UNL treillis LMS Etablir la correspondance lexicale Ajuster (rotation) la structure de larbre pour quil y ait le moins de croisements possible Appliquer les patrons de correspondances non lexicales Treillis LMS texte Utiliser un segmenteur ou un lemmatiseur "libre"
37
INTROIIIIIIIVCONC p. 36 Procédure détablissement de la correspondance enrichir la correspondance s il y a plusieurs trajectoires provisoires, calculer la pénalité de croisement dico UNL/Li, ang/Li graphe UNL arbre UNL arbre UNLétendu meilleure trajectoire correspondance arbre - treillis enrichie texte en Li treillis LMS treillis LMS étendu AMS/segmenteur graphe arbre construire les liaisons lexicales dico Li/UNL, Li/ang trajectoire(s) provisoire(s)
38
INTROIIIIIIIVCONC p. 37 Liaisons lexicales entre arbre UNL et treillis LMS 1 il pper he 2 savoir verb know 4 tu pper you 5 tu ppas quiet 3 que prlc that 6 ne ne not 7 venir verb come 8 pas pas not 9 et coco and 10 il pper he 11 le detp it/he 12 regretter verb ind regret < > 2 he(icl>human) agt (il, pper) inst=2 1 regret(icl>do).@entry (regretter, verb) 4 :S01 obj inst=4 5 come.@entry.@not.@future (venir, verb) 6 you agt (tu, pper) 3 know (agt>human, obj>event) and (savoir, verb)/(connaître, verb) 7 he(icl>human) agt (il, pper) inst=2 8 :S01 obj inst=4 13 regretter verb sub regret 14 regretter verb imp regret S3S3 S2S2 l1l1 l2l2 l3l3 l4l4 l5l5 l6l6 l7l7 Il sait que tu ne viendras pas et il le regrette
39
INTROIIIIIIIVCONC p. 38 Patrons de liaisons identifiés : UNL français Poids d une p é nalit é de croisement10 Poids d une liaison lexicale s û re10 Poids d une liaison lexicale secondaire5 PILAFUNLpoids cat é gories (*/5) advAdverbe(icl>how)5 subcsubstantif commun(icl>thing)5 adjqAdjectif qualificatif(mod thing)4 verbVerbe(icl>do)/(icl>occur)/(icl>state)5 detpDéterminant-ponom@def3,5 ideIndéfini@indef3,5 locpLocution prépositionnelleplc, tim3 vetVerbe êtreaoj3 xet/xav & ppas Auxiliaire être/ Auxiliaire avoir & Participe passé.@complete/.@past4 ne pasNégation ne &2ème négation pas.@not5 variables impImpératif.@imperative4 futFutur.@future4 prePrésent.@present3 imiImparfait de l indicatif.@past3 cdlConditionnel.@request/.@unreal2 subSubjonctif pluPluriel.@pl5
40
INTROIIIIIIIVCONC p. 39 Correspondance enrichie 1il pper he 2savoir verb ind know 4 tu pper you 5 tu ppas quiet 3 que prlc that 6 ne ne not 7venir verb fut come 8 pas pas not 9 et coco and 10 il pper he 11 le detp it/he 12 regretter verb ind regret < > 2 he(icl>human) agt (il, pper) inst=2 1 regret(icl>do).@entry (regretter, verb) 4 :S01 obj inst=4 5 come.@entry.@not.@future (venir, verb) 6 you agt (tu, pper) 3 know (agt>human, obj>event) and (savoir, verb)/(connaître, verb) 7 he(icl>human) agt (il, pper) inst=2 8 :S01 obj inst=4 13 regretter verb sub regret 14 regretter verb imp regret S3S3 S2S2 l1l1 l2l2 l3l3 l4l4 l6l6 Il sait que tu ne viendras pas et il le regrette
41
INTROIIIIIIIVCONC p. 40 Ajouter une autre langue? Coéditer en chinois? Il suffit : davoir le dictionnaire UNL-chinois/ anglais-chinois de connaître et comprendre les variables de l'AMS chinois Catégories StandardCatégories du chinois moderneExplication AA épithète ADVD, Da, Dfa, Dfb, Dk adverbe ASPDi particule daspect C Caa, Cbb conjonction DETNep, Neqa, Nes, Neu déterminant FW mot étranger MNf spécificatif NNa, Nb, Nc, Ncd, Nd, Nh nom PP préposition POSTCab, Cba, Neqb Ng postposition TDe, I, T particule ViVA, VB, VH, VI verbe intransitif VtSHI, VAC, VC, VCL, VD, VE, VF, VG, VHC, VJ, VK, VL, V_2 verbe transitif NAV prédicat nominal utilisé par AUTOTAG
42
INTROIIIIIIIVCONC p. 41 Plan de la présentation Problèmes en création et amélioration de documents multilingues I. Idée de coédition II. Pivot choisi (UNL) III.Construction de la correspondance IV.Scénarios dun système de coédition Conclusion et perspectives
43
INTROIIIIIIIVCONC p. 42 Scénario de coédition avec UNL lecture en Li (sur le web) désir de corriger les erreurs en Li passage dans lenvironnement de coédition corrections (modes expert et normal) retardées sur le texte immédiates sur le graphe déconversion en Li itération si résultat non satisfaisant, déconversion vers L1… Ln si OK retour à la lecture
44
INTROIIIIIIIVCONC p. 43 Lecture en français dun document UNL-xml Page web fabriquée à la « UNL » origine = anglais, avec le graphe UNL derrière
45
INTROIIIIIIIVCONC p. 44 Sélection dun fragment à coéditer
46
INTROIIIIIIIVCONC p. 45 État initial de la coédition
47
INTROIIIIIIIVCONC p. 46 Trois cadres dans lenvironnement de coédition
48
INTROIIIIIIIVCONC p. 47 Choix de visualisation des autres langues
49
INTROIIIIIIIVCONC p. 48 On peut insérer manuellement les corrections
50
INTROIIIIIIIVCONC p. 49 Si on coédite (pour partager), les modifications possibles sont proposées par le système
51
INTROIIIIIIIVCONC p. 50 Modifications proposées par le système Contraintes langue coéditée liaisons établies spécifications dUNL sortie de l'AMS Exemples Chinois – majuscule/minuscule (x), détermination (?), bonne segmentation (o) Arabe – duel (pas possible pour linstant) Japonais – plusieurs niveaux de politesse (pas possible pour linstant)
52
INTROIIIIIIIVCONC p. 51 État après avoir fait une modification
53
INTROIIIIIIIVCONC p. 52 Obtention de la nouvelle déconversion
54
INTROIIIIIIIVCONC p. 53 Lecture du nouveau texte
55
INTROIIIIIIIVCONC p. 54 Déconversion vers lespagnol
56
INTROIIIIIIIVCONC p. 55 Déconversion vers lespagnol El UNIFEM asegura la participación de mujeres (avant : mujer)
57
INTROIIIIIIIVCONC p. 56 Plan de la présentation Problèmes en création et amélioration de documents multilingues I. Idée de coédition II. Pivot choisi (UNL) III. Construction de la correspondance IV. Scénarios dun système de coédition Conclusion et perspectives
58
INTROIIIIIIIVCONC p. 57 Résultats avant et après coédition étapefrançaisitalienespagnolchinoisrusse 0Des enfants regardent un phénomène du monde véritable proche et sensible. Bambini guardare fenomeno del vero il mondo percettibile. Niño miran a el fenómeno del mundo real de cercano y perceptible Дети наблюдают явление близкого и заметного настоящего мира. 1 (.@def) Les enfants regardent un phénomène du monde véritable proche et sensible. I bambini guardare fenomeno del vero il mondo percettibile. Los niño miran a el fenómeno del mundo real de cercano y perceptible. Дети наблюдают явление близкого и заметного настоящего мира. 2 (.@not) Les enfants ne regardent pas un phénomène du monde véritable proche et sensible. I bambini non guardare fenomeno del vero il mondo percettibile Los niño no miran a el fenómeno del mundo real de cercano y perceptible Дети не наблюдают явление близкого и заметного настоящего мира
59
INTROIIIIIIIVCONC p. 58 Encore quelques mots sur la coédition Certaines modifications ne sexpriment pas dans certaines langues Il faut signaler systématiquement les modifications faites au propriétaire du document Lutilisateur devrait pouvoir donner des retours aux développeurs des déconvertisseurs
60
INTROIIIIIIIVCONC p. 59 Apports de la thèse Nouvelle approche de la TAO coédition permettant de partager la révision amélioration à la demande, partielle (coût moindre) mutualisation démocratisation de la qualité Modélisation des correspondances UNL LN Calcul d'une telle correspondance sans ressources lourdes Site web SWIIVRE-UNL pour l'information, l'initiation, la validation, la recherche et l'expérimentation d'UNL
61
INTROIIIIIIIVCONC p. 60 Perspectives de recherche Construire une maquette 100% opérationnelle Évaluer la « couverture » de la correspondance Compléter l'architecture, de façon à pouvoir : traiter une nouvelle langue de coédition sans programmer à bas niveau (outil générique à inventer) éditer les graphes UNL par manipulation directe avec "localisation" dans la langue de coédition calculer et visualiser la correspondance entre deux versions (dans 2 LN) en passant par UNL Créer un graphe UNL au moment de lédition dune phrase en langue naturelle en intégrant la désambiguïsation interactive
62
INTROIIIIIIIVCONC p. 61 Je vous remercie pour votre attention Je vous remercie de votre attention Я влагодарю вас из-за вашего attention Ringraziare te per la tua attenzione Yo os agradezco por vuestras atención thank(icl>do).@entry I you.@pl attention(icl>awareness) agt obj rsn pos
63
INTROIIIIIIIVCONC p. 62 Expressivité du langage UNL (I) Comment désambiguïser une UW (sous-spécification)? state state(icl>do(obj>thing)) – constater state(icl>nation) – lEtat state(icl>situation) – la situation, le stade state(icl>government) – le gouvernement answer answer(icl>do) – répondre answer(icl>thing) – réponse marry marry(agt>male) – (chinois), женитья (russe) marry(agt>female) – (chinois), выходить замуж(russe) Comment ajouter un nouveau concept? samba(icl>dance) – un genre de danse ikebana(icl>art, obj>flower) – art floral japonais Expressivité du langage UNL (II) 41 relations sémantiques insuffisantes? Décomposition la conjonction anglaise On ne trouve pas la relation sémantique pour exprimer malgré man(come(icl>do), although) obj(although, rain(icl>natural phenomenon)) il vient malgré la pluie Expériences – corpus codés assez variés Document de lONU FB2004, sport, mode demploi
64
INTROIIIIIIIVCONC p. 63 Expressivité du langage UNL (II) 41 relations sémantiques insuffisantes? non Décomposition de conjonction anglaise (malgré) On ne trouve pas la relation sémantique pour exprimer malgré, mais on peut écrire comme ça: man(come(icl>do), although) obj(although, rain(icl>natural phenomenon)) il vient malgré la pluie Corpus codés assez variés Document de lONU FB2004, sport, manuel dutilisation
65
INTROIIIIIIIVCONC p. 64 Site web SWIIVRE-UNL – page daccueil
66
INTROIIIIIIIVCONC p. 65 Site web SWIIVRE-UNL - expérimentation
67
INTROIIIIIIIVCONC p. 66 Effet de la coédition sur les autres langues Déconversion vers la langue originale est déconseillée. Pour garder le sens original On suppose que les utilisateurs nabusent pas Sur-spécifications possibles marry(agt>male) pour le français, langlais.@past,.@pl pour le chinois, le thaï À déconvertisseur de juger Plus de renseignements corrects, plus de chance de générer une phrase correcte
68
INTROIIIIIIIVCONC p. 67 Effet de la coédition sur les autres langues - II étapefrançaisespagnolrussechinois 0 Il lave sa voiture hier. él asea su coche ayer. Он моет свой автомобиль вчера. 1.@past Il a lavé sa voiture hier. él aseó su coche ayer. Он вымыл свой автомобиль вчера. 2.@pl Il a lavé ses voitures hier. él aseó sus coches ayer. Он вымыл свои автомобили вчера. Sur-spécifications pour le chinois Versions générées par les déconvertisseurs
69
INTROIIIIIIIVCONC p. 68 Rotation de larbre UNL - I La mer dAral était la quatrième plus grande mer dans le monde.
70
INTROIIIIIIIVCONC p. 69 Rotation de larbre UNL - II La mer dAral était la quatrième plus grande mer dans le monde.
71
INTROIIIIIIIVCONC p. 70 Treillis LMS - I terre verb terrer des det des pommes verb pommer mange verb manger De de Je pper je terre subc terre pommes subc pomme pommes de terre subc pomme de terre des prep des Je mange des pommes de terre.
72
INTROIIIIIIIVCONC p. 71 Treillis LMS - II. Les États-Unis vont donner leur accord. Le parlement américain a donné son accord. guo2hui4 parlement tong2yi4 donner son accord mei3guo2 Les Etats-Unis hui4 particule de futur mei3 américain mei3 beau, beauté
73
INTROIIIIIIIVCONC p. 72 Le post-doc Activités Spécifications des données linguistiques et syntaxiques Tests et validation des données et des traitements linguistiques Méthodologies de segmentation et danalyse des textes chinois Contribution à des études sur le TAL du chinois Mise en place dun environement déditioin des idéogrammes Contribution à lidentification des applications du TALN en Chine Participatioin à des projets collaboratifs internationaux Rôle dinterface avex une équipe basée à Pékin
74
INTROIIIIIIIVCONC p. 73 Le post-doc Profils souhaités Linguistique et informatique Programmation C, C++ TALN du chinois Connaissances en représentation formelle des données linguistiaues Connaissances en édition de textes multilingues Sensibilité aux applications du TALN Esprit de la communication et du travail en équipe Esprit du travail multildisciplinaire Langues : chinois et anglais
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.