La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Normalisation des échanges de données en terminologie

Présentations similaires


Présentation au sujet: "Normalisation des échanges de données en terminologie"— Transcription de la présentation:

1 Normalisation des échanges de données en terminologie
Le cas des relations dites « conceptuelles » Laurent Romary & Marc Van Campenhoudt avec la voix d ’André Schaaff

2 Représentation et échange des relations : état des lieux
Kif (Knowledge Interchange Format) CGS (Conceptual Graph Standard) Oil (Ontology Inference Layer) XTM (XML Topic Maps : Iso )

3 Normes d ’échanges : bref historique
Micromater TEI, chapitre 13 Martif (ISO , 1999) Fondé sur Iso 12620 Nouveaux projets ISO : Geneter, MSC - DXLT (projet Salt),TMF Olif 2

4 TMF - Terminological Markup Framework

5 Principes généraux Expression de contraintes au niveau de la représentation de terminologies informatisées Quelle est la structure sous-jacente des terminologies informatisées ? Quelle sont les catégories de données utilisées et sous quelles conditions ? Maintient de l’interopérabilité entre représentations Proposer un outil conceptuel pour la comparaison de deux formats donnés

6 Définitions TMF: Terminological Mark-up Framework
Définition de structures sous-jacentes et de mécanismes nécessaires à la représentation informatisée de données terminologiques Indépendance vis-à-vis des formats spécifiques GMT: Generic Mapping Tool Un format XML abstrait équivalent au modèle sous-jacent de TMF TML: Terminological Mark-up Language Une représentation spécifique générée dans le cadre de TMF

7 Une famille de formats…
TMF TML1 TML2 TML3 TMLi (Geneter) (DXLT) GMT

8 Représentation de la structure sous-jacente de données terminologiques
Meta-modèle Représentation de la structure sous-jacente de données terminologiques

9 Modèle conceptuel : structure typique
Décrit et défini dans n langues Désigné par n termes

10 Exemple : la fiche Dhydro
Langue 1 Langue 2 « Concept » Langue 3 Langue ... Définition Terme 1 Terme 2 Terme... ... Grammaire Usage Contexte

11 Le squelette structurel
Terminological Data Collection (TDC) Global Information (GI) Complementary Information (CI) * Terminological Entry (TE) * Language Section (LS) * Term Level (TL) * Term Component Level (TCL)

12 Comment cela fonctionne ?
Étudions un exemple…

13 Exemple DXLT : <termEntry id="ID67">
<descrip type="subjectField">manufacturing</descrip> <descrip type="definition">A value between 0 and 1 used in ... </descrip> <langSet lang="en"> <tig> <term>alpha smoothing factor</term> <termNote type="termType">fullForm</termNote> </tig> </langSet> <langSet lang="hu"> <term>Alfa ... </term> </termEntry>

14 Identification du squelette structurel
TE: Terminological Entry LS: Language Section TS: Term Section id=‘ID67’ [attribute] subjectField=‘ manufacturing ’ [typedElement] definition=‘A value…’ [typedElement] lang=‘ hu ’ [attribute] lang=‘ en ’ [attribute] term=‘…’ [element] term=‘alpha smoothing factor’ [element] termType=‘fullForm’ [typedElement] TE LS TS

15 Modèle TMF niveau information
id=‘ID67’ subjectField=‘ manufacturing ’ definition=‘A value…’ TE LS LS lang=‘ en ’ lang=‘ hu ’ TS term=‘alpha smoothing factor’ termType=‘fullForm’ term=‘…’ TS

16 Représentation GMT <struct type="TE">
<feat type="id">ID67</feat> <feat type="subjectField">manufacturing</feat> <feat type="definition">A value between 0 and 1 used in ... </feat> <struct type="LS"> <feat type="lang">en</feat> <struct type="TS"> <feat type="term">alpha smoothing factor</feat> <feat type="termType">fullForm</feat> </struct> <feat type="lang">hu</feat> <feat type="term">Alfa ... </feat>

17

18 Une description formelle
Catégories de données Une description formelle

19 Quel modèle pour les catégories de données ?
Utilisation de XML : Cohérence avec les principes de TMF Utilisation de feuilles de style pour la génération de schémas et de filtres Utilisation de RDF (Resource Description Framework) Futur format pour la représentation de méta-données : La description de catégories de données est synonyme de méta-donnée dans l’approche TMF

20 Description d’une catégorie de données
DCIdentifier DCParent DCName dcsd:DCIdentifier dcsd:DCParent DCDefinition dcsd:DCName dcsd:DCDefinition dcsd:DCType DCType (S, C) Data Category dcsd:DCExample DCExample dcsd:DCAdmin dcsd:DCComment dcsd:Content Locus should remain under the scope of dcsd:Level DCAdmin DCComment Locus Content Salt /SEW

21 Niveaux et contenus Content Level/Loci TargetType DataType
dcsd:DataType dcsd:TargetType Level/Loci rdf:Alt rdf:Alt TargetType DataType List of References List of References rdf:Alt rdf:li Ref to other datcats rdf:li List of References Ref to other datcat(s) rdf:li Ref to other datcat(s)

22 Relations implicites et explicites
Synonymie Équivalence Relations à expliciter liens lexicaux entre termes : ‘abréviation de’, ‘troncation de’, ‘symbole de’, etc. liens sémantiques entre « concepts » ‘type de’, ‘cause de’, ‘au-dessus de’, etc.

23 Situer les relations conceptuelles
Au niveau interlangue la relation est valide pour tout équivalent Concept = noyau de sens commun Au niveau de chaque langue la relation est valide pour tout synonyme Concept = unité de compréhension Au niveau de chaque terme La relation est valide pour un terme donné Concept = ?

24 Quelle typologie des relations?
ISO (1999) typologie élémentaire espèce-genre, partie-tout, séquentielle (spatiales, temporelles, causales) et associative imprécision la place de chaque concept dans la relation n’est pas toujours précisée

25 Olif 2 (2000) Open Lexicon Interchange Format
inventaire nettement plus étoffé prenant en compte : les théories de la méronymie l’interaction entre relations sémantiques et syntaxe mélange des relations lexicales : ‘abréviation de’ sémantiques : ‘synonyme de’ conceptuelles : ‘ fils de’

26 Quelles informations échanger?
classification typologique du lien niveau de validité « concept », langue, terme? autres informations direction éventuelle du «vecteur» formulation du lien dans chaque langue propriétés de la relation restriction trait distinctif ...

27 Conclusion Un modèle général pour l’analyse et la représentation de collections de données terminologiques Un formalisme sous-jacent exprimé en XML, RDF Outils associés DCSEditor, DCSBrowser, Génération automatique de filtres XSLT et de schémas XML pour une spécification donnée de TML


Télécharger ppt "Normalisation des échanges de données en terminologie"

Présentations similaires


Annonces Google