La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

L’indexation avec un thesaurus

Présentations similaires


Présentation au sujet: "L’indexation avec un thesaurus"— Transcription de la présentation:

1 L’indexation avec un thesaurus

2 Thesaurus : définitions de l’AFNOR
Définition de l’AFNOR, 1987 : « Langage documentaire fondé sur une structuration hiérarchisée d’un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes d’une ou plusieurs langues naturelles et les relations entre notions par des signes conventionnels. »

3 Thesaurus : définitions de l’AFNOR
Définition de l’AFNOR, norme NF Z , 1981 : «  Un thesaurus est une liste d’autorité organisée de descripteurs et de non descripteurs obéissant à des règles terminologiques propres et reliés entre eux par des relations sémantiques (hiérarchiques, associatives ou d’équivalence). Cette liste sert à traduire en un langage artificiel dépourvu d’ambiguïté des notions exprimées en langage naturel. »

4 Les relations entre les termes d’un thesaurus
Relations d’équivalence Relations de hiérarchie Relations d’associativité Relations de définition Relations catégorielles

5 Le thesaurus au sein de la RI
Documents Recherche des concepts Traduction en langage documentaire Bordereau de saisie Besoin d’information Questions Recherche des Concepts Traduction en langage documentaire Formulation de la requête Thesaurus Fichier recherche Réponse

6 Tableau comparatif de quelques langages documentaires
Avantages Inconvénients Observations Classifications encyclopédiques (type CDU) Système universel Regpmt des notions sous un indice précis Classt s/ rayonnages suivant classt des fiches Manque de souplesse Volume important des tables Peu adaptées aux domaines spécifiques Indices pfs longs et complexes Plus adaptées aux bibliothèques qu’aux centres de documentation Classifications spécialisées Notions sous un indice précis Adaptées aux besoins des usagers Classt sur rayonnages suivant classt des fiches Difficulté pr introduire notions nouvelles Difficulté pr classer notions hors sujets Peuvent être adoptées pr une bibliothèque ou un service de documentation spécialisés Lexiques de mots (mots-clés, vedettes-matières) Grande souplesse Indexation fine Mises à jour sans pb Adaptées à l’automatisation Encombrement du fichier matières Manque de hiérarchisat° Impossible de classer les docs sur rayonnages Conviennent mieux à un service de documentation Thesaurus Hiérarchisation Universalité ds son domaine Indexation en profondeur Automatisation Encombrement des fichiers ds les systèmes manuels Rangement sur rayonnages différent du classt ds le fichier Convient à un service de documentat° automatisé Outil de recherche des bases de données

7 Motbis, le thesaurus du secteur éducatif
Un thesaurus élaboré à la fin des années 1980 au sein du CNDP (centre national de documentation pédagogique). Créé à partir de langages documentaires qui existaient déjà, à savoir : Mémobase+, Mémotec, Thélyce, Rameau et Eudised. 1ère version publiée en 1989.

8 Pourquoi avoir créé Motbis ?
Pour donner aux centres de documentation de l’Education nationale un outil spécifique, adapté à leurs besoins. Motbis est un thesaurus encyclopédique (on trouve des documents relatifs à tous les domaines du savoir dans les centres de documentation des établissements scolaires). Mais c’est un thesaurus spécialisé (usage destiné au public des établissements scolaires).

9 Une structure à triple entrée
Liste alphabétique permutée Liste alphabétique structurée Terminogrammes

10 Liste alphabétique structurée

11 Liste hiérarchique

12 Terminogrammes

13 Liste thématique

14 Motbis en pratique (1) Utiliser Motbis sous sa forme papier
Commencer par consulter le tome 1 pour rechercher le descripteur. Vérifier l’usage du descripteur dans le tome 2 et lire les NA éventuelles. Vérifier l’environnement sémantique dans le tome 3 (rappel : on ne peut choisir à la fois un TG et un TS dans la même indexation).

15 Motbis en pratique (2) Utiliser Motbis sous sa forme électronique :
Entrer dans le thésaurus. Inscrire le terme recherché  il apparaît dans une liste alphabétique sur la gauche de l’écran. A ce moment-là, plusieurs solutions : Soit il est non-descripteur : il apparaît alors en italique dans la liste. En cliquant sur le terme, on est directement renvoyé au descripteur employé pour ce mot dans le thésaurus. Soit il est descripteur : on clique alors sur le mot pour faire apparaître l’environnement sémantique. TG, TS, EP, etc. apparaissent alors sur l’écran dans différentes « cases ». Soit le mot n’est ni descripteur, ni non-descripteur : alors la recherche dans le thésaurus ne donne rien et il convient de chercher un synonyme susceptible d’être présent dans Motbis ou, à défaut, d’indexer le document avec ce terme dans le champ d’indexation libre du logiciel.

16 Un thesaurus évolutif Des évolutions qui sont le fruit d’un travail interne à l’Education nationale (Scéren, documentalistes…) et de relations étroites avec des partenaires extérieurs.

17 Les versions de Motbis 1ère version en 1989. Motbis 2 en 1992.
Des évolutions annuelles  des millésimes (Motbis 2006, Motbis 2007…).

18 Pourquoi faire évoluer Motbis ?
Refléter le plus fidèlement possible l’évolution des connaissances dans un domaine, les intérêts et les besoins des usagers. Combler les lacunes conceptuelles et terminologiques (ex. : toute la terminologie liée aux TIC a été intégrée pour répondre aux besoins d’indexation). Corriger les erreurs éventuelles qui ont pu apparaître dans la version précédente (erreurs typographiques notamment).

19 Une création récente : www.motbis.fr
Objectif : créer une communauté d’utilisateurs. Des services d’accompagnement sont proposés. Des contacts avec le groupe projet sont possibles. L’activité de conception et de maintenance est rendue visible. Il devient possible de participer à la création du thésaurus.

20 Des critères pour l’adoption de nouveaux descripteurs
Caution bibliographique fréquence d’utilisation du terme dans les documents à traiter Caution de l’utilisateur fréquence d’utilisation du terme dans les requêtes Univocité de la représentation du concept un descripteur = un seul concept un concept = un seul descripteur éviter les termes polysémiques et ambigus Compatibilité structurelle facilité d’intégration du terme dans la structure existante (réseaux sémantiques, forme du terme…) Utilisation courante de préférence, le terme choisi doit être d’usage courant s’il est précis et non ambigu Cohérence utilisation constante du même type de terme pour représenter les concepts et adoption du même niveau de langage Indépendance contextuelle capacité d’un terme à représenter une réalité détachée de tout contexte

21 Les types de modifications possibles
Modification simple d’un descripteur Sans retentissement sur la structure conceptuelle du thésaurus.  Le nouveau descripteur représente le même concept que l’ancien, il ne fait que s’y substituer. Transformation d’un descripteur en non descripteur Etudier les relations sémantiques de l’ancien descripteur et évaluer leur pertinence pour le nouveau descripteur. Ajout d’un nouveau terme au lexique Il faut apporter simultanément les modifications nécessaires à tous les descripteurs auquel le nouveau terme est relié sémantiquement (EP, EM, TG, TS…). Suppression totale d’un descripteur Possible uniquement lorsque ce descripteur n’est pas utilisé pour l’indexation et pour la recherche. S’assurer que cette non utilisation n’est pas liée à un défaut du thésaurus (descripteur utile mais orphelin), à un problème d’indexation (niveau de spécificité par exemple) ou de lien sémantique mal construit. Lorsqu’un descripteur apparaît comme superflu, il est conseillé de le transformer en non descripteur, autrement dit de garder une entrée par ce terme dans le thésaurus.


Télécharger ppt "L’indexation avec un thesaurus"

Présentations similaires


Annonces Google