SCIENCES DE L'INFORMATION TERMINOLOGIE DOCUMENTAIRE de base Daniel CERDA - 2006 Sciences de l'information - Daniel CERDA 2006
SCIENCES DE L’INFORMATION TERMINOLOGIE DE BASE Avant -propos Cette animation s’appuie sur une fiche établie par le Ministère de la Culture - Direction des musées de France - Bureau de l’informatique et de la recherche Base JOCONDE - Septembre 2004. Il m’a semblé judicieux d’y ajouter quelques précisions et termes pertinents. Les définitions sont reprisent sous leur forme simple, parfois retouchée, puis éventuellement développées de manière à pouvoir, sommairement mais sans impasse, rappeler l’essentiel : les fondamentaux ! En effet, il n’est pas ou plus possible de se contenter de définitions pas toujours très claires ni explicites, imprécises voire inexactes alors que les sciences de l’information relèvent, de fait, d’une science universelle. Si on clique sur chaque terme de ce lexique apparaissant dans chaque diapositive, un lien hypertexte renvoie à la fiche qui le définit. Daniel CERDA - 2006 Sciences de l'information - Daniel CERDA 2006
LISTE EXHAUSTIVE - Mot-clé - Base de données - Non descripteur Pour accéder directement à une définition dessus - Mot-clé - Base de données - Bibliothèque - Non descripteur - Bruit - Occurence - Centre de documentation - Opérateur(s) booléen(s) - Champ - Silence - Descripteur - Synonymie Descripteur associé - Terme Descripteur générique - Thésaurus Descripteur spécifique - Troncature - Fonds - Vocabulaire contrôlé - Hiérarchie - Vocabulaire libre - Langage naturel Sciences de l'information - Daniel CERDA 2006
- BASE DE DONNEES - - Une base de données est un ensemble de données (informations sous forme électronique) relatif à un domaine défini de connaissances et organisé pour être disponibles aux consultations d’utilisateurs. Sciences de l'information - Daniel CERDA 2006
- BASE DE DONNEES - - Une base de données, généralement appelée BD (en anglais DB pour database) est un ensemble structuré et organisé permettant le stockage de grandes quantités d’informations afin d’en faciliter l’exploitation (ajout, mise à jour, recherche de données). Une base de données se traduit physiquement par un ensemble de fichiers sur une unité de stockage en évitant les redondances. Les données doivent pouvoir être utilisées, à l’aide de programmes, par des utilisateurs différents. La notion de base de données est généralement couplée à celle de réseau, afin de pouvoir mettre en commun des informations, d’où le nom de base. On parle tout aussi généralement de système d’information pour désigner toute la structure regroupant les moyens mis en place pour pouvoir partager les données. Sciences de l'information - Daniel CERDA 2006
- BIBLIOTHEQUE - - Organisme chargé de constituer des collections organisées de documents, de les accroître, de les traiter, d’en faciliter l’utilisation par les usagers. Source AFNOR Nota : le bibliothécaire a une mission de conservation et d’enrichissement d’un fonds à vocation soit encyclopédique, soit spécialisée. Sciences de l'information - Daniel CERDA 2006
- BRUIT (BRUIT DOCUMENTAIRE) - Réponse à une recherche documentaire mais non pertinente, inappropriée, insatisfaisante ou creuse (sans contenu valable). Sciences de l'information - Daniel CERDA 2006
- CENTRE DE DOCUMENTATION - Organisme ou service chargé de rassembler, organiser, conserver, mettre à la disposition d’utilisateurs les outils de recherche et les documents apportant une réponse à leur demande d’information. Source AFNOR Nota : le documentaliste a une mission de service aux utilisateurs et de diffusion rapide de l’information. Sciences de l'information - Daniel CERDA 2006
- CHAMP - - Ensemble de données de l’item d’une base ; rubrique contenant des informations de même nature (titre, auteur, date, etc.) Sciences de l'information - Daniel CERDA 2006
- DESCRIPTEUR - - Mot ou groupe de mots choisi pour caractériser les informations contenues dans un document et pour faciliter les recherches documentaires. Les descripteurs font, en général, partie d’une liste de vocabulaire contrôlé, organisé et limité appelé thésaurus. Sciences de l'information - Daniel CERDA 2006
- DESCRIPTEUR ASSOCIE - Pour ouvrir d’autres pistes de recherche, certains descripteurs d’un thésaurus sont associés au descripteur considéré en raison de leur sens proche (ex : nautisme, associé à eau). Il est également justifié d’associer des descripteurs qui désignent des concepts similaires mais non équivalents, des concepts complémentaires ou encore des concepts contraires (ex : sécheresse, associé à eau). Sciences de l'information - Daniel CERDA 2006
- DESCRIPTEUR GENERIQUE - Descripteur désignant une notion englobant d’autres notions plus fines représentées par des termes spécifiques (ex : bois, générique de bois fruitier, bois exotique, etc.). Sciences de l'information - Daniel CERDA 2006
- DESCRIPTEUR SPECIFIQUE - Descripteur désignant une notion plus large représentée par un terme générique (ex : chêne, spécifique de bois). Sciences de l'information - Daniel CERDA 2006
- FONDS ( Fonds d’archives) - Ensemble des documents de toute nature qu’une personne physique ou morale a automatiquement et organiquement réunis dans l’exercice de ses activités et conservés en vue d’une utilisation éventuelle. Source AFNOR Nota : l’archiviste a une mission de conservation exhaustive, sans sélection ni élimination des documents. La communication des des documents est soumise à condition Sciences de l'information - Daniel CERDA 2006
- HIERARCHIE - - Dans un thésaurus, une hiérarchie est un système montrant les relations entre les termes, de concepts généraux et vastes aux catégories plus précises. Une relation hiérarchique existe entre un descripteur spécifique et un descripteur générique. Sciences de l'information - Daniel CERDA 2006
- LANGAGE NATUREL - - Il est plus riche que le vocabulaire contrôlé mais peut être implicite, redondant et ambigu. Dans une base de données, une interrogation en langage naturel peut offrir la possibilité au chercheur de ne pas avoir à construire une requête en manipulant les opérateurs booléens ni à choisir les bons descripteurs. Une recherche en langage naturel est fréquemment génératrice de bruit documentaire. Sciences de l'information - Daniel CERDA 2006
- MOT-CLE - - Désigne un mot ou groupe de mots choisi librement dans le titre ou dans le corps d’un texte (ou d’un document), permettant d’en caractériser le contenu et d’en faciliter la classification et la recherche. Le mot-clé peut aussi éventuellement faire partie d’une liste fermée de mots (dits descripteurs) utilisée à des fins de description et de recherche de documents (on parle de vocabulaire contrôlé). Les mots-clé ne sont pas hiérarchisés (par contre, les descripteurs le sont). Sciences de l'information - Daniel CERDA 2006
- NON-DESCRIPTEUR - - Terme rejeté au sein d’un thésaurus. Il peut s’agir de synonymes, d’abréviations ou de variantes orthographiques du concept retenu comme descripteur (ex : descripteur : cachot, utiliser : prison). Sciences de l'information - Daniel CERDA 2006
- OCCURRENCE - - Nombre de fois où un mot ou une expression apparaît dans un texte. Le nombre d’occurrences permet d’évaluer la fréquence d’apparition des descripteurs recherchés, dans une base de données par exemple. Sciences de l'information - Daniel CERDA 2006
- OPERATEUR(S) BOOLEEN(S) - L’adjectif « booléen » vient du nom du mathématicien George Boole. Ces opérateurs sont basés sur la théorie des ensembles. Dans une base de données, les opérateurs booléens : - ET = intersection - OU = union - SAUF = exclusion permettent de faire une recherche avec un ou plusieurs mots en limitant ou en croisant un ou plusieurs champs. Sciences de l'information - Daniel CERDA 2006
- OPERATEUR(S) BOOLEEN(S) - - ET - L’opérateur ET implique que chaque terme de la recherche est contenu dans chaque document répondant à la requête . ET = UNION Sciences de l'information - Daniel CERDA 2006
- OPERATEUR(S) BOOLEEN(S) - - OU - L’opérateur OU implique que l’un ou l’autre des termes de la recherche sont contenus dans chaque document répondant à la requête. OU = UNION Sciences de l'information - Daniel CERDA 2006
- OPERATEUR(S) BOOLEEN(S) - - SAUF - L’opérateur SAUF implique que le terme suivant « SAUF » ne figure pas dans chaque document répondant à la requête. SAUF = EXCLUSION Sciences de l'information - Daniel CERDA 2006
- SILENCE - - Dans une recherche documentaire, il y a silence lorsque les documents pertinents et existants dans la base de données ne sont pas sélectionnés à la suite de l’interrogation. Sciences de l'information - Daniel CERDA 2006
- SYNONYMIE - - Deux termes dont le sens est proche sont des synonymes même si chacun exprime une variante de sens. Par exemple, les mots complexe, compliqué et difficile sont des synonymes même s’ils n’ont pas tout à fait le même sens. Dans un vocabulaire contrôlé, une relation de synonymie permet d’obtenir le même nombre de réponses que l’on interroge avec le descripteur ou avec l’un de ses synonymes (ex : Roma, synonyme de Rome; 28 et Eure et Loir, synonymes d’Eure-et-Loir, etc.) Sciences de l'information - Daniel CERDA 2006
- TERME - - Désigne un mot ou groupe de mots qui ne s’applique qu’à un seul objet ou concept, et ce, dans un domaine donné. Autrement dit, il s’agit d’un mot qui désigne de façon univoque un objet ou un concept dans un domaine qui, généralement, est un domaine de spécialité. De fait, dans l’idéal terminologique, un terme n’a pas d’équivalent (ou synonyme) dans le domaine désigné. Un terme formé d’un seul mot (par exemple : avion) est dit terme simple ou uniterme, alors que celui constitué de plusieurs mots est appelé terme complexe ou multi-terme (par exemple : avion à réaction), bien que le mot terme soit couramment employé dans les deux cas. On parle également d’unité terminologique. Sciences de l'information - Daniel CERDA 2006
- THESAURUS - - Le thésaurus est un outil de contrôle du vocabulaire dont l’utilisation doit rendre la recherche documentaire plus efficace. Un thésaurus est une liste de termes organisée se rapportant à un ou plusieurs domaines de la connaissance. Les termes inscrits dans un thésaurus sont des descripteurs. La plupart des bases de données ont leur thésaurus dans lequel on choisit les descripteurs décrivant les documents cités dans la base. Un thésaurus indique les termes utilisés pour décrire sans ambiguïté le contenu des documents au détriment d’autres termes, non retenus. Le vocabulaire sur un thème précis est donc regroupé, limité, classé et régi par des relations hiérarchiques, d’équivalence ou de parenté entre les termes (descripteurs générique, descripteur spécifique, descripteur associé). Les modalités d’emploi des descripteurs peuvent être brièvement expliqués dans des notes d’application (ou note d’usage). Sciences de l'information - Daniel CERDA 2006
- TRONCATURE - - La troncature est un signe « joker » qui remplace une ou plusieurs lettres d’un mot. Elle permet de rechercher des termes qui ont une racine identique en substituant un ou plusieurs caractères par un symbole. Ce symbole est généralement un astérisque. Nota : astérique * Sciences de l'information - Daniel CERDA 2006
- VOCABULAIRE CONTRÔLE - Un vocabulaire contrôlé est une liste de vocabulaire qui n’a pas l’ambiguïté du langage naturel. Dans une base de données, le vocabulaire contrôlé garantit qu’un sujet sera décrit avec les mêmes termes préférentiels. Durant une recherche, on peut ainsi trouver plus facilement tous les renseignements relatifs à un sujet précis. Lorsque cette liste de vocabulaire est organisée et régie par des relations sémantiques, on parle de thésaurus. Sciences de l'information - Daniel CERDA 2006
- VOCABULAIRE LIBRE - - Désigne un ensemble de mots (dits mots-clé) choisis librement pour rechercher un document (ou partie de document) dans une banque de données, ou choisis librement dans le titre ou dans le corps de texte (ou d’un document) pour en caractériser le contenu à des fins de classification et de recherche en cas de besoin. On parle aussi de langage naturel. Sciences de l'information - Daniel CERDA 2006
Sciences de l'information - Daniel CERDA 2006