Projet Métadonnées Dublin Core Licence Professionnelle Ressources Documentaires et Bases de Données option Image et Son IUT Michel de Montaigne - Bordeaux 3 Groupe de Travail : Julien LE YOUDEC Cédric JANET Romain CARRO Travail réalisé dans le cadre du cours de « Métadonnées » De Soufiane Rouissi – IUT Bordeaux 3
Partie 1 Les métadonnées constituent un ensemble structuré et cohérent d’informations permettant de décrire le contenu d’un objet ou d’une ressource, et pouvant y être directement intégrées. La description ou l’insertion de ces propriétés caractéristiques ont pour intérêt de faciliter la recherche et l’échange d’information, l’archivage, la gestion et la protection des droits. Aujourd’hui, face à l’abondance d'informations et de données numériques disponibles en ligne, le recours à des pratiques et standards de métadonnées est devenu nécessaire. C'est ce besoin de métadonnées descriptives standardisées que le Dublin Core veut combler. Les métadonnées constituent un ensemble structuré et cohérent d’informations permettant de décrire le contenu d’un objet ou d’une ressource, et pouvant y être directement intégrées. La description ou l’insertion de ces propriétés caractéristiques ont pour intérêt de faciliter la recherche et l’échange d’information, l’archivage, la gestion et la protection des droits. Aujourd’hui, face à l’abondance d'informations et de données numériques disponibles en ligne, le recours à des pratiques et standards de métadonnées est devenu nécessaire. C'est ce besoin de métadonnées descriptives standardisées que le Dublin Core veut combler. Géré par le DCMI (Dubin Core Metadata Initiative), la norme Dublin Core comprend 15 éléments dont le sens et la portée ont été établis par un consensus international de professionnels provenant de diverses disciplines, avec pour objectif de décrire une grande variété de ressources sur le Web. Chaque élément du Dublin Core est facultatif et peut être répété. Chaque élément possède également un ensemble d’attributs qui peuvent être utilisés afin de raffiner davantage la signification de l'élément. D’envergure internationale, le Dublin Core vise l’interopérabilité, la simplicité et l’efficacité dans la recherche d’information. Géré par le DCMI (Dubin Core Metadata Initiative), la norme Dublin Core comprend 15 éléments dont le sens et la portée ont été établis par un consensus international de professionnels provenant de diverses disciplines, avec pour objectif de décrire une grande variété de ressources sur le Web. Chaque élément du Dublin Core est facultatif et peut être répété. Chaque élément possède également un ensemble d’attributs qui peuvent être utilisés afin de raffiner davantage la signification de l'élément. D’envergure internationale, le Dublin Core vise l’interopérabilité, la simplicité et l’efficacité dans la recherche d’information. 1. Présentation synthétique du Dublin Core
2. Les notions de raffinement et de vocabulaires. 2. Les notions de raffinement et de vocabulaires. Les raffinements font partie de ce que l’on nomme « qualificatifs », au même titre que les schémas d’encodage tels que les vocabulaires contrôlés. Ils permettent de préciser le sens d'un élément pour qu'il soit plus précis, en faisant référence à un schéma donné : un élément raffiné partage le même sens que l'élément non qualifié mais avec une portée plus restreinte. Les définitions des termes de raffinement d'éléments pour les qualificatifs doivent être publiquement disponibles. Les raffinements font partie de ce que l’on nomme « qualificatifs », au même titre que les schémas d’encodage tels que les vocabulaires contrôlés. Ils permettent de préciser le sens d'un élément pour qu'il soit plus précis, en faisant référence à un schéma donné : un élément raffiné partage le même sens que l'élément non qualifié mais avec une portée plus restreinte. Les définitions des termes de raffinement d'éléments pour les qualificatifs doivent être publiquement disponibles. On a recours à des vocabulaires contrôlés dans le but renseigner les descriptions en adéquation avec la norme Dublin Core. Un vocabulaire contrôlé est un ensemble restreint de termes utilisés logiquement et définis avec soin, en association avec les champs du Dublin Core, dans le but d’améliorer les résultats d’une recherche, et constitue une base terminologique « commune ». Ils nécessitent toutefois une mise à jour et une diffusion régulières, assurée par un corps administratif, et leur utilisation doit être clairement identifiée. On a recours à des vocabulaires contrôlés dans le but renseigner les descriptions en adéquation avec la norme Dublin Core. Un vocabulaire contrôlé est un ensemble restreint de termes utilisés logiquement et définis avec soin, en association avec les champs du Dublin Core, dans le but d’améliorer les résultats d’une recherche, et constitue une base terminologique « commune ». Ils nécessitent toutefois une mise à jour et une diffusion régulières, assurée par un corps administratif, et leur utilisation doit être clairement identifiée.
- Définitions des champs du DublinCore - Exemples de valeurs - Exemples de raffinements Partie 2 - Titre Identifiant : Title Définition : Le nom donné à la ressource par le créateur ou l'auteur. - Créateur Identifiant : Creator Définition: La personne, l'organisation ou le service principalement responsable de la création du contenu intellectuel de la ressource. Par exemples, les auteurs d'un document, ou les artistes ou les photographes, illustrateur dans le cas de ressources visuelles.
- Sujet et mot-clefs Identifiant : Subject Le sujet de la ressource. Typiquement, le sujet sera décrit par un ensemble de mots-clefs ou de phrases qui précisent le sujet ou le contenu de la ressource. L'utilisation de vocabulaires contrôlés et de schémas de classification formels est encouragée. -Description Identifiant:Description Une description textuelle du contenu de la ressource, y compris un résumé, dans le cas d'objets tels que des documents, ou une description du contenu dans le cas de ressources visuelles. <meta name="DC.Description" Content= « thèse portant sur l’explication et les propriétés de la matière atteignant la vitesse de la lumière »>
-Editeur Identifiant: Publisher Définition: L'entité, c'est à dire, une personne, une organisation ou encore un service, responsable de la diffusion de la ressource dans sa forme actuelle, telle qu'une maison d'édition, un département universitaire, une entreprise. -Contributeur Identifiant: Contributor Définition: Une entité, à savoir, une personne, une organisation ou un service, non mentionné dans l'élément creator qui a contribué de façon secondaire, à la création du contenu de la ressource.
-Date Identifiant: Date Définition: La date à laquelle la ressource a été publiée dans sa forme actuelle. L'usage recommandé est sous la forme d'un nombre de 8 chiffres tel que AAAA-MM-JJ, faisant partie de la norme ISO Dans ce schéma, l'élément date correspond au 8 Avril Beaucoup d'autres schémas sont possibles, mais si on utilise un autre schéma, il devrait être précisé de façon non ambiguë. Il existe d'autres raffinements, comme: valid = date ou période de validité available = date ou période de mise à disposition issued = date de publication modified = date de modification dateAccepted = date d'acceptation dateCopyrighted = date du copyright dateSubmitted = date où le document a été soumis
-Type de la Ressource Identifiant: Type Définition: La nature ou le genre du contenu de la ressource. Le format de cette dernière, utilisé pour identifier le logiciel et, éventuellement, le matériel qui peuvent être nécessaires pour afficher ou traiter la ressource. Dans un souci d'interopérabilité, un format devrait être sélectionné à partir d'une liste établie qui est en cours de définition dans la série des groupes de travail, au moment de la publication de ce document. -Format Identifiant: Format Définition: Le format de la ressource, utilisé pour identifier le logiciel et, éventuellement, le matériel qui peuvent être nécessaires pour afficher ou traiter la ressource. Dans un souci d'interopérabilité, un format devrait être sélectionné à partir d'une liste établie qui est en cours de définition dans la série des groupes de travail, au moment de la publication de ce document.
-Identifiant ressource Identifiant : Identifier Une référence non ambiguë de la ressource dans un contexte donné. Il est recommandé d’identifier la ressource par une chaîne de caractères ou un nombre conformes à un système formel d’identification (URI, DOI, ISBN, URL) -Source Label:Source Une chaîne de caractères ou un nombre, utilisé pour identifier de façon unique le travail d'où la ressource est dérivée, si cela est applicable. Par exemple une version PDF d'un roman peut avoir un élément source contenant un numéro ISBN correspondant à la version physique du livre à partir de laquelle la version PDF a été réalisée.
-Langue Label:Language Langage(s) du contenu intellectuel de la ressource. Valeurs définies par la RFC 1766 qui comprend un code de langage à deux caractères (venant du standard ISO 639), avec éventuellement un code à deux lettres pour le pays (ISO 3166). -Relation Label:Relation Les relations de cette ressource avec d'autres ressources. Cet élément permet d'exprimer les relations formelles entre des ressources qui existent aussi en temps que ressources indépendantes. Par exemple, une édition d'une oeuvre (IsVersionOf), sa traduction (IsBasedOn), un chapitre d'un livre (IsPartOf), ou la traduction automatique de données en une image (IsFormatOf). Pour des raisons d'interopérabilité, ces relations devraient être choisies dans une liste standard de relations qui est en cours de définition.
-Couverture Label:Coverage Les caractéristiques spatiales et/ou temporelles de la ressource. La couverture spatiale fait référence à une région physique (eg. une partie du ciel); utilise des coordonnées (eg. longitude et latitude) ou des noms de lieux qui viennent d'une liste prédéfinie. La couverture temporelle est une date ou un lieu lié au contenu de la ressource plutôt qu'à sa date de création ou de disponibilité (ces dernières font partie de l'élément Date); utilise les mêmes formats de data/heure (souvent un intervalle), [Date et Time (basé sur ISO8601); note technique du W3C, que ceux recommandés pour l'élément Date, ou des périodes de temps appartenant à une liste contrôlée.
-Gestion des Droits Identifiant: Rights Définition: Un lien sur les droits de reproduction, les droits d'utilisation, ou à un service capable de fournir l'information sur les conditions d'accès à la ressource. Une définition formelle de droits est en cours. Utilisateurs et développeurs doivent comprendre que l'utilisation de cet élément est pour l'instant expérimentale. Si l'élément droit est absent, aucune hypothèse ne peut être faite sur l'état de ces droits, ou de tout autre, par rapport à la ressource.
Partie 3 3 avantages essentiels du recours au Dublin Core - Facilité d’archivage et de gestion des ressources : En tant que futurs documentalistes, nous sommes particulièrement sensibles au fait que le Dublin Core simplifie notamment la gestion des collections, des archives électroniques, ou encore des droits associés. - Facilité de recherche de l’information : Même les non-spécialistes peuvent créer des notices descriptives grâce à la simplicité des éléments du Dublin Core, facilitant ainsi les travaux de recherche pour une grande quantité de ressources. - Interopérabilité : Les échanges d’informations sont facilités par cet ensemble commun d'éléments dont la sémantique est universellement partagée, et qui est adaptable à des disciplines ou environnements différents (machines…).
3 inconvénients/problèmes possibles - Le Dublin Core reste un outil récent et encore insuffisamment utilisé - La simplicité du recours au Dublin Core pourrait en faire une norme de description qui resterait trop généraliste. - En évolution constante : La norme est encore à l’heure actuelle en constante évolution, ce qui peut poser problème quant à son utilisation.
Références Bibliographiques Dublin Core Metadata Initiative Guide d’utilisation du Dublin Core Cerhal-Marc-DC (PDF Université Grenoble) marc-dc.pdf Cours de M. Soufiane ROUISSI (« Métadonnées ») – IUT Bordeaux 3 Partie 4