Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parFolquet Jouve Modifié depuis plus de 10 années
1
Les métadonnées à la Bibliothèque nationale de France
Bibliothèques spécialisées de la Ville de Paris La numérisation en bibliothèque Initiation et sensibilisation 21 septembre 2004 Conception et animation : Emmanuelle Bermès Bibliothèque nationale de France, département de la bibliothèque numérique Les métadonnées à la Bibliothèque nationale de France Une vue d’ensemble Emmanuelle Bermès - Bibliothèque nationale de France Département de la bibliothèque numérique 13/05/2005 Emmanuelle Bermès
2
Préserver, administrer
PLAN Introduction Métadonnées : essai de définition Décrire, représenter Rôle des métadonnées descriptives L’identification Rôle des métadonnées de structure Préserver, administrer Différents types de métadonnées de préservation Lumière sur la gestion des droits METS : un format global Partager, diffuser Les métadonnées transformées : les interfaces, l’indexation Un protocole d’échange : l’OAI Conclusion Pour en savoir plus… Quelques ressources qui couvrent l’ensemble des sujets abordés dans cette présentation : - Anne R. Kenney, Oya Y. Rieger, Richard Entlich, Didacticiel d’imagerie numérique Bibliothèque de l'Université Cornell/Département de Recherches. En ligne : - A propos de la numérisation. Notions et conseils techniques élémentaires. Sous-direction des bibliothèques et de la documentation DES/B3. Edition imprimée décembre 1998, mise à jour novembre En ligne : 13/05/2005 Emmanuelle Bermès
3
Métadonnées : essai de définition (1)
Des données sur les données ... qui servent à organiser la connaissance et à utiliser et exploiter le document internes ou externes descriptives, contextuelles et structurelles initiales et ajoutées tout au long du cycle de vie qui servent à le maintenir accessible dans le temps et à garantir et contrôler cet accès administratives et techniques NB : certaines métadonnées sont communes aux deux types. 13/05/2005 Emmanuelle Bermès
4
Métadonnées : essai de définition (2)
les métadonnées ne s’appliquent pas à une donnée mais à un ensemble de données signifiant les métadonnées sont parfois comprises parmi les données de l’ensemble de données signifiant, parfois extérieures à lui les métadonnées sont des données, soumises aux même défis de production, gestion, conservation que les données elles-mêmes... 13/05/2005 Emmanuelle Bermès
5
Métadonnées : essai de définition (3)
La gestion d’un objet numérique complexe implique : une gestion complexe du descriptif (une ou plusieurs notices, descriptions à niveaux) une gestion complexe des aspects techniques (s’il y a différents formats de fichier par ex.) une gestion complexe des aspects administratifs (droits, suivi des évolutions du document, suivi des évolutions des métadonnées) une gestion complexe de sa structure physique (organisation des fichiers entre eux) une gestion complexe de sa structure logique (organisation des parties du contenu entre elles) C’est le rôle des métadonnées. 13/05/2005 Emmanuelle Bermès
6
Métadonnées : essai de définition (4)
Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux identifiant unique (localisation / identification) ? Définition : Une métadonnée est littéralement une donnée sur une donnée. Plus précisément, c'est un ensemble structuré d'informations décrivant une ressource quelconque. Contrairement à une idée reçue courante, les métadonnées ne décrivent pas nécessairement des documents électroniques. Elles ne sont pas forcément contenues dans le document. Les métadonnées descriptives sont les plus connues en bibliothèque. Elle correspondent au signalement bibliographique. Le catalogue est un ensemble de métadonnées descriptives. Il existe d ’autres types de métadonnées. * Métadonnées de structure : elles consistent à décrire la façon dont les fichiers épars qui constituent le document doivent s’agencer logiquement entre eux. * Métadonnées techniques : elles donnent toutes les informations nécessaires à la lecture des fichiers informatiques (formats, poids, taille, applications nécessaires) * Métadonnées de provenance : elles gèrent l’historique du fichier numérique en récapitulant ses différentes transformations * Métadonnées de gestion des droits : elles permettent de gérer les droits d ’accès aux documents. Les trois dernières forment un ensemble nommé métadonnées administratives et servent à gérer « l’entrepôt » ou magasin virtuel. L’identifiant joue un rôle capital, équivalent à celui de la cote. Il doit être unique et pérenne (correspondre à un seul document, sans risque de se répéter, ne jamais être supprimé ou remplacé). Pour en savoir plus… Sur les métadonnées descriptives, voir par exemple le dossier EducNet ou le diaporama des rencontres des professionnels de l’IST Sur les identifiants, voir C. Lupovici, « Le Digital Object Identifier » dans BBF 1998 – Paris, t. 43, n° 3, p , en ligne Métadonnées descriptives rattacher le document à l’original / différentes versions d’un document donner accès à la copie numérique / électronique Métadonnées de structure rattacher les fichiers entre eux reconstituer la structure du document Métadonnées administratives gérer la collection, c’est-à-dire gérer les droits d’accès préserver les informations techniques nécessaires à la lecture des fichiers garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications 13/05/2005 Emmanuelle Bermès
7
Préserver, administrer
PLAN Introduction Métadonnées : essai de définition Décrire, représenter Rôle des métadonnées descriptives L’identification Rôle des métadonnées de structure Préserver, administrer Différents types de métadonnées de préservation Lumière sur la gestion des droits METS : un format global Partager, diffuser Les métadonnées transformées : les interfaces, l’indexation Un protocole d’échange : l’OAI Conclusion Pour en savoir plus… Quelques ressources qui couvrent l’ensemble des sujets abordés dans cette présentation : - Anne R. Kenney, Oya Y. Rieger, Richard Entlich, Didacticiel d’imagerie numérique Bibliothèque de l'Université Cornell/Département de Recherches. En ligne : - A propos de la numérisation. Notions et conseils techniques élémentaires. Sous-direction des bibliothèques et de la documentation DES/B3. Edition imprimée décembre 1998, mise à jour novembre En ligne : 13/05/2005 Emmanuelle Bermès
8
Décrire, représenter Les métadonnées descriptives :
appréhender le contenu d’un objet description bibliographique approfondie et détaillée identifier un objet ou un groupe d’objets description bibliographique minimale identifiant pérenne identifier les parties qui composent un objet information de structure échanger des objets ou des descriptions d’objets description bibliographique dans un format normalisé 13/05/2005 Emmanuelle Bermès
9
Le rôle des métadonnées descriptives (1)
Dans le modèle OAIS : Information d’identification Identification interne Identification Globale description de la ressource Cote d'origine URL Auteur ID du fichier ISBN Titre Donne le moyen d’identifier le document 13/05/2005 Emmanuelle Bermès
10
Le rôle des métadonnées descriptives (2)
Une tradition dans les bibliothèques Le catalogage : création d’information descriptive secondaire (notice) qui caractérise une information primaire (document) Les métadonnées : des données (secondaires) sur les données (primaires) Caractéristiques du catalogage : un contenu normalisé : ISBD, AACR... Un format pour le traitement informatique : MARC (Machine readable cataloguing) une notice bibliographique c’est… une description d’un objet matériel des « points d’accès » pour retrouver le document une localisation pour se le procurer 13/05/2005 Emmanuelle Bermès
11
Le rôle des métadonnées descriptives (3)
Du catalogage aux métadonnées les métadonnées une description d’un objet matériel ou non, les métadonnées peuvent être dans le document lui-même multiplication des « points d’accès », information structurée une localisation : URL / URN / URI De nouveaux formats pour les notices : Dublin Core, EAD + formats dérivés de MARC en XML (MarcXML, MODS, BiblioML) nouveau : pour le contenu des documents eux-mêmes autrefois on n’entrait pas « dans » le document nouveaux besoins : OCR, tables des matières en saisie… nouveau formats : TEI 13/05/2005 Emmanuelle Bermès
12
L’identification (1) Problématique :
passer d’un nom de fichier à une URI objectifs de citabilité (pour les utilisateurs d ’une ressource) d’identification (pour les machines chargées de localiser une ressource sur un réseau) fonctionnalités des identifiants (URN) : unicité - pérennité - granularité - adaptabilité - extensibilité - indépendance - résolution 13/05/2005 Emmanuelle Bermès
13
L’identification (2) Les systèmes d’identification existants et normalisés sur le plan international : systèmes non spécifiques au Web : ISBN... spécifications du W3C : URI, URN, URL systèmes de nommage du monde de l’édition électronique : Handle, DOI systèmes de redirection : PURL, POI systèmes indépendants : ARK les propriétés de ARK spécificité : le « qualifier » 13/05/2005 Emmanuelle Bermès
14
Le rôle des métadonnées de structure (1)
Les métadonnées de structure : connaître tous les fichiers qui composent un document y compris les fichiers de différents formats (texte / image) y compris les fichiers de différentes natures (versions) connaître la relation physique entre ces fichiers ordre d’affichage fichier cible qui donne accès à l’ensemble ... connaître la relation logique entre ces fichiers délimitation de chapitres, de séries détail du contenu d’un fichier 13/05/2005 Emmanuelle Bermès
15
Le rôle des métadonnées de structure (2)
Collection Document (notice bibliographique) Vue de détail (article) Volume, tome, fascicule... Page Un document complexe peut avoir plusieurs niveaux d’accès ou niveaux de granularité Document simple : pas de problème de structure en soi, mais peut tout de même avoir plusieurs niveaux d’accès Les documents complexes se caractérisent par l’existence de différents niveaux de granularité. Une monographie, un périodique sont des documents complexes. Un document complexe a une structure physique et une structure logique. Par exemple pour un périodique : Structure physique : collection / volume / fascicule / page Structure logique : titre / année / n° / article L’enjeu est de rendre ces deux structures dont le recouvrement n’est pas toujours simple. Les métadonnées ont pour rôle de rendre la structure des documents complexes. La granularité reste néanmoins un problème pour l’accès : - donner accès à chaque niveau - décrire chaque niveau - visualiser chaque niveau. Pour les opérations techniques (numérisation, stockage des fichiers) on s’appuie sur la structure physique. Pour les opérations intellectuelles (description, indexation, accès), on s’appuie sur la structure logique. Dans Gallica : le granularité d’un périodique : titre / état de collection / fascicule / table des matières Vue de détail Lot (notice bibliographique) Collection Image (légende) 13/05/2005 Emmanuelle Bermès
16
Le rôle des métadonnées de structure (4)
Arborescence à gérer : Périodique Série Monogr. à Plusieurs Vol. (MPV) Document Multimédia multi-support (MMS) Ensemble Groupe d'Objets Volume Fascicule Cassette, disque, disque vinyle, planche de diapos, disquette, Page Fichier html Face d'un disque Objet Vue de détail (fichier image) Fichier texte Fichier vidéo Fichier audio Image (d'une planche de diapo, d'un fichier html) Fichier 13/05/2005 Emmanuelle Bermès
17
Préserver, administrer
PLAN Introduction Métadonnées : essai de définition Décrire, représenter Rôle des métadonnées descriptives L’identification Rôle des métadonnées de structure Préserver, administrer Différents types de métadonnées de préservation Lumière sur la gestion des droits METS : un format global Partager, diffuser Les métadonnées transformées : les interfaces, l’indexation Un protocole d’échange : l’OAI Conclusion Pour en savoir plus… Quelques ressources qui couvrent l’ensemble des sujets abordés dans cette présentation : - Anne R. Kenney, Oya Y. Rieger, Richard Entlich, Didacticiel d’imagerie numérique Bibliothèque de l'Université Cornell/Département de Recherches. En ligne : - A propos de la numérisation. Notions et conseils techniques élémentaires. Sous-direction des bibliothèques et de la documentation DES/B3. Edition imprimée décembre 1998, mise à jour novembre En ligne : 13/05/2005 Emmanuelle Bermès
18
Préserver, administrer
Les métadonnées administratives : métadonnées techniques pour la conservation (migration, émulation) pour la restitution (pour savoir comment visualiser ce qu’on a conservé) métadonnées de gestion des droits pour contrôler l’accès (droits d’auteur, confidentialité) pour contrôler l’usage (un fois qu’on a accédé au document, droit de l’imprimer, le copier, le modifier…) métadonnées de source et de provenance pour faire le lien avec un document source / original, analogique ou non pour conserver l’historique des modifications subies par l’objet numérique 13/05/2005 Emmanuelle Bermès
19
Métadonnées de préservation (1)
Dans le modèle OAIS : Information de Représentation Matériel Système d'exploitation Compilateur Interpréteur Format Application Microprocesseur Nom Nom Nom Nom Multimedia Version Version Version Version Périphérique Instruction 13/05/2005 Emmanuelle Bermès
20
Métadonnées de préservation (2)
Exemples de métadonnées techniques extraites automatiquement au niveau du fichier caractéristiques techniques communes : File path File name and extension Former file name File size File date and time MIME type File format File format version Target indicator caractéristiques techniques particulières : Image (récupérées à partir des en-têtes TIFF) Audio Video Texte Base de données Fichiers systèmes (exécutables) 13/05/2005 Emmanuelle Bermès
21
Gestion des droits (1) Les droits de propriété intellectuelle
le droit moral le droit patrimonial droit de reproduction droit de représentation autres : droits voisins, propriété industrielle Conséquences pour le document numérique / électronique sur la diffusion au public sur la reproduction à des fins de conservation 13/05/2005 Emmanuelle Bermès
22
Gestion des droits (2) Droits d’usage et droit d’accès
un contexte d’utilisation quel type d’utilisateur ? quelle application ? des permissions : trouver, voir, imprimer, copier, modifier, détruire des contraintes : qualité, quantité, prix... 13/05/2005 Emmanuelle Bermès
23
Gestion des droits (3) Gestion des droits Rights Declaration
Rights category Other category type Rights beginning date Application duration Rights end date Rights contractref Contract Type Origin Rights Holder RightsHolder Name RightsHolder Dates RightsHolder Responsibility Authority Record Reference RightsHolder Comments RightsHolder Contact Users Rights - Context (Utilisateurs concernés par la déclaration des droits) User type Permissions Constraints 13/05/2005 Emmanuelle Bermès
24
METS : un format global (1)
Metadata Encoding and Transmission Standard (METS) implémentation du modèle de référence OAIS (Open Archival Information System) schéma XML défini pour permettre la création d’un fichier de métadonnées contenant la description de la structure hiérarchique d’objets numériques constituant une ressource numérique répertoriant les noms et la localisation des fichiers correspondant à ces objets contenant toutes les métadonnées associées descriptives administratives (technique - source - droits - provenance) 13/05/2005 Emmanuelle Bermès
25
METS : un format global (2)
Conserver : METS permet de regrouper dans un seul fichier toutes les métadonnées d’un document des pointeurs vers des métadonnées qui décrivent le document et sont stockées ailleurs éventuellement, les fichiers qui composent le document Il réserve une place particulière aux métadonnées techniques et administratives, essentielles pour la conservation à long terme du document numérique Il préserve l’intégrité des documents complexes grâce à une carte de structure 13/05/2005 Emmanuelle Bermès
26
METS : un format global (3)
Donner accès grâce à un système élaboré de pointeurs, METS permet de relier entre eux les différents fichiers qui constituent un document, et de relier les métadonnées avec les fichiers qu’elles décrivent grâce à la carte de structure, METS permet de reconstruire la navigation dans le document, qu’elle soit linéaire ou logique METS est un schéma XML ; il est donc possible d’utiliser les technologies XML standard pour réaliser une interface de consultation à partir d’un fichier METS. 13/05/2005 Emmanuelle Bermès
27
METS : un format global (4)
Echanger METS est un standard ouvert basé sur XML S’appuyant sur des outils de collaboration (liste de discussion, exemples, METS implementation registry, partage d’outils…) De plus en plus adopté notamment dans les bibliothèques pour faciliter l’intéropérabilité, il s’appuie sur les METS application profiles 13/05/2005 Emmanuelle Bermès
28
METS : un format global (5)
7 sections : Header : informations sur le document METS Descriptive metadata Section : métadonnées descriptives externes ou encapsulées Administrative metadata Section : métadonnées techniques, droit, source, provenance File section : liste des fichiers composant l’objet Structural map : carte de structure, peut être logique ou physique, répétable Structural links : liens entre différents éléments de la carte de structure Behavior : association d’exécutables 13/05/2005 Emmanuelle Bermès
29
METS : un format global (6)
Les blocs de métadonnées de METS sont des « capsules », des enveloppes vides qu’on remplit avec un lien (pointeur) vers autre chose qu’on remplit avec des données dans un autre format Les formats complémentaires : principaux formats XML de métadonnées tout document en XML ou encodé en base 64 les schémas d’extension 13/05/2005 Emmanuelle Bermès
30
METS : un format global (7)
Le système de pointeurs : Mdref + xlink : permet de pointer vers un bloc de métadonnées stocké autre part DMDID, AMDID : on utilise des identifiants, appliqués à chaque bloc de métadonnées, pour relier les blocs entre eux fptr : file pointer, permet de pointer vers l’identifiant d’un fichier tel qu’on l’a donné dans la fileSec mptr : pointeur externe vers un autre fichier METS, permet d’articuler plusieurs documents METS entre eux area : élément de la carte de structure qui permet de pointer non vers un fichier, mais vers une partie d’un fichier 13/05/2005 Emmanuelle Bermès
31
METS : un format global (8)
Les relations entre les blocs de métadonnées : Mdref mptr AMDID DMDID fptr area 13/05/2005 Emmanuelle Bermès
32
Préserver, administrer
PLAN Introduction Métadonnées : essai de définition Décrire, représenter Rôle des métadonnées descriptives L’identification Rôle des métadonnées de structure Préserver, administrer Différents types de métadonnées de préservation Lumière sur la gestion des droits METS : un format global Partager, diffuser Les métadonnées transformées : les interfaces, l’indexation Un protocole d’échange : l’OAI Conclusion Pour en savoir plus… Quelques ressources qui couvrent l’ensemble des sujets abordés dans cette présentation : - Anne R. Kenney, Oya Y. Rieger, Richard Entlich, Didacticiel d’imagerie numérique Bibliothèque de l'Université Cornell/Département de Recherches. En ligne : - A propos de la numérisation. Notions et conseils techniques élémentaires. Sous-direction des bibliothèques et de la documentation DES/B3. Edition imprimée décembre 1998, mise à jour novembre En ligne : 13/05/2005 Emmanuelle Bermès
33
Les interfaces et l’indexation (1)
Les métadonnées descriptives servent à... Trouver : dans le catalogue de bibliothèque adapté pour la recherche avancée accès intégré à l’offre de la bibliothèque (numérique/analogique : bibliothèque hybride) avec un moteur de recherche recherche simple conforme aux habitudes du web recherche fine (mots-notice, tables et index en mode texte) recherche plein texte (au-delà des seules métadonnées descriptives) 13/05/2005 Emmanuelle Bermès
34
Les interfaces et l’indexation (2)
Les métadonnées descriptives servent à... Indexer : Les moteurs de recherche les utilisent pour indexer les documents veiller à l’accessibilité des données leur structuration leur pérennité (identifiants) 13/05/2005 Emmanuelle Bermès
35
Les interfaces et l’indexation (3)
Les métadonnées descriptives servent à... Découvrir : l’accès intuitif la navigation par listes liste d ’auteurs liste de titres l’utilisation des classifications (Dewey) par époques par types de documents par thèmes … vers les classifications « à facettes » ? 13/05/2005 Emmanuelle Bermès
36
Les interfaces et l’indexation (4)
Les métadonnées de structure servent à... se repérer dans un document complexe avoir une vue d’ensemble du contenu accéder à un niveau de granularité plus fin Quelques pistes : la pagination (carte de structure physique) la table des matières (carte de structure logique) les vignettes 13/05/2005 Emmanuelle Bermès
37
Un protocole d’échange : l’OAI (1)
Plusieurs objectifs : mettre en place des collections numériques partagées en France : les pôles associés avec des bibliothèques étrangères (projets thématiques) améliorer la visibilité des ressources de la BnF sur le Web dans des portails documentaires (Sudoc) à travers des SP généralistes (OAIster) à travers les moteurs de recherche (Yahoo) améliorer la cohérence de l’offre de ressources numériques de la BnF en interne utilisation de l’OAI pour créer un moteur de recherche fédéré sur l’ensemble des ressources voir ex. de la BN d’Australie 13/05/2005 Emmanuelle Bermès
38
Un protocole d’échange : l’OAI (2)
Un protocole simple et ouvert : utilise des technologies ouvertes qui sont des standards reconnus sur le Web protocole HTTP langage XML offre une grande liberté d’application indépendant des logiciels et des plateformes développement simple et rapide ou approfondi et complexe et une grande simplicité de mise en œuvre pas de modification des structures existantes, ce n’est qu’une « couche » rajoutée au dessus de l’architecture de l’archive 13/05/2005 Emmanuelle Bermès
39
Un protocole d’échange : l’OAI (3)
Un protocole largement répandu ... dans les archives ouvertes, dans les institutions patrimoniales et culturelles dans le domaine de la recherche d’information sur le Web moteurs de recherche (Yahoo, Google) portails documentaires (OAIster, ARC, portails de bibliothèques) 13/05/2005 Emmanuelle Bermès
40
Un protocole d’échange : l’OAI (4)
Un protocole qui répond aux questions que se posent aujourd’hui les institutions... comment diffuser largement et de manière ouverte, tout en gardant le contrôle sur mes données ? Si je travaille en partenariat et en complémentarité avec d’autres acteurs, comment maintenir mon image et mes flux d’utilisateurs ? Comment donner accès de manière simple (et transparente pour mes utilisateurs) à un nombre croissant de ressources, néanmoins choisies et validées ? Comment gérer l’évolution rapide de mes ressources, et de celles de mes partenaires, sans bouleverser sans cesse mon architecture et mes données ? 13/05/2005 Emmanuelle Bermès
41
Un protocole d’échange : l’OAI (5)
La création des métadonnées récupération des notices du catalogue transformation en Dublin Core automatisée avec des tables de conversion concertation avec les partenaires pour garantir l’homogénéité des données descriptives sur le réseau 13/05/2005 Emmanuelle Bermès
42
Un protocole d’échange : l’OAI (6)
Organisation de la collection dans l’entrepôt pour faciliter le moissonnage sélectif Création d’ensembles (sets) pour trier les notices par type de documents (monographies, manuscrits, cartes et plans …) par dossiers thématiques (=sélection de documents), fonds documentaires (=ensembles cohérents) avec la classification Dewey pour permettre une sélection par thèmes Possibilité d’organiser la collection de manière hiérarchique 13/05/2005 Emmanuelle Bermès
43
Un protocole d’échange : l’OAI (7)
L’entrepôt de la BnF aujourd’hui… environ notices au format DC simple 64 ensembles thématiques ou collections décrites en DC monographies, 1300 cartes et plans, 2500 manuscrits et ouvrages de la réserve 13/05/2005 Emmanuelle Bermès
44
Métadonnées descriptives : catalogue
Conclusion internautes Accès WEB Visualisation Traitement Entrepôt OAI métadonnées en DC Structure physique Tables des matières notices Stockage des documents Stockage Métadonnées descriptives : catalogue Métadonnées en METS Système d’archivage Production prestataires extraction automatique catalogueurs 13/05/2005 Emmanuelle Bermès
45
Conclusion Enjeux des métadonnées : Les difficultés : entraîne :
mettre en place des outils appliquer des normes produire, traiter, maintenir les métadonnées entraîne : les coûts l’organisation Les avantages : visibilité préservation possibilité d’évolution entraîne : gain de temps et de qualité pour la préservation on ne peut pas en faire l’économie 13/05/2005 Emmanuelle Bermès
46
Conclusion Pour les bibliothèques, les métadonnées impliquent
une évolution des besoins plus seulement des métadonnées descriptives gestion de documents structurés ou à structurer (XML) une évolution des compétences métier augmentation des compétences techniques gérer les compétences documentaires dans un environnement nouveau un défi continuer à remplir les missions de conservation et de communication dans un environnement nouveau collaborer avec d’autres acteurs que les bibliothèques 13/05/2005 Emmanuelle Bermès
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.