La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Récupération de notices et interopérabilité des catalogues Les étapes techniques dune récupération de notices.

Présentations similaires


Présentation au sujet: "Récupération de notices et interopérabilité des catalogues Les étapes techniques dune récupération de notices."— Transcription de la présentation:

1 Récupération de notices et interopérabilité des catalogues Les étapes techniques dune récupération de notices

2 Contexte et enjeux

3 La coopération entre les bibliothèques : une vieille histoire. Linteropérabilité des catalogues vise dabord léchange de données. - facilite la production des informations - facilite léchange dinformations - facilite la circulation des documents eux-mêmes On discerne déjà la nécessité de pratiques harmonisées entre les bibliothèques avec lutilisation de - normes - formats - protocoles Tous très richement documentés ! Motivées par des nécessités économiques (baisse des coûts de production). Les nombreux efforts de normalisation en sont la conséquence.

4 Normes en vigueur dans les bibliothèques pour la description bibliographique : Z Catalogage des monographies - texte imprimé Z Catalogage des ressources continues Z Catalogage des monographies anciennes Z Catalogage des vidéogrammes Z Catalogage des enregistrements sonores Z Catalogage des documents cartographique Z Catalogage de la musique imprimée Z Catalogage des images fixes Z Catalogage des parties composantes Z Catalogage des ressources électroniques Z Catalogage des monographies - texte imprimé (description allégée ) Z Catalogage - Choix des accès à la description bibliographique Z Catalogage dauteurs et danonymes : forme et structure des vedettes de collectivités auteurs Z Catalogage dauteurs et danonymes : Forme et structure des vedettes noms de personne, des vedettes titres, des rubriques de classement et des titres forgés Z Catalogage - Forme et structure des vedettes titres musicaux Z Z Catalogage - Forme et structure des vedettes : Noms géographiques Z Documentation - Indexation analytique par matières Z Documentation - Références bibliographiques : contenu, forme et structure

5 Formats utilisés en bibliothèque : MARC (MARC 21, UNIMARC) Mais aussi DublinCore (format normalisé!), XML Protocoles utilisés en bibliothèque : Par exemple pour léchange de données : Z39-50, SRU/SRW ; WAIS(Wide area information service), FTP (File transfert protocol)

6 Linteropérabilité, quest-ce que cest ? « L interopérabilité est la capacité que possède un produit ou un système, dont les interfaces sont intégralement connues, à fonctionner avec d'autres produits ou systèmes existants ou futurs et ce sans restriction d'accès ou de mise en œuvre. » (AFUL) vs compatibilitéinteropérabilité Cela nécessite une grande transparence sur les mécanismes ou les formats employés…

7 Lintéropérabilité en trois mouvements Elle met en jeu trois niveaux techniques complémentaires (1) : 1. Une description des ressources avec une sémantique commune 2. Un contexte générique dimplémentation des descriptions dans des langages structurés standardisés, interprétables par des machines 3. Des protocoles informatiques déchange de ces données normalisées (1)Abderrazak Mkadmi, Imad Saleh, Bibliothèque numérique et recherche dinformations

8 MARC (< Z44-050) ISO 2709 WAIS, FTP, Z39.50 DublinCore, MarcXML, MODS EAD LOM (Learning Object Metadata) SCORM XML URL RDF (Resource Description and Framework) http OAI-PMH SRU/SRW Standards traditionnels Standards plus récents

9 Schéma global dun SID SIGB OPAC Fournisseurs de notices MARC BnF, ABES, Electre, Zebris, … Autres catalogues de bibliothèques import Z SRU Entrepôt OAI-PMH moissonnage « ingest » Sources « hétérogènes » connecteurs API

10 La fourniture de notices : le paysage en France

11 NomType de documentNombre de noticesConditions de fournitureAutres formats proposés ABESTous supports + autorités9 millions, 2 millionsMembres du réseau SUDOCMarc21, formats tabulés,XML ADAVImages animées Clients de la société sur la base d'une commande de produits BnFTous supports + autorités10 millions, 2 millionsInscription nécessaire CD MailCD audio Fourniture comprise dans le cadre de la vente de CD COLACODVD, CD-ROMS, VHS40.000Fourniture comprise dans le cadre de la vente de CD CVSCD audio, MP3, DVD, CD-ROM, DVD-ROM + RE Fourniture comprise dans le cadre de la vente de produits USMARC, XML DAWSON FranceLivres, e-books, CD audio et DVD 9.6 millions de titresFourniture comprise dans le cadre de la vente de produits Marc21 DECITRELivres Clients ELECTRELivres, CD audio, CD-ROM, Périodiques (monographies) 1.2 millionsDans le cadre dun abonnementMarc21, Onix, XML, CSV, DBase III GAMDocuments sonores Fourniture comprise dans le cadre de la vente de produits INDEXPRESSEArticles de périodiquesDépouillement de 198 titresAbonnement « à la carte » ISSNPublications en série1.5 millionsAbonnement annuelMarc21, ISSN-MARC MOCCAMTous supports + autoritésBnF + Amazon (isbn)Gratuite sans conditionA la demande + tabulé OCLC BVTous supports175 millionsPayantMarc21, MAB, DC, Onix, XML Sciences Po ParisArticles de périodiques Gratuit sur la base dune coopération XML TITE-LIVELivres – musique Gratuite mais licence dutilisation TXT, XML, Onix VHSImages animées Fourniture accompagnant la vente ZEBRISLivresBnf (<1990) + DecitreAbonnement annuel

12 Sélection sur les réservoirs de notices en ligne (en France): BnFBnF [http://catalogue.bnf.fr] Gratuit Paquets de 500 notices maximum format UNIMARC : oui + InterMARC modalités : récupération par FTP, immédiate ou en différé (24 h) Origine des notices : Bibliothèque nationale de France MoCCAM en ligneMoCCAM en ligne [http://www.moccam-en-ligne.fr/] Gratuit format UNIMARC : oui modalités : récupération immédiate Origine des notices : BnF et Amazon pour les références qui ne figureraient pas encore dans BN-OPALE- PLUS ZEBRISZEBRIS [http://www.zebris.fr] Payant : de 1250 à 3100 HT en fonction de la taille du client (infos : 2008) format UNIMARC : oui modalités : récupération d'un panier Origine des notices : Indexpresse ELECTREELECTRE [http://www.electre.com] Payant : abonnement annuel (calcul du tarif selon le nombre de licences) format UNIMARC : oui modalités : récupération immédiate Origine des notices : electre.com Attention : les mentions légales relatives à l'utilisation de ces notices sont particulières à chaque institution ou entreprise ! Pour plus d'information, voir le site de l'ADBDP et le site du CfUsite de l'ADBDPCfU

13 Constitution de lots de notices : 2 exemples

14 Catalogue de la BnF

15

16

17

18

19

20 electre.com

21

22

23

24

25

26 La récupération de données par fichier(s) de notice(s)

27 ISO 2709:2008 ( indice de classement Z ) Révision de 2008 avec lintégration des caractères codés sur plusieurs octets Format déchange pour linformation Appareil normatif (1) ISO/CEI 646 ~ ASCII ISO/CEI Jeu de caractères latins suffisants pour langlais moderne (7bits-128 caractères) UTF-n : UCS (Universal Character Set) Transformation Format. Jeu de caractères codés sur plusieurs octets Cf UNICODE vise à donner à tout caractère de nimporte quel système décriture un nom et un identifiant numérique de manière unifiée, quelle que soit la plateforme informatique utilisée. ISO/IEC 6429:1992 Technologies de l'information. Fonctions de commande pour les jeux de caractères codés Références normatives

28 NF ISO 25577:2009 (Z47-302) « MarcXchange » Références normatives ISO 2709:2008 (Z ) ISO/CEI 646 ~ ASCII ISO/CEI Jeu de caractères latins suffisants pour langlais moderne (7bits-128 caractères) UTF-n : UCS (Universal Character Set) Transformation Format. Jeu de caractères codés sur plusieurs octets MarcXchange est étroitement lié à ISO 2709 : En 2001, la LOC élabore un cadre pour traiter les données MARC dans un environnement XML : MARCXML, qui « permet une conversion réversible et sans perte dune notice MARC21 » en XML. MarcXchange est une version généralisée de MARCXML pour représenter tout format existant sur ISO Appareil normatif (2) Format généralisé déchange de notices bibliographiques (et autres types de métadonnées) fondé sur XML

29 ANSI/NISO Z ( ISO 23950:1998) Protocole déchange pour une utilisation bibliographique qui régit le « dialogue » entre clients et serveurs, décrit et utilisé aux États-unis à partir de La norme date de 1988, provient du « New York Item » ; maintenue par la Bibliothèque du Congrès avec la « Z39.50 Maintenance Agency ». SRU Search/Retrieve via URL Créé et maintenu par la Bibliothèque du Congrès, permet dinterroger via le protocole http des bases de données de bibliothèques « invisibles »,ou « prisonnières » des OPAC et des systèmes dinformation. Protocoles en vigueur dans les bibliothèques pour linteropérabilité ANS1 : Abstract Notation Syntax 1 (ISO 8824) Un langage de description de données indépendant des matériels et logiciels permettant de codes des messages entre clients et serveurs BER : Basic Encoding Rules (ISO 8825) Des règles de conversion de syntaxes abstraites en une syntaxe spécifique de transfert de données

30 Léchange de données en iso2709 Une notice enregistrée au format ISO 2709 présente le schéma suivant : Voir aussi :

31 XML par la pratique [Texte imprimé] : bases indispensables, concepts et cas pratiques / [Sébastien Lecomte]. - Nantes : Éd. ENI, cop vol. (353 p.) : ill., couv. ill. ; 21 cm. - (Ressources informatiques, ISSN ). Index ISBN (br.) : 27,14 EUR. - EAN Exemple de notice : de lisbd à iso nam i ­a ­bBr.­d27.14 EUR- ­a d2008 m |0fre|01 ||||ba-0 ­afre- ­aFR- ­aa 0||y|-1 ­aXML par la pratique­ebases indispensables, concepts et cas pratiques­fSÂebastien Lecomte- ­a2e Âed.- ­aNantes­cENI­ d2008- ­a ­a353 p.­cillustrations en noir et blanc­d22 x 18 cm-2 ­aRessources informatiques­x ­aPrÂesentation des concepts fondamentaux de XML au travers de cas pratiques Áa implÂementer. Aborde notamment la syntaxe du langage XML, montre comment concevoir des documents et des grammaires XML simples, comment lier des documents XML entre eux, et comment mettre en forme des documents XML.- ­aTous niveaux- ­b ­ ­tRessources informatiques­x ­aXML (langage de balisage)-0 ­aInternet­alangage de programmation­astructure de donnÂees ­adocument multimÂedia- ­a005.3­v99- ­a004­v99a- 1­ ­aLecomte­bSÂebastien­ ­aFR­bElectre­c ­gAFNOR- ­ ­aExtendible markup language­ ­aExtensible markup language- ­aTous niveaux- ­aTechniques Informatique- ­ aLivres pratiques Autoformation- ­c Label Répertoire Zones Séparateur de notices (invisible)

32 le LABEL (taille fixe : 24 octets) Si on décompose le label de la notice de la façon indiquée, on a 8 "groupes" d'information nam1· i·450· Ce qui nous donne : nam am i · 450 · nombre doctets!

33 le répertoire (taille variable) Le répertoire comprend les éléments suivants : a/ une étiquette (=3 octets) b/ une longueur de zone qui correspond à la position 20 du label (=4 octets) c/ la position du premier caractère qui correspond à la position 21 du label (=5 octets) d/ longueur de la partie relative à l'application qui correspond à la position 22 du label (=0 octet) b+c+d= « 450 » du label UNIMARC Si on lit le répertoire de notre notice en suivant la fréquence de 3/4/5/0 octets :

34 … on obtient :

35 XML par la pratique [Texte imprimé] : bases indispensables, concepts et cas pratiques / [Sébastien Lecomte]. - Nantes : Éd. ENI, cop vol. (353 p.) : ill., couv. ill. ; 21 cm. - (Ressources informatiques, ISSN ). Index ISBN (br.) : 27,14 EUR. - EAN

36 01510nam i ­a ­bBr.­d27.14 EUR- ­a d2008 m |0fre|01 ||||ba-0 ­afre- ­aFR- ­aa 0||y|-1 ­aXML par la pratique­ebases indispensables, concepts et cas pratiques­fSÂebastien Lecomte- ­a2e Âed.- ­aNantes­cENI­ d2008- ­a ­a353 p.­cillustrations en noir et blanc­d22 x 18 cm-2 ­aRessources informatiques­x ­aPrÂesentation des concepts fondamentaux de XML au travers de cas pratiques Áa implÂementer. Aborde notamment la syntaxe du langage XML, montre comment concevoir des documents et des grammaires XML simples, comment lier des documents XML entre eux, et comment mettre en forme des documents XML.- ­aTous niveaux- ­b ­ ­tRessources informatiques­x ­aXML (langage de balisage)-0 ­aInternet­alangage de programmation­astructure de donnÂees ­adocument multimÂedia- ­a005.3­v99- ­a004­v99a- 1­ ­aLecomte­bSÂebastien­ ­aFR­bElectre­c ­gAFNOR- ­ ­aExtendible markup language­ ­aExtensible markup language- ­aTous niveaux- ­aTechniques Informatique- ­ aLivres pratiques Autoformation- ­c27.14-

37 |-1 ­aXML par la pratique­ebases indispensables, concepts et cas pratiques­ fSÂebastien Lecomte- Etiquette 200 La zone comporte (00)93 octets Elle commence à la position (00)

38 Le précédent contrôle appliqué par le répertoire ISO 2709 nexiste pas avec MarcXchange (absent du format), il faut le créer via lapplicatif, et le recalculer à chaque conversion vers ISO 2709… MarcXchange : exemple 01510nam i 450 […] XML par la pratique bases indispensables, concepts et cas pratiques SÂebastien Lecomte […] Le label des notices est traité comme un simple chaîne

39 MarcXchange : structure du schéma collection record subfield datafieldcontrolfieldleader id id, format, type id tag id, ind1,… ind8 tag id code Élément de plus haut niveau Élément racine : début de la notice Label de la notice de lISO 2709 (24 octets) Elément de contrôle Zone de lidentifiant De lISO 2709 Déclaration des zones Structure hiérarchique attribut obligatoire attribut facultatif Déclaration des Sous-zones

40 MarcXchange Cadre délaboration général pour des schémas « locaux » MARC 21 et UNIMARC sont reconnus comme des schémas locaux, mais nécessitent tout de même des adaptations locales pour la mise en œuvre de MarcXchange. Assure la compatibilité de schémas locaux simples, sans perte dinformations (ou un minimum de pertes qui peuvent être répertoriées). Schéma conçu de façon à contenir des données MARC Peut servir à léchange de notices MARC ou de « moyen de transport » pour faire migrer des notices au format natif MARC vers DublinCore.

41 MarcXchange Usages majeurs Représenter une notice MARC en XML Décrire une ressource en XML Échanger des notices MARC en XML Transférer des notices MARC via des services en ligne (par exemple SRU) Transmettre des données à un éditeur Utiliser un format temporaire qui permet toute forme de transformation : conversion, publication, édition, validation Par exemple, une notice peut entrer dans un « Workflow » (cycle de vie du document) au format XML, dans une application de gestion, puis être « verrouillée » et stockée à nouveau dans un format MARC.

42 Outils disponibles pour les administrateurs Il existe un ensemble doutils, le plus souvent libres dutilisation, disponibles sur le site de la Bibliothèque du Congrès. Ils sont orientés pour la gestion de notices MARC21, mais certains peuvent être utilisés pour UNIMARC. AGent Arabic Translitrator - Free / Open Source Athenaeum MARC Utility Aurora ZMarc Collector BIBLIObase BookWhere Cataloging Calculator - Free CyberTools for Libraries DK's INDscripteR - Indic Script Converter eZcat/eZcat Pro FRBR Display Tool -Free InfoWorks Link Checker InfoWorks Spelling Checker for Database Maintenance MARC Magician MARC Report MARC RTP - Free MARC Toolkit for Libraries (formerly MARC Template Library) - Free MARCBreaker - Free MarcEdit - Free MARConvert. MarciveWeb SELECT MARCMaker - Free MARC/Perl - Free MARCView MicroLIF Conversion Tool - Free NOTEbookS OCLC, Online Computer Library Center, Inc. Surpass Copycat USEMARCON Plus - The Universal MARC Record Convertor - Free Visual MARC Editor Web & XML Tools MARC4J - Free MarcEdit - Free MARC to XML / XML to MARC Conversion Utilities - Free MARCXGen - Free MARCXML - Free MarcXml Converter - Free XMARC - Free ZMARCO - Free

43 MarcEdit : Utilitaire qui permet de lire des fichiers et bien plus : - d'extraire une notice à partir d'un fichier de notices - de joindre des fichiers MARC - d'ajouter un champ - d'éclater un format MARC dans un schéma DC ou XML - d'effacer un champ - de fabriquer un fichier MARC MarcView Utilitaire qui permet de lire des fichiers ISO 2709 et de voir les notices MARC contenues Exemples dutilitaires Un prestataire de plate-forme de gestion de bibliothèque doit livrer un utilitaire ou un moyen de conversion pour permettre deffectuer des vérifications après un import de notices

44 Questions liées à lenvironnement En cas de problème lors dune récupération, il faut dabord dresser une cartographie des outils mis en œuvre et de lenvironnement informatique OS : UNIX/Windows ? Le caractère de contrôle CR nest pas traité de la même façon (apparition de ^M en fin de ligne) Encodage du fichier source : ASCII Latin étendu (iso / / ) ISO 5426 UTF-8 ANSI Windows 1252 Little/Big Endian ? Encodage du système cible : divers encodages proposés Oracle 9i, 9.2.0, 10g, 11g, … MySQL , 5.0 Version de la base de données du système cible : Le processus dimport doit prendre en compte ces variétés dencodages et de versions

45 Tableau de gestion du format ISO-5426Liste des caractères gérés par ISO ! " # $ % & ' ( ) * +, -. / : ; A B C D E 70 F G H I J K L M N O 80 P Q R S T U V W X Y 90 Z [ \ ] ^ _ ` a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ~ ƒ … ˆ Š Œ Ž ' – ˜ š œ ž Ÿ ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ­ ® ¯ ° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿ À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß à á â ã ä å æ ç è é ê ë ì í î ï ð ñ ò ó ô õ ö ÷ ø ù úûüýþÿ 256 caractères hexadécimaux ( A B C D E F) Pour convertir un octet, on le partage en 2 groupes de 4 bits, qui correspondent chacun à un chiffre hexadécimal Encodage encore très utilisé

46 Un import pas à pas Un processus dimport peut se déclencher manuellement, mais sur les systèmes plus volumineux, il est lancé de façon programmée par un « cron », qui charge un script. Décodage du fichier ISO 27.09, selon la séquence label-répertoire-zones-séparateur Loutil dimport prépare la possibilité : - dinsérer la notice décodée [INSERT]; - de « recouvrir la notice décodée[UPDATE] - de protéger éventuellement des zones en fonction de règles inscrites dans les outils de paramétrage de limport [no_update] ; - de rejeter la notice décodée. Le décodage du fichier iso 2709 ne suffit pas dans certains cas (cest le cas pour les imports SUDOC). La plupart du temps, le décodeur iso 2709 est étendu à laide dun handler, qui permet un traitement à partir dune analyse des données. La première étape consiste à créer des notices au format XML pour les fournir à loutil dimport qui va se charger du traitement des données.

47 Fichier(s)DécodeurOutil dimport crée un fichier dimport Analyseur modèle BDD XML insert update recherche Assigne des attributs Lit le fichier iso 2709 et prépare les élements XML Interroge successivement la base et applique des traitements prévus par les handlers

48 Le modèle est un fichier ayant une structure déléments identiques à la source XML à importer, mais chaque élément est assorti dattributs qui précisent comment gérer les champs […] Il peut ajouter par exemple des champs de gestion en fonction du décodage du label pour traiter : -le type de document -le type de support -le scénario à adopter en fonction du type de document -Le filtrage des zones : Autorité éditeur - 4XX autorité collection - 6XX autorité matière - 7XX autorité auteur (…) Un modèle existe pour les tables suivantes : AUTEUR COLLECTION COLLECTIVITE EDITEUR FOURNISSEUR MATIERE TITRE_UNIFORME UNIMARC Par exemple le modèle UNIMARC peut convoquer dautres modèles à lintérieur de son schéma pour traiter des zones particulières qui vont devenir des liens avec dautres tables …

49 Lanalyseur va fournir des éléments déduits à partir de lobservation précise de séquences du label # Paramètres de decodeDocumentType documenttype.label.pos67.aa=monographie documenttype.label.pos67.ac=monographie documenttype.label.pos67.am=monographie documenttype.label.pos67.as=periodique documenttype.label.pos67.bm=monographie documenttype.label.pos67.cm=monographie documenttype.label.pos67.cs=periodique documenttype.label.pos67.dm=monographie documenttype.label.pos67.em=monographie documenttype.label.pos67.es=periodique documenttype.label.pos67.fm=monographie documenttype.label.pos67.ga=audiovisuel documenttype.label.pos67.gc=audiovisuel documenttype.label.pos67.gm=audiovisuel documenttype.label.pos67.gs=audiovisuel documenttype.label.pos67.im=monographie documenttype.label.pos67.is=monographie documenttype.label.pos67.jm=monographie documenttype.label.pos67.js=periodique documenttype.label.pos67.km=monographie documenttype.label.pos67.lm=document_electronique documenttype.label.pos67.ls=document_electronique documenttype.label.pos67.mc=monographie documenttype.label.pos67.mm=monographie documenttype.label.pos67.ms=monographie documenttype.label.pos67.rm=monographie Ex. type de document Aller-retour permanent entre la base de données locale et le fichier dimport qui permet par exemple la confrontation avec une liste de supports interne à lapplication Attribution dun nouvel identifiant (clé primaire) si la notice nexiste pas déjà dans la base Validation du schéma MARC pour effectuer soit un INSERT, un UPDATE ou un REJET

50 Méthode de dédoublonnage possible Concaténation déléments puisés dans les balises XML pour créer un « identifiant » qui va servir au dédoublonnage : ALBERT CAMUSGRENIER, ROGER, GALLIMARD SOLEIL ET OMBRE Réindexation des notices importées pour les positionner au même niveau que les notices existantes. Gestion des traces des opérations effectuées dans un fichier de logs :12:53 23 notices insérées dans la table 'MATIERE' (source 'default') :12:53 12 notices insérées dans la table 'COLLECTION' (source 'default') :12:53 36 notices insérées dans la table 'UNIMARC' (source 'default') :12:53 26 notices insérées dans la table 'AUTEUR' (source 'default') :12:53 2 notices insérées dans la table 'EDITEUR' (source 'default') :12:53 9 notices insérées dans la table 'COLLECTIVITE' (source 'default') :12:53 16 notices mises à jour dans la table 'UNIMARC' (source 'default') :12: notices autorités trouvées dans la table 'MATIERE' (source 'default') :12:53 17 notices autorités trouvées dans la table 'COLLECTION' (source 'default') :12:53 30 notices autorités trouvées dans la table 'AUTEUR' (source 'default') :12:53 69 notices autorités trouvées dans la table 'EDITEUR' (source 'default') :12:53 25 notices autorités trouvées dans la table 'COLLECTIVITE' (source 'default') Les opérations au niveau de limport lui-même sont transparentes pour lutilisateur. Seuls doivent être paramétrés (éventuellement) le modèle et le décodeur. Il appartient à ladministrateur de pouvoir comparer un fichier source et une notice importée dans sa plateforme. Les opérations dinsertion, dupdate, de réindexation renvoient à la gestion de lapplicatif, ce qui dépasse de loin le processus dimport

51 Un autre dispositif asynchrone : OAI-PMH

52 OAI-PMH Définition : OAI - PMH Open Archive Initiative Protocol for Metadata Harvesting Mvt 1 de linteropérabiblité : aspect « normatif » : empilement structuré des données Mvt 3 de linteropérabilité : le protocole déchange Mvt 2 de linteropérabiblité : XML DublinCore

53 Un peu de vocabulaire… Ressource (resource) : cest le document qui est décrit par un appareil bibliographique (la réalité à laquelle la description renvoie, une monographie imprimée, un document électronique…) Item : cest la notice informatique qui contient la description. Cette notice se voit attribuer un identifiant unique supplémentaire, totalement indépendant de celui du système hérité. Enregistrement (record): ce sont une partie des métadonnées de litem qui sont choisies et « poussées » dans un fichier XML qui deviennent un enregistrement. OAI-PMH ne travaille pas avec la totalité des données, mais un jeu allégé. Lot (set) : cest un possibilité dOAI-PMH pour constituer des ensembles thématiques ou autres (par exemple ; les thèses dun établissent dans un format donné et pour une période donnée).

54 ##$a $bBr.$d27, #1$a par la pratique$bTexte imprimé$ebases indispensables, concepts et cas pratiques$f[Sébastien Lecomte] 210 ##$aNantes$cÉd. ENI$dcop ##$a1 vol. (353 p.)$cill., couv. ill. en coul.$d22 cm 225 informatiques$fJoe ̈ lle Musset$x ##$aIndex 410 ##$aRessources informatiques (Nantes), ISSN ##$aXML (langage de balisage)$2 rameau 606 ##$aEchange électronique d'information$2rameau 676 ##$a006.74$v22$zeng 700 #1$aLecomte, Sébastien ( ; informaticien)$4070 Métadonnées sur la ressource Xml par la pratique : bases indispensables, concepts et cas pratiques Sébastien Lecomte Monographie imprimée … oai:1380

55 Principe général Base 1 (spécificités internes) Base 2 (spécificités internes) Base 3 (spécificités internes) Base 4 (spécificités internes) Entrepôt commun Création denregistreme nts en DC Pour lusager : formulation dune requête unique ? Spécificité commune

56 Conclusion

57 La stratégie de catalogage qui repose sur la récupération de notices représente une économie d'échelle, un gain, mais impose des contraintes techniques importantes. Elle nécessite une technicité importante : une ou plusieurs ressource(s) humaine(s) à l'aise dans la manipulation de données informatiques... - dédoublonnage, nettoyage de la base - paramétrage (métier) des outils d'import, - vérification de la cohérence de la base (si les réservoirs sont disparates, il faut harmoniser), - connaissance des formats à bas niveau (ex. décodage du label), - traitement des autorités, - connaissance du fonctionnement des index.... mais aussi une expertise métier plus importante, des catalogueurs plus qualifiés dans des opérations particulières :

58 Récupération de notices et interopérabilité des catalogues Merci de votre attention !


Télécharger ppt "Récupération de notices et interopérabilité des catalogues Les étapes techniques dune récupération de notices."

Présentations similaires


Annonces Google