Focus sur quelques formats bibliographiques : TEI, EAD, METS

Slides:



Advertisements
Présentations similaires
Définitions Analyse documentaire
Advertisements

HTML Abda Anne Plan Présentation Structure Texte Listes Images Liens Tableaux Formulaires.
Introduction aux Web Services Partie 1. Technologies XML
Transformation de documents XML
DTD Sylvain Salvati
JXDVDTEK – Une DVDthèque en Java et XML
Educasources Paris, le 30 janvier 2007 Paris, le 30 janvier 2007.
XHTML EXtensible HyperText Markup Language. HTML et XML HTML (HyperText Markup Language) et XML (eXtensible Markup Language) sont deux spécifications.
le langage les éléments
Traduction française des formats UNIMARC
Domaines nominaux XSLT
Nicolas Singer Maître de conférence, université Champollion
Format dannotations génériques, multi-annotations, multi- documents Présentation ASP navigation 11 avril 2002.
version Beta Marie Calberg Ninni Louhelainen SLFN7
MIKHAYLOVA Vera Exposé Java principe de fonctionnement Lundi 17 mai 2004 DEUG 1ère année Science du langage Paris III.
TP 3-4 BD21.
Manipulation d’XML avec XSL
Métadonnées pour les thèses numériques françaises
Introduction à la POO: Les classes vs les objets
CREATION DE FEUILLE DE STYLE pour structuré le document XML
La mise en place du Règlement sur la diffusion de linformation Un travail déquipe.
Initiation au système d’information et aux bases de données
Introduction aux Web Services Partie 1. Technologies HTML-XML
Nouvelles Pratiques des catalogues. Rendre les données plus utiles sur le web. Publier des pages HTML sur lesquelles les utilisateurs et les moteurs de.
Etude des Technologies du Web services
XML-Family Web Services Description Language W.S.D.L.
Vue générale de Sharpdesk
HTML.
10 octobre 2012 Grégory Petit
Les FRBR et l ’évolution des règles de catalogage
Recommandations et procédure d’attribution de DOI
RDF(S)
Introduction à la structuration des documents: les techniques M2: Gestion des connaissances.
Notions sur le XML Réfs : manuel p 149. Introduction Le XML (eXtensible Markup Language) est un standard d'échange de données. Il fait partie comme le.
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
Structures de données IFT-2000 Abder Alikacem Standard Template library Édition Septembre 2009 Département dinformatique et de génie logiciel.
Une chaîne éditoriale développée dans le cadre du CIRM François Dagorn Journées pédagogiques de lIFSIC.
La problématique de la recherche de document Journée de formation 29 février 2008.
STAF 2X XSL/FO Glaus & Ruckstuhl Mars © Glaus & Ruckstuhl TECFA Programme du 18 et 19 mars Revision XML Introduction à XSL/FO (intérêts et.
1. 2 PLAN DE LA PRÉSENTATION - SECTION 1 : Code HTML - SECTION 2.1. : CSS (Méthode 1) - SECTION 2.2. : CSS (Méthode 2) - SECTION 3 : JavaScript - SECTION.
PhP-MySQL Pagora 2012/2013 CTD 1 - Presentation de moi ^^
OPTIMA, 6 novembre 2008, BnF 1 un outil daide à la transcription Thomas PALFRAY Stéphane NICOLAS Thierry PAQUET L aboratoire d I nformatique, T raitement.
Chapitre 3 Les bibliothèques de balises JSP et la JSTL
Les feuilles de style CSS
JEE 5 F.Pfister 2 institut eerie JEE – Une plateforme serveur  Développement et exécution d'applications réparties.
Le langage XHTML 420-S4W-GG Programmation Web Client
Le langage XML.
Les archives en ligne et l'histoire
Créer des packages.
Programmation Web : Introduction à XML
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
S'initier au HTML et aux feuilles de style CSS Cours 5.
SMIL Synchronized Multimedia Integration Language
Soutenance du mémoire de synthèse
Module : Langage XML (21h)
Modélisation des documents: DTD et Schéma
eXtensible Markup Language. Généralités sur le XML.
Introduction à MathML Par Katia Larrivée UQO Le 18 mars 2004.
LDAP (Lightweight Directory Access Protocol)
Introduction à la Programmation Orientée Objet
XML : un métalangage pour la description de documents structurés XML a été défini par le consortium W3 en fonction de 2 objectifs: Compenser les limitations.
Arma virumque cano....
Dreamweaver le retour Avec Les Formulaires Les Calques
Introduction générale
Introduction au HTML Qu’est ce que le HTML ?
DTD EAD.
INF2005– Programmation web– A. Obaid Variantes de HTML.
Echanges de données géographiques Sandre Geography Markup Language (GML) GIGE 2014 – Dimitri MEUNIER.
KOSMOS 1 Les activités de l’enseignant Module 6 1.Le cahier de textes des classes 2.Le travail à faire et les corrections 3.Le classeur pédagogique 4.Les.
Arma virumque cano....
Transcription de la présentation:

Focus sur quelques formats bibliographiques : TEI, EAD, METS Evolution des catalogues : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA ENS-LYON 17-19 juin 2013 Focus sur quelques formats bibliographiques : TEI, EAD, METS * Philippe.Bourdenet @univ-lemans.fr

XML et les bases de données « ABC Airways propose trois vols quotidiens sans escales depuis Dallas à destination d’Austin. Les heures de départ sont 09:15, 11:15 et 13:15. Les arrivées sont prévues une heure plus tard. » http://peccatte.karefil.com/software/RBourret/xmlBD.htm <Vols>       <Compagnie>ABC Airways</Compagnie>       <Depart>Dallas</Depart>       <Destination>Austin</Destination>     <Vol>          <HeureDepart>09:15</HeureDepart>          <HeureArrivee>10:15</HeureArrivee>     </Vol>     <Vol>          <HeureDepart>11:15</HeureDepart>          <HeureArrivee>12:15</HeureArrivee>     </Vol>     <Vol>          <HeureDepart>13:15</HeureDepart>          <HeureArrivee>14:15</HeureArrivee>     </Vol> </Vols> XML est en soi (nativement) une sorte de base de données. XML was designed to transport and store data, with focus on what data is http://www.w3schools.com/xml/xml_whatis.asp

Sa structure est arborescente : <bookstore>   <book category="COOKING">     <title lang="en">Everyday Italian</title>     <author>Giada De Laurentiis</author>     <year>2005</year>     <price>30.00</price>   </book>   <book category="CHILDREN">     <title lang="en">Harry Potter</title>     <author>J K. Rowling</author>     <year>2005</year>     <price>29.99</price>   </book>   <book category="WEB">     <title lang="en">Learning XML</title>     <author>Erik T. Ray</author>     <year>2003</year>     <price>39.95</price>   </book> </bookstore> Il obéit à quelques règles simples : XML doit avoir une balise de fermeture : <p>This is a paragraph.</p> Les balises XML sont sensibles à la casse : <Message>This is incorrect</message> <message>This is correct</message> Les éléments XML doivent être correctement imbriqués : <b><i>This text is bold and italic</b></i> <b><i>This text is bold and italic</i></b>

Les fichiers XML doivent avoir un élément racine (root) : <root> Les fichiers XML doivent avoir un élément racine (root) : <root>   <child>     <subchild>.....</subchild>   </child> </root> Les attributs doivent être écrits entre double cotes : <note date="12/11/2007">   <to>Tove</to>   <from>Jani</from> </note> Quelques caractères doivent être codés : <message>if salary < 1000 then</message> <message>if salary < 1000 then</message> <formula>E0< E1< E2< ... < V∞</formula> <formula>E0< E1< E2< ... < V∞</formula>

1. TEI = Text Encoding Initiative http://www.tei-c.org/index.xml TEI guidelines D’abord fondé sur SGML (1980-1986) Texte de référence : Guidelines for Electronic Text Encoding and Interchange (1988-1994) DTD TEI : très complexe, mail il existe aussi une DTD TEI-Lite ? Une DocType Declaration est une façon d’associer un document avec son schéma On utilisera de préférence RELAX NG (Regular Language for XML Next Generation), plus facile d’emploi. Elle permet de décrire un modèle, comme une grammaire : elle décrit les termes employés, leur position, sous forme de classe car elle généralise la description à tout un document ou à un ensemble de documents. TEI permet de baliser logiquement la plupart des types de documents sur lesquels travaillent les chercheurs en sciences humaines (textes en prose, poésie, théâtre, éditions philologiques, dictionnaires, corpus linguistiques, etc.) Tout document balisé comprend 2 parties : un en-tête (teiHeader) et le texte du document (text) : <TEI> <teiHeader> [informations contenues dans l’en-tête TEI] </teiHeader>, <text> <front> [ textes préliminaires...] </front>, <body> [ corps du texte... ] </body> <back> [annexes... ] </back> </text> </TEI> <body> se subdivise en <div>, <div1>, <div2>, etc. <div> se subdivise en <p>, <sp> (répliques), <1> (vers) selon la forme dont il est question Il existe aussi un élément <group> pour les textes composites

Structure arborescente (hiérarchique) élément fileDesc : donne une description détaillée du document électronique: titre, créateur, mode de distribution, taille, etc. S’il s’agit d’une RE, il peut fournir la source (dérivation) Description du teiHeader élément profileDesc : permet de catégoriser un document (langue dans laquelle il est écrit, sujets dont il traite, etc.) revisionDesc : historique de révision qui notifie le détail des modifications apportées à un texte.

<!ENTITY % TEI.prose ’INCLUDE’ > La DTD : comporte plus de 400 éléments ! Elle correspond aux besoins d’univers culturels variés Entités paramètres : TEI.name, qui peuvent être appelées par la DTD avec la déclaration : <!ENTITY % TEI.prose ’INCLUDE’ > Elle se découpe en modules (3 grandes catégories) : Core tag sets pour les éléments généraux, utiles à tous ; base tag sets, pour les grandes catégories de texte : (poésie, théâtre, textes en prose, dictionnaires, etc.) Additional tag sets, éléments servant à la représentation des traitements effectués sur le texte (analyses linguistiques, annotations, etc. TEI.core TEI.header TEI.prose (éléments utiles pour coder des textes en prose - paragraphes, chapitres, section, etc.) TEI.verse (éléments utiles pour coder des textes poétiques - lignes, stances, strophes, etc.) TEI.drama (éléments utiles pour coder des œuvres théâtrales) TEI.spoken (éléments utiles pour codes des discours, des interviews, etc.) TEI.dictionaries (éléments utiles pour coder des dictionnaires) TEI.terminology (éléments utiles pour coder des bases termi-nologiques) TEI.linking TEI.analysis TEI.fs TEI.certainty TEI.transcr TEI.textcrit TEI.names TEI.dates TEI.nets TEI.figures

Exemples de marquages de textes poétiques Source : techniques de l’ingénieur Regrets de du Bellay : <lg type="quatrain"> <l>Si je n’ay plus la faveur de la Muse, </l> <l>Et si mes vers se trouvent imparfaits, </l> <l>Le lieu, le temps, l’âge où je les ay faits, </l> <l>Et mes ennuis leur serviront d’excuse. </l> </lg> <l> <seg type=foot> <seg type=syll>Ar</seg> <seg type=syll>ma</seg> <seg type=syll>vi</seg> </seg> <seg type=syll>rum</seg> <seg type=syll>que</seg> <seg type=syll>ca</seg> <seg type=syll>no</seg> <seg type=syll>Tro</seg> <seg type=syll>iae</seg> <seg type=syll>qui</seg> <seg type=syll>pri</seg> <seg type=syll>mus</seg> <seg type=syll>ab</seg> <seg type=syll>or</seg> <seg type=syll>is</seg> </l> ARMA VIRUMQUE CANO, TROJAE QUI PRIMUS AB ORIS ITALIAM, FATO PROFUGUS, LAVINIAQUE VENIT LITORA, MULTUM ILLE ET TERRIS JACTATUS ET ALTO VI SUPERUM SAEVAE MEMOREM IUNONIS OB IRAM ; MULTA QUOQUE ET BELLO PASSUS, DUM CONDERET URBEM, 5 INFERRETQUE DEOS LATIO, GENUS UNDE LATINUM, ALBANI PATRES, ATQUE ALTAE MOENIA ROMAE ; MUSA, MIHI CAUSAS MEMORA, QUO NUMINE LAESO, QUIDVE DOLENS REGINA DEUM TOT VOLVERE CASUS INSIGNEM PIETATE VIRUM, TOT ADIRE LABORES 10 IMPULERIT, TANTAENE ANIMIS CAELESTIBUS IRAE ? Début de l’Enéide de Virgile marquage des syllabes et des pieds

Source : digital.humanities, OXFORD Un peu de prise de hauteur Source : digital.humanities, OXFORD Qu’est-ce qu’un texte ? S’agit-il de la même chose ?

Un texte n’est pas un document Un document est un objet qui peut être numérisé. Un texte est une abstraction, créé pour être lu, qui peut être encodé. Il faut rendre explicite (à une machine) ce qui est implicite (pour une personne). Ajouter de la valeur documentaire en multipliant les annotations Faciliter la réutilisation de la ressource produite (dans différents formats, différents contextes, par différents utilisateurs. Pour une université, marquer un texte est un activité intellectuelle : elle oblige à prendre des décision, conduire une analyse, faire des choix, définir des besoins, etc. Deux méthodes de marquage !

The Tempest / Shakespeare

Redescendons… vers le bas niveau XML > TEI Etrange rencontre Il m’a semblé que j’échappais à la bataille Par quelque tunnel profond et sombre, creusé depuis longtemps Dans des granits qu’avaient voûtés des guerres titanesques. Wilfried Owen (18 Mars 1893 – 4 novembre 1918) Redescendons… vers le bas niveau XML > TEI <?xml version="1.0" encoding="UTF-8"?> <div type="verse"> STRANGE MEETING It seemed that out of battle I escaped Down some profound dull tunnel, long since scooped Through granites which titanic wars had groined. </div> <?xml version="1.0" encoding="UTF-8"?> <div type="verse"> <head>STRANGE MEETING</head> It seemed that out of battle I escaped Down some profound dull tunnel, long since scooped Through granites which titanic wars had groined. </div> Balisage du titre avec <head> <?xml version="1.0" encoding="UTF-8"?> <div type="verse"> <head>STRANGE MEETING</head> <lg type="stanza"> It seemed that out of battle I escaped Down some profound dull tunnel, long since scooped Through granites which titanic wars had groined. </lg> </div> Ajout de la valeur stanza comme attribut De <lg> (= Line Group)

Création d’un TEAI Header <?xml version="1.0" encoding="UTF-8"?> <div type="verse"> <head>STRANGE MEETING</head> <lg type="stanza"> <l>It seemed that out of battle I escaped</l> <l>Down some profound dull tunnel, long since scooped</l> <l>Through granites which titanic wars had groined.</l> </lg> </div> Ajout de la balise <l> pour marquer les lignes Création d’un TEAI Header <?xml version="1.0" encoding="UTF-8"?> <TEI xmlns="http://www.tei-c.org/ns/1.0"> </TEI> Déclaration de l’espace de nom <?xml version="1.0" encoding="UTF-8"?> <TEI xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> <fileDesc> <titleStmt> <title> </title> </titleStmt> <publicationStmt/> <sourceDesc/> </fileDesc> </teiHeader> </TEI> Ajout de la balise <teiHeader> Des éléments fileDesc, titleStmt, publicationStmt… va servir à créer une métadonnée supplémentaire pour qualifier mon travail NB : <sourceDesc/> = <sourceDesc> </sourceDesc>

Il reste à ajouter le texte ! <?xml version="1.0" encoding="UTF-8"?> <TEI xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> <fileDesc> <titleStmt> <title>Mon document TEI</title> </titleStmt> <publicationStmt> <p>Exercice TEI</p> </publicationStmt> <sourceDesc> <p>Ressource orig. <ref target="http://www.oucs.ox.ac.uk/ww1lit/collections/item/3350">Strange Meeting</ref> Ed. Jon Stallworthy's </p> </sourceDesc> </fileDesc> </teiHeader> </TEI> </xml> Ajout des valeurs Publication Stmt peut se subdiviser en <p> (paragraphes) Il reste à ajouter le texte ! <TEI> </TEI> doit comporter au moins l’un des trois éléments <sourceDoc>, <facsimile>, ou <text>. Nous allons ajouter <text> avec son « corps », <body> dans un <div> (ça, on l’a déjà fait !)

<?xml version="1.0" encoding="UTF-8"?> <TEI xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> <fileDesc> <titleStmt> <title>Mon document TEI</title> </titleStmt> <publicationStmt> <p>Exercice TEI</p> </publicationStmt> <sourceDesc> <p>Ressource orig. <ref target="http://www.oucs.ox.ac.uk/ww1lit/collections/item/3350">Strange Meeting</ref> Ed. Jon Stallworthy's</p> </sourceDesc> </fileDesc> </teiHeader> <text> <body> <div type="verse"> <head>STRANGE MEETING</head> <lg type="stanza"> <l>It seemed that out of battle I escaped</l> <l>Down some profound dull tunnel, long since scooped</l> <l>Through granites which titanic wars had groined.</l> </lg> </div> </body> </text> </TEI> </xml>

http://www.loc.gov/ead/ Berkeley, 1993 : objectif création d’une norme d’encodage pour produire de l’information lisible par les machines pour des manuscrits. Qui veille à la capacité de : 1. Présenter des données dans un cadre vaste et indépendant, compatibles avec les instruments de recherche et les besoins de recherche d’information ; 2. Préserver les relations hiérarchiques existant entre les niveaux de description ; 3. Représenter les informations descriptives héritées ; 4. Naviguer dans la structure informationnelle hiérarchique ; 5. Gérer l’indexation et la récupération d’éléments EAD : maintenu par la Society of American Archivists, s’appuie sur le format ISAD(G), International Standard Archive Description (General). EAD, révisée en 2002 : issu d’une réelle coopération internationale, soucieux de sa compatibilité avec ISAD, révisée en 2000 SCHEMA général MARC(A) ISAD(G) ISAAR(CPF) [2004] (autorités) MarcXchange (correspondance iso2709) (autorités) ISBD MARC(B) XML (bibliographique) EAD MARCXML uniquement pour MARC21 XML

EAD s’appuie sur un schéma XSD [Qu’est-ce que c’est ?] <?xml version="1.0" encoding="UTF-8"?> <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"> <xs:element name="personne"> <xs:complexType> <xs:sequence> <xs:element name="nom" type="xs:string" /> <xs:element name="prenom" type="xs:string" /> <xs:element name="date_naissance" type="xs:date" /> <xs:element name="etablissement" type="xs:string" /> <xs:element name="num_tel" type="xs:string" /> </xs:sequence> </xs:complexType> </xs:element> </xs:schema> <?xml version="1.0" encoding="UTF-8"?> <personne xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="personne.xsd"> <nom>Bourdenet</nom> <prenom>Philippe</prenom> <date_naissance>1972-07-03</date_naissance> <etablissement>Université du Maine</etablissement> <num_tel>0243833052</num_tel> </personne> http://www.loc.gov/ead/ead.xsd <xs:attributeGroup name="am.countrycode"> <xs:attribute name="countrycode"> <xs:simpleType> <xs:restriction base="xs:token"> <xs:enumeration value="AF"/> <xs:enumeration value="AX"/> <xs:enumeration value="AL"/> <xs:enumeration value="DZ"/> <xs:enumeration value="AS"/> [...] </xs:restriction base> </xs:simpleType> </xs:attribute> </xs:attributeGroup> DTD ? Le fichier dtd2schema.xsl est une feuille de style XSLT qui transforme les instances EAD conformes à la DTD 2002 relativement à des instances qui sont conformes avec soit le schéma Relax NG ou W3C. => http://www.loc.gov/ead/dtd2schema.xsl

Source : EAD Tag Library : http://www. archivesdefrance. culture. gouv Source : EAD Tag Library : http://www.archivesdefrance.culture.gouv.fr/static/1066 [octobre 2004 : CG 46 / CN 357 / GE3]

<eadheader> Obligatoire fournit des informations bibliographiques et descriptives sur l'instrument de recherche, et non sur les documents d’archives que celui-ci décrit

<archdesc> Élément englobant pour une partie essentielle du document EAD, celle qui décrit le contenu, le contexte et l’importance matérielle d’un ensemble documentaire

Structure hiérarchisée

3. METS = Metadata Encoding & Transmission Standard http://www.loc.gov/standards/mets/METSOverview.v2_fr.html Principes généraux METS est un format de transport de données décrivant des documents numériques (des planches numérisées, des sites web, des applications, des archives, ou tout autre ressource électronique) EAD Elaboré il y a un peu plus de 10 ans et maintenu par la LOC, pour garantir leur préservation dans le temps et faciliter leur échange MARC XML DC C’est du XML, qui véhicule du XML Très souple = très facile à adapter à des besoins particuliers (On peut par exemple supprimer des contraintes (Obligatoire/Facultatifchanger les règles de constructions d’identifiants, définir des niveaux de granularité différents, jusqu’à ll’incohérence, etc. METS XML freight only ! inconvénient : si tout le monde l’adapte à ses propres besoin, il devient moins interopérable ! avantages : très commode d’utilisation, répond à des besoins divers

METS : vue d'ensemble – les sections En-tête METS Description du document lui-même (informations sur sa création ou sa modification par exemple Métadonnées descriptives peut contenir des métadonnées descriptives hébergées ailleurs Métadonnées administratives – Comment les fichiers ont-ils été créés ? Quels sont les droits applicables dessus ? Quel est l’objet original, si c’est une reproduction qui est décrite ? S’il s’agit d’une reproduction, quel est le degré de fidélité par rapport à l’original ? Est-ce une notice dérivée ? ~ visas sur un passeport Section des fichiers – liste les différentes versions électroniques de l'objet numérique. la balise <fileGrp> réunit les éléments <file> qui comprend les « versions » : Ex. d’une émission de radio enregistrée Carte de structure – c’est le cœur d'un document METS ! Elle comprend une structure hiérarchique pour l'objet de la bibliothèque numérique, et relie chaque élément de cette structure aux fichiers de contenu et aux métadonnées qui s'y rapportent. Liens structurels – gère l’expression des lien entre les éléments déclarés dans la carte de structure. Par exemple peut être utilisée pour l’archivage d’un site web, Comportement - une section de comportement peut être utilisée pour associer des exécutables au contenu d'un objet METS. Chaque comportement compris dans une section de comportement possède un élément "définition de l'interface", qui est une définition abstraite de l'ensemble des comportements représentés par une section de comportement distincte. Chaque comportement possède aussi un élément "mécanisme", qui identifie un module de code exécutable qui implémente et exécute les comportements définis de manière abstraite dans la définition de l'interface. WAV transcription en TEI MP3 <fileGrp>

En anglais… <METS:mets> <METS:metsHdr /> Header <METS:dmdSec /> Descriptive MD <METS:amdSec /> Administrative MD <METS:fileSec /> File list <METS:structMap /> Structural Map <METS:smLink/> Structutral Links <METS:behaviorSec /> Behavior Section </METS:mets>

En-tête METS (<metsHdr> ) L’en-tête contient des métadonnées descriptives minimales sur la « notice » METS : La date de création (attribut CREATEDATE), La date de dernière modification, Le statut du document décrit (attribut RECORDSTATUS). <metsHdr CREATEDATE="2003-07-04T15:00:00" RECORDSTATUS="Complete"> <agent ROLE="CREATOR" TYPE="INDIVIDUAL"> <name>Jerome McDonough</name> </agent> <agent ROLE="ARCHIVIST" TYPE="INDIVIDUAL"> <name>Ann Butler</name> </metsHdr> contributeurs individu organisation autre Rôles possibles : archiviste créateur conservateur diffuseur éditeur propriétaire de l’IP autre

Métadonnées descriptives externes (<dmdSec>, <mdRef> ) MARC MODS EAD VRA DC NISOIMG LC-AV ( Audiovisual Metadata) TEIHDR (TEI Header) DDI FGDC (géographique) autre Contient de pointeurs vers des métadonnées externes qui peuvent être récupérées <mets:dmdSec ID="DM1"> <mets:mdRef LOCTYPE="URL" MDTYPE="MARC" xlink:href="http://nucat.library.northwestern.edu/cgi-bin/Pwebrecon.cgi?BBID=4333843" LABEL="Catalog Record"></mets:mdRef> </mets:dmdSec> URN URL PURL HANDLE DOI autre L’attribut LABEL fournit des indications de visualisation, par exemple pour générer une table des matières

Métadonnées descriptives internes (<dmdSec>, <mdWrap> ) Elément conteneur qui permet d’encapsulée des métadonnées à l’intérieur d’un fichier METS <dmdSec ID="dmd002"> <mdWrap MIMETYPE="text/xml" MDTYPE="DC" LABEL="Dublin Core Metadata"> <xmlData> <dc:title>Alice's Adventures in Wonderland</dc:title> <dc:creator>Lewis Carroll</dc:creator> <dc:date>between 1872 and 1890</dc:date> <dc:publisher>McCloughlin Brothers</dc:publisher> <dc:type>text</dc:type> </xmlData> </mdWrap> </dmdSec> Micro élément en DC Chaque section (dmdSec) se voit attribuer un identifiant à l’intérieur du fichier METS. Il servira pour constituer la carte de structure.

Métadonnées administratives (<amdSec>) Fiche « administrative » de la ressource 1. Métadonnées techniques (création, formats, caractéristiques des fichiers) 2. Droits de propriété intellectuelle (copyright et licence) 3. Métadonnées de source (à propos de la source analogique dont l’objet numérique décrit peut être dérivé) 4. Métadonnées de provenance numérique (évaluation de la différence entre source et résultat, par exemple la perte de qualité entre la source originale et la reproduction décrite dans le cas d’une transformation entre l’objet numérique original et l’objet de la bibliothèque numérique (Wav -> MP3, TIF -> JPG) <techMD ID="AMD001"> <mdWrap MIMETYPE="text/xml" MDTYPE="NISOIMG" LABEL="NISO Img. Data"> <xmlData> <niso:MIMEtype>image/tiff</niso:MIMEtype> <niso:Compression>LZW</niso:Compression> <niso:PhotometricInterpretation>8</niso:PhotometricInterpretation> <niso:Orientation>1</niso:Orientation> <niso:ScanningAgency>NYU Press</niso:ScanningAgency> </xmlData> </mdWrap> </techMD>

Section des fichiers (<fileSec> ) Un <fileGrp> liste tous les fichiers constituant une version électronique distincte de l'objet de bibliothèque numérique <fileSec> <fileGrp ID="VERS1"> <file ID="FILE001" MIMETYPE="application/xml" SIZE="257537" CREATED="2001-06-10"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.xml</FLocat> </file> </fileGrp> <fileGrp ID="VERS2"> <file ID="FILE002" MIMETYPE="audio/wav" SIZE="64232836" CREATED="2001-05-17" GROUPID="AUDIO1"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.wav</FLocat> <fileGrp ID="VERS3" VERSDATE="2001-05-18"> <file ID="FILE003" MIMETYPE="audio/mpeg" SIZE="8238866" CREATED="2001-05-18" GROUPID="AUDIO1"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.mp3</FLocat> </fileSec> Même contenu audio Transcription audio en TEI Un fichier WAV D’un enregistrement sonore Une version compressée mpeg

Carte de structure (<structMap> ) Structure hiérarchique d'un objet de la bibliothèque numérique afin de permettre la navigation C’est la balise <div> qui est utilisée pour introduire les éléments hiérarchiques Cas d’un enregistrement sonore d’entretiens avec un auteur : <structMap TYPE="logical"> <div ID="div1.3" LABEL="Introduction to Teachers' Union" ORDER="3"> <fptr FILEID="FILE001"> <area FILEID="FILE001" BEGIN="TUBG" END="TUND" BETYPE="IDREF" /> </fptr> <fptr FILEID="FILE002"> <area FILEID="FILE002" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" /> <fptr FILEID="FILE003"> <area FILEID="FILE003" BEGIN="00:10:03" END="00:15:07" </div> </structMap> <mets:fileSec> <mets:fileGrp USE="application"> <mets:file ID="FID1" MIMETYPE="application/pdf" SEQ="1" GROUPID="GID1"> <mets:FLocat xlink:href="http://nma.berkeley.edu/ark:/28722/bk0005j7x2r" LOCTYPE="URL"/> </mets:file> </mets:fileGrp> <mets:file ID="FID2" MIMETYPE="application/ps" SEQ="1" GROUPID="GID1"> <mets:FLocat xlink:href="http://nma.berkeley.edu/ark:/28722/bk0005j7x39" LOCTYPE="URL"/> Cas d’une ressource en PDF : <mets:structMap> <mets:div TYPE="text" LABEL="Extending the Lexicon by [Exploiting Subregularities" ADMID="RMD1" DMDID="DMR1 DM1"> <mets:fptr FILEID="FID1"/> <mets:fptr FILEID="FID2"/> </mets:div> </mets:structMap>

Liens structurels ( <smLink>) Section la plus simple car elle ne contient que l’élément <smLink> Si fichier METS décrit un site web, prenons l’exemple de deux pages liées (Pages 1 -> Page 2), avec P1 qui contient une image qui ouvre P2 lorsque l’on clique dessus : Page html 1 (P1), <structMap> : <div ID="P1" TYPE="page" LABEL="Page 1"> <fptr FILEID="HTMLF1"/> <div ID="IMG1" TYPE="image" LABEL="Image Hyperlink to Page 2"> <fptr FILEID="JPGF1"/> </div> Page html 2 (P2), <structMap> : <div ID="P2" TYPE="page" LABEL="Page 2"> <fptr FILEID="HTMLF2"/> </div> Le lien s’exprime de la façon suivante dans la section <smLink> : <smLink from="IMG1" to="P2" xlink:title="Hyperlink from JPEG Image on Page 1 to Page 2" xlink:show="new" xlink:actuate="onRequest" />

Comportement (<behaviorSec>) Une section de comportement peut être utilisée pour associer des comportements exécutables  au contenu d'un objet METS <behavior> <interfaceDef> : définition abstraite d’un « comportement » DESC <mechanism> : pointe vers du code exécutable EXEC Liens vers un service web par exemple : <METS:behavior ID="DISS1.1" STRUCTID="S1.1" BTYPE="uva-bdef:stdImage" CREATED="2002-05-25T08:32:00" LABEL="UVA Std Image Disseminator" GROUPID="DISS1" ADMID="AUDREC1"> <METS:interfaceDef LABEL="UVA Standard Image Behavior Definition" LOCTYPE="URN" xlink:href="uva-bdef:stdImage"/> <METS:mechanism LABEL="A NEW AND IMPROVED Image Mechanism" LOCTYPE="URN" xlink:href="uva-bmech:BETTER-imageMech"/> </METS:behavior> Service web

Exemples d’application concrète Son utilisation : BnF : dans le cadre du projet SPAR (Système de Préservation et d'Archivage Réparti) entrepôt sécurisé et pérenne d’objets numériques FEDORA : http://fedora-commons.org/, pour la gestion et la préservation de corpus numériques METS Community… des informations sur le format Bibliothèque de projets décrits : http://www.loc.gov/standards/mets/mets-present.html METS tools & compatible software (http://www.loc.gov/standards/mets/mets-tools.html) Des outils de développement (java, tomcat) Bibliothèques de conversions : perl OpenWMS : plateforme open source pour contenus numériques, dispose en vrac des éléments METS dans un entrepôt Fedora METS Navigator, qui permet d’explorer une base en METS en visuel Feuilles de styles XSLT

Exemple d’application concrète à l’UM http://planches-mycologiques.univ-lemans.fr/ jpg (vignettes) jpg tif <fileGrp> Sortir les données de leur complexe applicatif (java, tomcat, apache) Fournir un VH pour chaque ressource Fournir un jeu de données METS avec une carte de structure Décrire en TEI les contenus textuels des planches …et ajouter un élément au <fileGrp> ?