Février-Avril 2006 Licence Pro BDAN 1 4. Partager les métadonnées 2 méthodes pour partager: Le serveur Z39.50 Le serveur.

Slides:



Advertisements
Présentations similaires
Une infrastructure pour la recherche européenne
Advertisements

Tutoriel - Les Ressources du BCH
ZOTERO logiciel de gestion bibliographique
Décembre 2004Philippe Beaudoin – A.P.R.A.1 Internet et la philatélie ou ce que loutil Internet peut apporter au philatéliste amateur.
Les thèses en ligne, le serveur TEL et l’UJF
Koha - Greenstone Symposium Koha Miramas 28 mai 2010
W3Line | 10 Ter, Rue Pasteur – BOURG LES VALENCE | Tél. : – Fax : | – Web :
CSIESR-Arles 16/05/06 -F. JANNIN- B. SOR inJAC ESUP et OAI-PMH Le CMS détablissement dESUP.
Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI ESUP-Day Paris, 5 juillet 2007.
dispositif SIST et l’accès à l’information scientifique et technique
Atelier sur les Archives Ouvertes mai 2012, Monastir, Tunisie Les Archives ouvertes et les archives institutionnelles. NEREUS : portail européen.
Les politiques dalimentation et de développement des Archives Ouvertes Atelier Archives Ouvertes – Monastir – 15 mai 2012 Jean-François LUTZ Université
Mai Le projet européen DRIVER Une infrastructure pour la recherche européenne
La diffusion des métadonnées de la thèse
Lalimentation de STAR par imports STAR 8ième cercle – 27 septembre 2013.
La diffusion du document thèse
Les fonctionnalités de STAR : archivage, signalement et diffusion STAR 8ième cercle le 27 septembre 2013.
Une solution personnalisable et extensible
Formation « Utilisation avancée de HAL » - ccsd – 25 septembre 2012 Utiliser les WebServices
Formation HAL Les collections
Documentation numérique sur l’Internet
Educasources Paris, le 30 janvier 2007 Paris, le 30 janvier 2007.
ProdINRA Centre de documentation P. Bartoli Sources : ProdINRA, base des publications en libre accès.
Traduction française des formats UNIMARC
Design Pattern MVC En PHP5.
TP 3-4 BD21.
Métadonnées pour les thèses numériques françaises
EVALUER L’INFORMATION
Les pratiques documentaires de la Maison des Géosciences : Rapport denquête Emilie Gentilini Juin 2006.
Septembre Interconnexion entre HAL et dautres systèmes dinformation.
La valorisation de la Recherche
Communication Scientifique
Etude des Technologies du Web services
Intégrer IdRef dans les applications documentaires de votre université. Pourquoi ? Comment ? Atelier JABES2011.
XML-Family Web Services Description Language W.S.D.L.
Mise en place d'archives ouvertes: mesures pratiques
Collecte de données en ligne
Comprendre l’environnement Web
Archimède : dépôt institutionnel de la Bibliothèque de lUniversité Laval Par Rida Benjelloun Chef de la section recherche.
Lycée Louis Vincent Séance 1
OUVERTURE DES DONNÉES. Le projet d'établissement de l'ABES , p. 4.
Droits dauteur et archives ouvertes 25 octobre 2011 Mme V. HOSPITAL M. M. DANTANT, Direction des Affaires juridiques du CNRS Mme F. FLAMERIE Mme A. GIRAUDON,
Le portail des MSH
Pourquoi, comment diffuser en ligne son mémoire de Master  ?
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
PhP-MySQL Pagora 2012/2013 CTD 1 - Presentation de moi ^^
Déposer ses publications dans HAL pour valoriser la recherche au CHEC. Enjeux, méthodologies, services.
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Introduction à la structuration des documents: les applications M2: Gestion des connaissances.
Méthodologie documentaire
Catalogage de données Notions, enjeux et initiatives actuelles.
Présentation de larchive ouverte « ArchiveTématice » Colloque Technologies pour lapprentissage et léducation, Paris,
Rosa María Gómez de Regil Paris, 25 janvier 2011
Initiation au web dynamique
Implémentation OAI-PMH CNDP – Jérôme Martin
Enjeux, méthodologies, services.
0 Objectifs de la session n°1  Revenir sur toutes les bases théoriques nécessaires pour devenir un développeur Web,  Découvrir l’ensemble des langages.
COMPTE-RENDU DE LA JOURNEE DU MERCREDI 24 NOVEMBRE 2010.
Bordeaux - Juin HAL – Le contenu / Les acteurs
L’information scientifique : les impacts du libre accès
Information Scientifique et Technique à l’IN2P3 LAL Orsay 25 janvier 2006 Dominique Jarroux-Déclais Responsable IST IN2P3.
NOM DE L’AUTEUR JOUR / MOIS / ANNEE ProdInra 2 : politique de dépôt et services pour les scientifiques.
D4 : Organiser la recherche d'informations numériques
ProdInra 2 : politique de dépôt et services pour les chercheurs
LES ARCHIVES OUVERTES. L’accès à l’information scientifique : un enjeu majeur pour les chercheurs.
OPEN ACCESS Présentateur : Daniel MICHEL Libre accès à l’info. Scientifique  Présentation  Définition  Revues en libre accès  Archives ouvertes 
Gérez vos références bibliographiques avec France.Martin [à]univ-paris1.fr
NOM DE L’AUTEUR JOUR / MOIS / ANNEE ProdInra 2 : politique de dépôt et services pour les scientifiques.
Jocelyne Jerdelet - Sandrine Reyes CERN-DSU-SI 1 La Théorie sur la "voie verte" de l'Open Access.
OAI-PMH & LOM OAI Repository interoperability using LOM metadata format Interopérabilité des bases de ressources utilisant OAI-PMH et LOM Steve Giraud.
Transcription de la présentation:

Février-Avril 2006 Licence Pro BDAN 1 4. Partager les métadonnées 2 méthodes pour partager: Le serveur Z39.50 Le serveur OAIPMH Le partage nécessite dutiliser une norme ou standard. Z > MARC OAI -> Dublin Core

Février-Avril 2006 Licence Pro BDAN 2 3. Z39.50 / OAI Z39.50 Une norme pour permettre linterrogation Protocole spécifique Ensemble dattributs normalisés Ensemble de réponses normalisées (MARC) Buts: Interroger plusieurs bases simultanément Interroger une base de référence pour faire du catalogage (récupération de notice) OAI Un standard pour permettre le moissonnage Requêtes http normalisées Réponses normalisées (en XML-dublin core) Buts: Télécharger périodiquement un ensemble de métadonnées afin de bâtir une application spécifique (client) Exposer ses métadonnées au public afin de les partager (serveur)

Février-Avril 2006 Licence Pro BDAN 3 Z39.50, suite Z39.50 peut fonctionner indépendamment du web: il n'utilise pas http ! Par exemple, interface de catalogage d'un logiciel de gestion de bibliothèques

Février-Avril 2006 Licence Pro BDAN 4 Z39.50 avec le web Rajout d'un couche logicielle interface Z web

Février-Avril 2006 Licence Pro BDAN 5 Z39.50 / OAI -suite Z39.50 Complexité d'implémentation Protocole compliqué "ensemble d'attributs" compliqués Essentiellement restreint aux catalogues de bibliothèques OAI Simplicité d'implémentation Protocole http (simple) Ensemble de requêtes très limité, faciles à comprendre Retraitement facile (XML) Utilisé par des archives ouvertes et/ou bibliothèques numériques (pas forcément en accès libre)

Février-Avril 2006 Licence Pro BDAN 6 OAI et moissonneurs "web" (google et autres) Moissonneurs web Visitent des sites Processus lent Lit page d'accueil Indexe contenu (parfois titre, et mots clés) Visite chaque lien => récursif jusqu'à la fin d'un site OAI Moissonnage spécialisé " plus rapide Indexation plus précise (champs du DC, ou autres) Plus intéressant si on se spécialise dans les documents se trouvant dans les archives ouvertes

Février-Avril 2006 Licence Pro BDAN 7 4. Les archives ouvertes : politique Open Archives Initiative. Une initiative « politique » Encourager le développement du libre accès à la documentation Initiative de Budapest pour l'Accès Ouvert « Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities » Communication directe auteur=lecteur Combattre lhégémonie des grands éditeurs commerciaux

Février-Avril 2006 Licence Pro BDAN 8 Archives Ouvertes: exemples ArXiv : ( LA référence ! Par les scientifiques pour les scientifiques, depuis 1992 ! Miroirs partout. En France le serveur HAL (hal.archives-ouvertes.fr) est une frontale dArXiv.hal.archives-ouvertes.fr Principe dauto archivage ! Des archives de différentes institutions Des serveurs de thèses en ligne (NDLTD) Voir une liste (assez) complète sur archives.eprints.org archives.eprints.org

Février-Avril 2006 Licence Pro BDAN 9 4. Archives Ouvertes: technique Même principe que nimporte quelle bibliothèque numérique (cf premier cours) : Identifiants + base de métadonnées + fichiers en ligne En plus: Système dinscription/authentification pour les auteurs (auto archivage) Système de « datestamp » obligatoire Parfois, système de « validation » (authentification) Service dalerte (faire connaître les nouveaux documents déposés) Serveur OAIPMH pour « partager » les métadonnées

Février-Avril 2006 Licence Pro BDAN Archives Ouvertes: technique Le protocole OAIPMH. (Open Archives Protocol for Metadata Harvesting). Crée par lopen archives initiative, années Notions de data provider (détient les données et les expose), et service provider (récupère les données et les utilise pour proposer un service à ses utilisateurs) Côté serveur (data provider) : Export (dynamique ou statique) des métadonnées de la base en XML et conforme au standard « dublin core ». Possibilité dexporter dautres formats de métadonnées. (cf premier TD) Savoir répondre à des requêtes normalisées et renvoyer la réponse adéquate et normalisée (développement ou installation dun logiciel adéquat) Côté client (service provider) Utiliser un « vocabulaire » (ensemble restreint de requêtes normalisées) Récupérer les réponses pour les réutiliser (savoir exploiter lXML )

Février-Avril 2006 Licence Pro BDAN Les Archives Ouvertes: technique OAIPMH côté serveur les logiciels disponibles Pour gérer tout le processus (soumission BD, stockage…) : eprints.org DSpace Fedora Pour fournir un serveur OAI-PMH « par-dessus » une base déjà existante: PHP OAI Data Provider XMLFile v2.2 Liste (in)complète sur

Février-Avril 2006 Licence Pro BDAN Les Archives Ouvertes: technique OAIPMH côté client Pas indispensable de disposer dun logiciel spécifique. Un navigateur web (ou commande « wget ») suffit ! Apprendre/comprendre les requêtes OAI normalisées URL+verbe+arguments URL = lurl de base dun fournisseur OAI Verbe: lun des 6 verbes possibles Arguments : préciser les dates ou le sous ensemble ou le format des métadonnées.

Février-Avril 2006 Licence Pro BDAN 13 4 Les archives Ouverts: technique OAIPMH les 6 verbes GetRecord (récupération dun enregistrement) Identify (info sur le service) ListIdentifiers (Liste des identifiants) ListMetadataFormats (infos sur les formats de métadonnées possibles) ListRecords(récupération de plusieurs notices) ListSets(info sur les divisions logiques du serveur OAI)

Février-Avril 2006 Licence Pro BDAN Les Archives Ouvertes: technique OAIPMH: les arguments From, until : pour récupérer des données depuis (ou jusquà) une certaine date Set : pour récupérer un sous ensemble MetadataPrefix : pour récupérer les métadonnées dans différents formats (argument obligatoire avec les verbes ListRecords et GetRecord) resumptionToken: reprendre la suite des réponses

Février-Avril 2006 Licence Pro BDAN Les Archives Ouvertes: exemples de requêtes OAIPMH Quels sont les sous ensembles dans la collection OAI HAL Quels sont les formats de métadonnées possibles? metadataPrefix=oai_hal metadataPrefix=oai_hal Je veux tous les enregistrements dans le domaine « math » avec lensemble de métadonnées « oai_hal » metadataPrefix=oai_hal&from= &until= metadataPrefix=oai_hal&from= &until= Même chose entre le 1/01/2007 et le 27/02/ &metadataPrefix=oai_dc &metadataPrefix=oai_dc je veux la notice cs/ dans ArXiv en oai_dc

Février-Avril 2006 Licence Pro BDAN Les Archives Ouvertes: OAIPMH Récupération des résultats Sauvegarder le résultat dune requête dans un fichier. « Transformer » lXML récupéré (cf cours XML) En général on veut automatiser la tache. Il existe des bibliothèques de programmes permettant de le faire. (ex Perl Harvester).Perl Harvester Liste à

Février-Avril 2006 Licence Pro BDAN 17 Archives Ouvertes: conclusion Archive ouverte = bibliothèque numérique + fonctionnalités spécifiques Archive ouverte # bibliothèque numérique Dans une archive ouverte, les documents sont librement consultables. Tendance générale à trop décentraliser (réinvention constante de la roue).