Sudoc, Calames, theses.fr et le Web de données Atelier JABES2011.

Slides:



Advertisements
Présentations similaires
Le rôle des Métadonnées
Advertisements

RDA : Pourquoi, quoi, qui et quand Des règles aux entités : Catalogage avec la RDA ACB, le 29 mai 2009 Gillian Cantello Bibliothèque et Archives Canada.
quelques questions soulevées par RDA et les FRBR
Métadonnées des publications scientifiques Acclimater Eprints Application Profile (UK) Yann Nicolas, ABES Couperin AO, 21 mai 2007.
La diffusion des métadonnées de la thèse
Lalimentation de STAR par imports STAR 8ième cercle – 27 septembre 2013.
La diffusion du document thèse
Les fonctionnalités de STAR : archivage, signalement et diffusion STAR 8ième cercle le 27 septembre 2013.
DTD Sylvain Salvati
Agréger les infos SITRA et réservation sur mon site
Travaux Dirigés d'Urbanisation de Système d'information
Les espaces de nommage XML par Philippe Poulard 1
Le Comité français UNIMARC : fonctionnement
Traduction française des formats UNIMARC
1 Comprendre et s'approprier les évolutions du catalogage en bibliothèque Journée dinformation Média Centre-Ouest 13 novembre et 6 décembre 2012 Emilie.
Journée de sensibilisation à lévolution des catalogues et du catalogage Objectifs: Comprendre les enjeux de ladaptation des catalogues et du catalogage.
ENS Lyon 17 au 19 juin 2013 Thierry Clavel et Philippe Bourdenet
MOCCAM Les textes de cette présentation sont issus en grande partie du site de MOCCAM.
Métadonnées pour les thèses numériques françaises
Abes agence bibliographique de lenseignement supérieur Catalogage.
Journée d’information CNFPT
STEP, valoriser la thèse avant la soutenance
Exports à la demande Principes Méthodes Évolutions.
Tutoriel STAR JABES 2011 – 17/05. Sommaire Comment suivre la vie dune notice et de la thèse La notice nest pas dans … – Le Sudoc – Dart La thèse nest.
Raymond BERARD Journées ABES 17 mai 2011
Nouvelles Pratiques des catalogues. Rendre les données plus utiles sur le web. Publier des pages HTML sur lesquelles les utilisateurs et les moteurs de.
Les API Sudoc Le Sudoc autrement…
Septembre Interconnexion entre HAL et dautres systèmes dinformation.
Intégrer IdRef dans les applications documentaires de votre université. Pourquoi ? Comment ? Atelier JABES2011.
Les autorités Sudoc au-delà du Sudoc JABES Stratégie ABES Connecter des notices bibliographiques aux autorités Sudoc » Notamment les Personnes Quelles.
Web Sémantique: Le Relief Actuel
10 octobre 2012 Grégory Petit
Autour des autorités Journées ABES 2012 Yann Nicolas.
OUVERTURE DES DONNÉES. Le projet d'établissement de l'ABES , p. 4.
Localisation dans le Sudoc des ressources électroniques JABES 2012.
RDF(S)
Isidore Accès unifié aux données et documents numériques des sciences humaines et sociales Valpré – 7 décembre 2010.
Épreuve de compréhension orale pour l’examen final clemi 3
Notions sur le XML Réfs : manuel p 149. Introduction Le XML (eXtensible Markup Language) est un standard d'échange de données. Il fait partie comme le.
Résultats de lenquête Mai 2011 Avril 2011Sophie MAZENS.
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Le cœur du projet : objectifs Lélaboration dune base de corpus (principalement oraux) regroupant des données de langues de différentes natures –Une approche.
Initiation aux bases de données et à la programmation événementielle
Agence Education Formation-Europe
Projet de Master première année 2007 / 2008
Convertisseur OWL vers RDF/RDFS
BIBLIOTHEQUES NUMERIQUES Présentateur : Daniel MICHEL.
Abes agence bibliographique de l’enseignement supérieur Journées ABES 2007 Atelier 3 Les autorités dans le Sudoc : quelle(s) gestion(s) pour quelle(s)
Des autorités aux autorités enrichies : vers une liaison automatique sémantiquement contrôlée aux autorités Sudoc Collaboration Abes/Lirmm dans le cadre.
Mediadix – Novembre 2013 Marie-Line GUILLAUMEE (BIU Sorbonne)
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment le DwC-A a changé.
Formation des Rédacteurs Contributeurs à la Communication Diocésaine sur Internet 30 novembre 2005 Le site Internet du Diocèse de Fréjus-Toulon:
Web sémantique est pratique documentaire
RDA : Pourquoi, quoi, qui et quand Des règles aux entités : Catalogage avec la RDA ACB, le 29 mai 2009 Gillian Cantello Bibliothèque et Archives Canada.
Abes agence bibliographique de l’enseignement supérieur Consignes pour le catalogage dans le Sudoc.
OPEN ACCESS Présentateur : Daniel MICHEL Libre accès à l’info. Scientifique  Présentation  Définition  Revues en libre accès  Archives ouvertes 
Cours sur le DOI COULET Alban GREMONT Baptiste GIDO2A Le 13/12/2007.
Métadonnées – IUT bordeaux Exercice 2 – 20/02/2008 Julie Mignard – LP.
Bibliothèque(s) Virtuelle(s) Expériences en Provence-Alpes-Côte d’Azur Stéphane Ipert Directeur du Centre de Conservation du Livre, Arles.
Analyse du sujet -1- Eléments issus de la lecture du sujet
Initiation aux bases de données et à la programmation événementielle
Parcours FRBR 3 : format RDF et FRBRisation Le « J.e-cours » va bientôt commencer, merci de votre patience…… Merci de désactiver votre micro : - Repérer.
Description plus fine des thèses de doctorat (thèses sur travaux, jury et partenaires) Le « J.e-cours » commence à 11h00, merci de votre patience… Merci.
Les bases de données Séance 3 Construction du Modèle Conceptuel de Données.
Préparé par : Marouane FELJA
Prise en main du mode édition d’IdRef pour tous les catalogueurs Public Personnels chargés des autorités Intervenants François Mistral, responsable IdRef.
L'analyse qualitative des métadonnées et les traitements, sans collaboration de l’éditeur Catherine Storne SCD Université de Strasbourg JABES 2016 – 10/05/2016.
VERS UN CERCLE VERTUEUX Session parallèle 1 Comment les établissements Sudoc, les éditeurs et l’ABES collaborent pour proposer des données de signalement.
Hub : rappel Chaîne de traitement de métadonnées hétérogènes, venues des éditeurs – Entrées hétérogènes : XML, tabulé, MARC Livres et chapitres ! Périodiques.
Monsieur Jourdain du Web de données
Transcription de la présentation:

Sudoc, Calames, theses.fr et le Web de données Atelier JABES2011

Vers le Web de données ApplicationLancementFormat RDFDonnées à jourRichesse des liens Calames2008RDFaOui+ theses.fr2010RDFa + RDF/XML 2011 Oui+ IdRef2010RDF/XML + RDFa 2011 Oui++ Sudoc2011RDF/XML 2011 Oui+++

Il faut participer au Web de données [Acquis]

Objectifs de latelier Faire un bilan détape Montrer les données Justifier certains choix Expliquer comment ça marche Manipuler quelques outils simples Esquisser la suite du travail à mener – Nous – Vous

Partons du connu

Sagit-il de données RDF ou dune simple notice Dublin Core ?

RDF nu

about En RDF, il faut expliciter de quoi on parle en lidentifiant par une URL : est lidentifiant du document décrit est décrit à cette page-là

triplets En RDF, tout est décomposé en triplets Chaque triplet est indépendant Chaque triplet pourrait être stocké séparément Pas de notice finie Une autre source peut la compléter, si elle parle de la même chose : Interopérabilité. Extensibilité.

Identifier la langue avec le référentiel Lexvo

Mettre en relation un document et une langue La langue nest pas un code (fre) La langue est une entité à part entière – Avec son propre identifiant – et ses propres propriétés La propriété dcterms:language met en relation deux entités

décrite en HTML

décrite en RDF

De fil en aiguille La description de la langue poursuit la description du document Sudoc Où sarrêter ? Cest sans fin Cest le Web de données

Identifier les personnes avec IdRef

IdRef, fournisseur didentifiants et de référentiels = application Web ouverte – Ouverte sur le Web de données – Ouverte à dautres applications IST (France) Par son Web Service de recherche Par ses fonctions dintégration (Javascript) Différents moyens/services pour récupérer et exploiter les identifiants et les données des autorités Sudoc ABES.

IDREF Autorités Sudoc Sudoc et IdRef Sudoc

Autorités Sudoc Les autorités Sudoc, pivot du Linked data ABES theses.fr Calames Sudoc Thèses soutenues et Thèses en cours (2011)

RDFa de Calames Pas de page RDF/XML Le RDF est caché dans le HTML de Pour révéler le RDF caché, utiliser un outil comme

RDFa de Calames

RDFa de theses.fr Pas encore de page RDF/XML Le RDF est caché dans le HTML de Pour révéler le RDF caché, utiliser un outil comme

Les thèses portant sur les correspondants de Goethe PREFIX foaf: PREFIX dc: PREFIX ead: PREFIX tef: SELECT ?these { ?ms dc:creator. ?ms ead:destinataire ?destinataire. ?these a tef:Thesis. ?these dc:subject ?destinataire } La requête exploite les données Calames et STAR

Lier les données à IdRef, au-delà de lABES

Autorités Sudoc Linked data IST.fr ? theses.fr Calames Sudoc Thèses soutenues et Thèses en cours ( 2011) HAL ? revues. org ? revues. org ? Persée ? Presses univ. de Y ? Plateforme pédagogiq. ? ? ?

IdRef comme nœud régional Positionnement dIdRef : IST français En complémentarité avec dautres fournisseurs didentifiants et de référentiels : – Local : identifiants propres à une application, à un annuaire – Régional : BnF, auteurs HAL, CERL, DAI (NL)CERLDAI – Global : VIAF, DBpedia

Autorités Sudoc theses.fr Calames Sudoc HAL ? revues. org ? revues. org ? Persée ? Presses univ. de Y ? Plateforme pédagogiq. ? Autorités BnF DBpedia VIAF

Lier les données de lIST entre elles, au-delà dIdRef

Autorités Sudoc Linked data IST.fr ? Les labos ! theses.fr Calames Sudoc HAL revues. org revues. org Persée Presses univ. de Y Plateforme pédagogiqu e X ? ? Référentiel des laboratoires

Autorités Sudoc Linked data IST.fr ? Les affiliations theses.fr Calames Sudoc HAL revues. org revues. org Persée Presses univ.s de Y Plateforme pédagogiqu e X PRISMES (AMUE) locaux Référentiel des laboratoires

On parle de la même chose owl:sameAs

Identifier et nommer les personnes avec IdRef

Identifier les concepts avec IdRef et RAMEAU

IdRef et Rameau Identifiants IdRef pour Rameau A lier aux identifiants canoniques, ceux du centre national Rameau (BnF) quand ils seront officiellement publiés. MeSH Dewey

Préciser le rôle des agents avec les MARC Relators

Lembarras du choix ? dcterms:creator dcterms:contributor marcrel:aut rda:authorWork tef:auteur ?

Qui utilise explicitement marcrel:aut utilise implicitement dc:contributor

Raisonnement Le Sudoc dit : marcrel:aut /id La Bibliothèque du Congrès dit (ici) :ici Marcrel:aut rdfs:subPropertyOf dc:contributor Un outil de raisonnement pourra en déduire que : dc:contributor /id

Qui utilise marcrel:aut peut également tef:auteur, malgré la redondance apparente

tef:auteur Ne semble rien dire de plus que marcrel:aut Mais possède une propriété intéressante : Cest une propriété fonctionnelle = Une thèse ne peut avoir quun auteur = si une thèse a deux auteurs, cest deux fois le même !

Raisonnement Quelquun dit : tef:auteur Quelquun dautre dit : tef:auteur Une ontologie TEF dit : rdf:type owl:ObjectProperty owl:FunctionalProperty (une thèse ne peut avoir qu1 auteur, au sens de tef:auteur) (mais elle peut avoir 2 dc:creator) Un outil de raisonnement pourra en déduire que : owl:sameAs

DÉMO Fichier (fusion des triplets RDF) : Outils de raisonnement :

Raisonnement RDF, cest de la logique Travaux en cours avec le LIRMM pour ADONIS sur les données Persée Oblige à qualité des données et rigueur de la modélisation Sinon : on génère nimporte quoi ! Usages : – Enrichir les données – Expliciter les données – Mettre au jour des incohérences

Page RDF complète

Une pincée de RDA et de FRBR

CONCLUSION

Convertir en RDF Aussi indéterminé que « convertir en Excel » ! Quelle modélisation ? Quels vocabulaires réutiliser ? Forger son propre vocabulaire ? Nos données historiques sont-elles éligibles à ces nouvelles modélisations ? » cf. notre dc:format et notre dc:publisher

Trois lièvres à la fois PrioritéObjectifVocabulaires Parler à la cantonadeInteropérabilité généraledc, foaf Modéliser de manière exhaustive nos données métier Se passer de MARCrda, isbd, frbr Faire raisonner les donnéesTirer le maximum des données Contrôler leur qualité Aide au catalogage ad hoc si nécessaire

La suite Enrichir encore les conversions en RDF Multiplier si nécessaire les vocabulaires employés, sans craindre les redondances Ajouter des liens internes et externes (IST française, BnF, OCLC, Dbpedia, Freebase, etc.) Encourager les partenaires à diffuser leurs données en RDF, en sappuyant sur des référentiels communs (IdRef) Continuer à exploiter ces données en RDF avec le LIRMM et dautres