Parcours FRBR 3 : format RDF et FRBRisation Le « J.e-cours » va bientôt commencer, merci de votre patience…… Merci de désactiver votre micro : - Repérer.

Slides:



Advertisements
Présentations similaires
Définitions Analyse documentaire
Advertisements

quelques questions soulevées par RDA et les FRBR
La diffusion des métadonnées de la thèse
Lalimentation de STAR par imports STAR 8ième cercle – 27 septembre 2013.
Ontologie, Méta-données, Sémiotiques
1 Comprendre et s'approprier les évolutions du catalogage en bibliothèque Journée dinformation Média Centre-Ouest 13 novembre et 6 décembre 2012 Emilie.
RDA en France : quelles orientations ? Réunion du Groupe stratégique, 25 mars 2011 Deuxième réunion de travail sur l'application de FRBR, FRAD et RDA dans.
Rapport au Groupe stratégique Réunion du 16 novembre 2011 Groupe technique sur ladoption de RDA en France.
Quest-ce que RDA ? RDA = Ressources : Description et Accès –Ressources couvrir tous les types de ressources –en particulier les ressources électroniques.
De nouveaux modèles de données pour les catalogues de bibliothèques Médiathèque de la Cité de la musique, Paris - France Patrice Verrier, Coordinateur.
Métadonnées pour les thèses numériques françaises
Journée d’information CNFPT
La Recherche en Ligne.
12 novembre 2012 Grégory Petit
Initiation aux bases de données et à la programmation événementielle
Exports à la demande Principes Méthodes Évolutions.
Nouvelles Pratiques des catalogues. Rendre les données plus utiles sur le web. Publier des pages HTML sur lesquelles les utilisateurs et les moteurs de.
Les API Sudoc Le Sudoc autrement…
Interfaces de recherche usager
Septembre Interconnexion entre HAL et dautres systèmes dinformation.
Intégrer IdRef dans les applications documentaires de votre université. Pourquoi ? Comment ? Atelier JABES2011.
Langages de représentation RDF (Resource Description Framework)
Les autorités Sudoc au-delà du Sudoc JABES Stratégie ABES Connecter des notices bibliographiques aux autorités Sudoc » Notamment les Personnes Quelles.
Web Sémantique: Le Relief Actuel
B2i Lycée Circulaire BO n°31 du 29/08/2013.
Lycée Louis Vincent Séance 1
OUVERTURE DES DONNÉES. Le projet d'établissement de l'ABES , p. 4.
Guide dutilisation Catalogue virtuel du Centre de documentation.
RDF(S)
Web sémantique : Web de demain
Résultats de lenquête Mai 2011 Avril 2011Sophie MAZENS.
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Document élaboré à Centrale Paris par Pascal Morenton LES TECHNOLOGIES DU WEB 1. LES PHASES D UN DEPLOIEMENT DE RESEAUX 2. LE LANGAGE HTML 3. LE LANGAGE.
Sudoc, Calames, theses.fr et le Web de données Atelier JABES2011.
SUDOC (le catalogue des ouvrages, des thèses et des périodiques des bibliothèques françaises) Contenu Le catalogue du Système Universitaire de DOCumentation.
La bibliothèque électronique. Préambule. Dans tous les cas, tout se passe toujours à partir de la page d’accueil du site web des BU.
Les feuilles de style CSS
Périscope : quelques cas pratiques Le « J.e-cours » va bientôt commencer, merci de votre patience…… Merci de désactiver votre micro : - Repérer votre nom.
Chapter 8A Semantic Web Primer 1 Chapitre 8 - Conclusions et perspectives Grigoris Antoniou Frank van Harmelen.
Web sémantique Par Lydia Carine Mampais KI Bamba SISSOKO
Mediadix – Novembre 2013 Marie-Line GUILLAUMEE (BIU Sorbonne)
X xx yyy Document XML Résolution d'entités Résolution espaces de nommages Reader Parsing Contrôle de validité structurelle Contrôle arbre bien formé Contrôle.
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Martine Toussaint Desir
Web sémantique est pratique documentaire
S'initier au HTML et aux feuilles de style CSS Cours 5.
LA BIOBASE ET LE BIOPRESSE DU CETAB+ ET D’ABIODOC Projet réalisé dans le cadre du programme Innovbio du Ministère de l’agriculture, des pêcheries et de.
GEORGETA BĂDĂU CRÉATION ET GESTION D’UN BLOG AVEC LA PLATE-FORME LEWEBPEDAGOGIQUE.COM Séance no.2.
Quiz Identification des manifestations et des items.
eXtensible Markup Language. Généralités sur le XML.
Stage à Ontomantics Master Pro TILDE
Interaction Homme Machine
Congrès de l’ABF – Lyon - 6 juin 2013
Catherine Serres – Frédéric Puyrenier
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
CDI du lycée Jean Jaurès / La recherche dans BCDI.
1 Initiation aux bases de données et à la programmation événementielle Cours N°8 : Gestion de la cohérence avec des zones de liste déroulantes. Souheib.
A L I M E N T A T I O N A G R I C U L T U R E E N V I R O N N E M E N T ProdInra en Web sémantique Esther Dzalé Y. Kaboré Sophie Aubin Hugues Leiser.
Description plus fine des thèses de doctorat (thèses sur travaux, jury et partenaires) Le « J.e-cours » commence à 11h00, merci de votre patience… Merci.
Préparé par : Marouane FELJA
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 4 Support de cours rédigé par Bernard COFFIN Université.
La création des données d’exemplaire pour un exemplarisateur.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
L'analyse qualitative des métadonnées et les traitements, sans collaboration de l’éditeur Catherine Storne SCD Université de Strasbourg JABES 2016 – 10/05/2016.
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Hub : rappel Chaîne de traitement de métadonnées hétérogènes, venues des éditeurs – Entrées hétérogènes : XML, tabulé, MARC Livres et chapitres ! Périodiques.
Révisions pour l’exam L2 Informatique Obligatoire.
1 Programmation Web Programmation WAMP/LAMP Premiers principes.
Formation web sémantique J.M. Vanel RDF, RDF Schema, SPARQL, OWL, Modélisation, moteurs de règles Licence Creative Commons.
Monsieur Jourdain du Web de données
Transcription de la présentation:

Parcours FRBR 3 : format RDF et FRBRisation Le « J.e-cours » va bientôt commencer, merci de votre patience…… Merci de désactiver votre micro : - Repérer votre nom dans la liste (« moi ») - Cliquer sur l’icône « Silence »

Parcours FRBR Partie 1. LES PRINCIPES GÉNÉRAUX (10/10/2013) Partie 2. DES CATALOGUES FRBRisés (07/11/2013) Partie 3. FORMAT RDF et FRBRisation (19/12/2013) Vos formateurs :  Philippe Le Pape  Olivier Rousseaux  Michaël Jeulin  Laurent Piquemal

PARTIE 3. FORMAT RDF ET FRBRISATION Support élaboré à partir des travaux du groupe national de formateurs RDA

PLAN Le rapport entre format RDF et FRBRisation Le format RDF Les données du Sudoc en RDF

LE RAPPORT ENTRE FORMAT RDF ET FRBRISATION

Rappel : les enjeux de la FRBRisation Mieux représenter les résultats de recherche de nos catalogues, y compris sur le web Modifier la granularité de la description bibliographique : la donnée, plutôt que la notice Pour que cela soit possible : il faut libérer la donnée du carcan de la notice

Enjeu 1 : mieux présenter les résultats Une notice bibliographique est structurée par un format spécifique (MARC) : 200 des espèces par le moyen de la sélection naturelle $bTexte imprimé$fCharles Darwin 700 #1$aDarwin$bCharles$f $4070 Structure d’une base de données classique : Champ : valeur du champ 200 : a pour titre 700 : a pour auteur

Tout logiciel bibliographique programmé pour ça saura reconnaître et identifier cette structure. Enjeu 1 : mieux présenter les résultats

Mais un moteur de recherche NE SAIT PAS interpréter cette structure MARC La notice reste indéchiffrable

Enjeu 1 : mieux présenter les résultats Pour que la structure de nos données soit comprise par les moteurs de recherche, il faut la TRADUIRE dans la structure des données sur le web.

Enjeu 2 : changer la granularité Volonté d’offrir aux usagers du web une description à la granularité plus fine. Permet de choisir le niveau d’information pertinent : - infos sur l’œuvre, pour une recherche - infos sur l’item, pour un emprunt

Enjeu 2 : changer la granularité NOTICE TITRE EDITEUR COTE

Enjeu 2 : changer la granularité Requêtes spécifiques = résultats spécifiques TITRE EDITEUR COTE Œuvres de Darwin ? TITRE Versions originales? TITRE Disponibilité ? TITRE EDITEUR COTE

RDF convient à la FRBIsation ENJEU FRBR 1 : données visibles sur le web BESOIN : format de données interprétables par des machines ENJEU FRBR 2 : donnée comme granularité de la description BESOIN : nouvelle structuration des données qui conserve les liens Convient, car : -Basé sur un langage XML interprétable par des machines -Structuré pour rendre compte de liens « typés »

LE FORMAT RDF

Du Web de documents au web de données Le Web dans les années 90 : des urls et des liens hypertextes (http) pour « naviguer » entre des pages et des fichiers : un web de documents Les moteurs de recherche indexent les pages, mais mal leur contenu. – En particulier les bases de données, parmi lesquelles les catalogues. Emergence du web de données à partir des années 2000 Il s’agit de s’appuyer sur la technologie du web traditionnel pour représenter les données elles-mêmes

RDF (Resource Description Framework) Proposé en 1999 par le W3C RDF est un modèle conceptuel qui s’appuie sur l’architecture du web Il permet d’encoder des données pour qu’une machine puisse les traiter et les analyser Un langage logique qui décrit, représente et relie des données à échanger sur le Web.

Un langage pour les machines Une grammaireRDF + HTTP + URIs Des vocabulairesRDFS / OWL ontologies Des règles d’écritureRDF/XML, N3, Turtle, RDFa Des moyens de communication SPARQL protocoles

Principe de base du RDF Toute chose ou ressource peut être décrite avec des phrases minimales composées : -d’un verbe -d’un sujet -et d’un complément Les URI servent à identifier ces ressources => c.à.d. en pratique, une URL

Exemple Darwin a écrit « L’origine des espèces » Sujet : Charles Darwin Sujet Verbe : a écrit Prédicat Complément : « L’origine des espèces » Objet Les 3 éléments sujet – prédicat – objet constituent un TRIPLET

RDF : une syntaxe sujet prédicat objet Le SUJET est toujours une URI. Toute « chose » sur laquelle on veut faire des assertions (SUJET) doit avoir une URI. Les « choses » ont toujours un type : une CLASSE. Le PRÉDICAT est toujours une URI. Il permet d’exprimer les PROPRIÉTÉS des « choses », ou les RELATIONS des « choses » entre elles. L’OBJET peut être un texte (LITTÉRAL) ou une URI. Les CLASSES et les PROPRIÉTÉS sont déclarées dans des VOCABULAIRES (ou « ONTOLOGIES ») pour être réutilisées.

Traduction en RDF Sujet : « L’origine des espèces » Sujet Verbe : a pour auteur Prédicat Complément : Charles DarwinObjet Pour un humain : Pour un logiciel de bibliothèque : Sujet : PPN (par ex.)Sujet (titre contenu dans le 200$a) Verbe : 700 #1‎$ ‎$4070 Prédicat Complément : $ Objet (PPN = autorité de Charles Darwin) Pour n’importe quelle machine : Sujet : Sujet Verbe : Prédicat (ou marcrel:aut) Complément : Objet (et pour le titre : dc:title « L’origine… »)

La notion de graphe Chaque ressource représentée par une URI peut faire l’objet de nouvelles assertions ‖ devenir le sujet de nouveaux triplets L’ensemble des triplets, reliés les uns aux autres par les URI qu’ils ont en commun, constitue un graphe

Exemple de graphe est né à est un a créé est une représente est mort à est contemporain de est né à est conservée à est situé à 1840 est né en 1850 est mort en

LES DONNÉES DU SUDOC EN RDF

La première brique: identifier Des URL pérennes pour les ressources – Sudoc : Construite sur le PPN de la notice – Idref : Construite sur le PPN de la notice Des sitemaps pour parcourir les notices Permet aux moteurs de recherche d’identifier des ressources

L’exposition du Sudoc Exposition des données depuis juillet 2011 Deux sorties : – Du Schéma.org en html Données minimales promues par les principaux moteurs : concession aux moteurs de recherche – Page en RDF/XML Générée « à la volée » : pas (encore) de base de données en RDF Conversion encore partielle

Exemple

En RDF/XML, ça donne quoi ? Données relatives à la notice Données relatives au document (Book) Auteurs (liens IdRef) Accès :

Ce qu’on pourrait voir en plus dans un Sudoc FRBRisé : URI Oeuvre : URI Expression (≈ Manifestation) frbrer:P2001 : is realized through ou (RDA) rdabrbr1:expressionOfWork frbrer:P2005 : is exemplified by ou (RDA) rdafrbr1:manifestationExemplified Autre manifestation de la même expression Autre expression de la même oeuvre rdafrbr1:workManifested (œuvre manifestée = raccourci RDA) URI Item frbrer:P1023 : is embodied in ou (RDA) rdabrbr1:expressionManifested

Un début de FRBRisation : exemple d’une thèse NNT

Un essai de moissonnage du Sudoc : Sindice Agrégateur de contenu RDF – Au départ projet universitaire : National University of Ireland (Galway), DERI (Digital Enterprise Research Institute, Irlande), Fondazione Bruno Kessler (Italie) et Openlink Software (USA). Moissonne les notices du Sudoc depuis 2011 Depuis novembre 2012 récupère les « dumps »  La totalité du Sudoc est interrogeable en SPARQL Interface de recherche par formulaire Sparql endpoint (Virtuoso) :  permet d’interroger les données en RDF et de les exporter

Sindice Exemple de requête SPARQL : récupérer des ppn à partir d’un titre Résultat

DU RDF partout à l’Abes… Dans Theses.fr Dans Calames  Moissonnés par le portail Isidore Le hub de métadonnées  RDF comme pivot pour stocker tous les formats Le projet de recherche Qualinca (en cours)  Travail sur la qualité des liens entre notices bibliographiques et d’autorités  Algorithmes basés sur une modélisation en RDF (ontologie FRBRoo)

EN RÉSUMÉ L’exposition des données est un enjeu de la FRBRisation Le RDF est pour cela privilégié car : – C’est un standard officiel et libre du web – Il est souple et ouvert Aujourd’hui : – Les modèles sont encore balbutiants – la FRBRisation de l’existant reste problématique, En RDF comme en Marc Demain : – Vers des modèles de données plus riches et mieux structurés – Du FRBR, enrichi : FRBRoo ? – Un jour, du RDF en production ?

Se former à FRBR Demandez à votre CFCB ou établissement l’organisation d’une formation labelisée « Groupe RDA en France ». Coordonnées des formateurs sur la page « Se former »