Sandrine Lagore – Nadia Raïs

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

Définitions Analyse documentaire
Web de données et RDA.
LE CATALOGAGE DC - Bibliothèque Départementale des Yvelines.
W3Line | 10 Ter, Rue Pasteur – BOURG LES VALENCE | Tél. : – Fax : | – Web :
Projet ORI-OAI Réseau de portails OAI Printemps dUNIT 24 mai 2007.
La diffusion des métadonnées de la thèse
XML - Henry Boccon-Gibod 1 XML, Langage de description La question du choix de formalismes Les entités et leur représentations modalités de modèles et.
Les espaces de nommage XML par Philippe Poulard 1
Documentation numérique sur l’Internet
Educasources Paris, le 30 janvier 2007 Paris, le 30 janvier 2007.
2 Nos catalogues sont régis par des règles qui datent des années 1960/70 Principes de Paris 1961 Points daccès ISBD Description bibliographique.
1 Comprendre et s'approprier les évolutions du catalogage en bibliothèque Journée dinformation Média Centre-Ouest 13 novembre et 6 décembre 2012 Emilie.
RDA en France : quelles orientations ? Réunion du Groupe stratégique, 25 mars 2011 Deuxième réunion de travail sur l'application de FRBR, FRAD et RDA dans.
Rapport au Groupe stratégique Réunion du 16 novembre 2011 Groupe technique sur ladoption de RDA en France.
Emilie Liard / Véronique Lacan
Quest-ce que RDA ? RDA = Ressources : Description et Accès –Ressources couvrir tous les types de ressources –en particulier les ressources électroniques.
Le modèle FRBR Functional Requirements for Bibliographic Records
Quest-ce que RDA ? RDA = Ressources : Description et Accès –Ressources couvrir tous les types de ressources –en particulier les ressources électroniques.
Le modèle FRBR Functional Requirements for Bibliographic Records
Aline Locker – Frédéric Puyrenier
Médiathèque de la Cité de la musique, Paris - France
De nouveaux modèles de données pour les catalogues de bibliothèques Médiathèque de la Cité de la musique, Paris - France Patrice Verrier, Coordinateur.
La Rochelle – 11 avril 2013 Marie-Line Guillaumée (BIU Sorbonne)
Domaines nominaux XSLT
Métadonnées pour les thèses numériques françaises
Initiation au système d’information et aux bases de données
Nouvelles Pratiques des catalogues. Rendre les données plus utiles sur le web. Publier des pages HTML sur lesquelles les utilisateurs et les moteurs de.
Le Téléphone Russe Le Téléphone Russe. Le Téléphone Russe Le Téléphone Russe.
Construire une base de données bibliographiques Elaborer un site web
Etude des Technologies du Web services
Intégrer IdRef dans les applications documentaires de votre université. Pourquoi ? Comment ? Atelier JABES2011.
3e Rencontre internationale dutilisateurs dUNIMARC enssib, 31 mars 2010 Les produits et services bibliographiques de la Bibliothèque nationale de France.
XML-Family Web Services Description Language W.S.D.L.
Initiation à la conception de systèmes d'information
Traitement des ressources multimédias multisupports
Web Sémantique: Le Relief Actuel
B2i Lycée Circulaire BO n°31 du 29/08/2013.
Lycée Louis Vincent Séance 1
III. Modèles FRBR et FRAD
Les FRBR et l ’évolution des règles de catalogage
Le Travail Collaboratif ...
RDF(S)
Recherche Documentaire et traitement de l’information
Comprendre l’évolution des catalogues et des règles de catalogage : enjeux, Web de données, FRBR, RDA Journée d’information Médiadix – 6 mars 2014 Marie-Line.
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
Chercher et trouver Module 1 Déroulement : Souhaiter la bienvenue
Web sémantique : Web de demain
Initiation aux bases de données et à la programmation événementielle
Catalogage de données Notions, enjeux et initiatives actuelles.
SUDOC (le catalogue des ouvrages, des thèses et des périodiques des bibliothèques françaises) Contenu Le catalogue du Système Universitaire de DOCumentation.
La veille numérique : un outil pour s'informer intelligemment &
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
II. Participer au Web de données
L’ ACCESSIBILITE « C’est mettre le Web et ses services à la disposition de tous les individus, quels que soient leur matériel ou logiciel, leur infrastructure.
Web sémantique Par Lydia Carine Mampais KI Bamba SISSOKO
Mediadix – Novembre 2013 Marie-Line GUILLAUMEE (BIU Sorbonne)
Mastère Professionnel Systèmes de Communication et Réseaux
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Web sémantique est pratique documentaire
Soutenance du mémoire de synthèse
Interaction Homme Machine
Introduction à la Programmation Orientée Objet
Catherine Serres – Frédéric Puyrenier
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
INTRODUCTION AUX BASES DE DONNEES
Introduction Module 1.
Parcours FRBR 3 : format RDF et FRBRisation Le « J.e-cours » va bientôt commencer, merci de votre patience…… Merci de désactiver votre micro : - Repérer.
Préparé par : Marouane FELJA
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Transcription de la présentation:

Sandrine Lagore – Nadia Raïs Modélisation de l’information bibliographique et nouveau code de catalogage : FRBR, FRAD, RDA Médiadix -16 novembre 2012 Sandrine Lagore – Nadia Raïs Version adaptée des supports développés par Françoise Leresche et Patrick Le Bœuf (BNF)

Programme Les enjeux Evolution des pratiques des utilisateurs Enjeux liés au Web Participer au Web de données Architecture du Web Standards du Web de données : URI, RDF Modèles FRBR et FRAD Notion de modèle conceptuel FRBR : entités, attributs et relations FRAD : entités, attributs et relations Présentation de RDA Objectifs et Organisation générale Cataloguer avec RDA Scénarios d'implémentation Limites de RDA Autour de RDA RDA en France 2

ou Pourquoi vouloir tout changer quand tout allait si bien ?... I. Les enjeux ou Pourquoi vouloir tout changer quand tout allait si bien ?...

Tableau On avait notre ISBD… … nos normes AFNOR… … nos formats MARC… … notre SIGB… Où était le problème ? ISBD intégré depuis 2011 qui prend en compte tous les types de documents Pensez à parler du babel MARC (LCMARC, MARC, DKMARC etc.)

Ombres au tableau Catalogues dans le « Web profond »  il faut y aller exprès « Dis, Madame, comment on cherche dans ton catalogue ? » L’utilisateur : « Je veux tout, tout de suite, sans effort. » Le catalogue : « Votre requête ramène 614 réponses. Bonne chance. » Catalogues de bibliothèques n’émergent pas en premier quand on fait une recherche : il faut y aller exprès ! Une recherche sur une œuvre a de fortes chances de donner en 1er Amazon

Aurez-vous la patience d’aller jusqu’à la 62ème page

Source : Sylvain Machefert Voir l’étude icrossing.com “The importance of page-one visibility” http://www.icrossing.com/sites/default/files/page-one-visibility.pdf (site consulté le 3/12/2012) Source : Sylvain Machefert

Source : Sylvain Machefert

Le « syndrome Google » On n’a plus l’habitude de chercher par index Les recherches par mots dans nos catalogues ramènent trop de réponses classées de manière plus ou moins anarchique Nos catalogues doivent évoluer pour mieux cibler

Par exemple…

Par exemple encore…

Bien présenter data. bnf Bien présenter data.bnf.fr comme expérience de frbérisation d’une partie du catalogue amenée à se développer et à se perfectionner ce n’est aucun casbien sûr le remplacement du catalogue général

Ou encore Voir le catalogue collectif ciné-ressources http://www.cineressources.net/recherche_t.php

« Super » Notice d'autorité « nom de personne » C'est pas merveilleux, Cette page de résultats ?!

Ombres au tableau (suite) La recherche d’info, aujourd’hui, pour beaucoup de gens, c’est le Web… Le Web ne parle pas MARC Le Web a ses propres normes Le Web ne fréquente pas les fournisseurs de SIGB Le Web concerne tout le monde Le Web suit son évolution propre… vers le Web sémantique

Enjeux liés au Web Pourquoi changer Adopter les standards du Web sémantique pour sortir de notre « niche » technologique pour avancer du même pas que les autres pour que la maintenance de nos catalogues coûte moins cher But : dans un souci économique utiliser des outils qui ne soient pas spécifiquement développés pour les bibliothèques

Enjeux liés au confort des utilisateurs Pourquoi changer ? Adopter les standards du Web de données pour sortir nos catalogues du Web invisible Modifier la structure de l’information bibliographique pour adapter nos catalogues aux besoins des utilisateurs et à leurs nouvelles pratiques de recherche pour mieux structurer les résultats d’une recherche simple

Enjeux liés au confort des bibliothécaires Pourquoi changer ? Adopter les standards du Web de données pour récupérer des données produites ailleurs Modifier la structure de l’information bibliographique pour ne pas avoir à répéter indéfiniment les mêmes informations quand une œuvre est souvent éditée pour harmoniser l’information fournie exemple : Toujours dans une logique de partage des tâches

Ce que montre surtout cet exemple c’est la notion de « strates » dans les ctalogues à la BnF :…

Une indexation-matière recréée pour chaque notice L’accès par sujets à l’oeuvre devient très aléatoire. Il serait plus cohérent de faire l’indexation matière au niveau de la notion d’oeuvre plutôt que de la notice des différentes éditions … et dans le SUDOC :

Enjeux liés au confort de ….?.... Pourquoi changer ? Adopter les standards du Web de données et créer des « Données liées ouvertes » pour que n’importe qui puisse réutiliser n’importe lesquelles de nos données de n’importe quelle manière

En bref Répondre aux attentes des utilisateurs d’aujourd’hui permettre à des utilisateurs extérieurs de récupérer les infos qui les intéressent, et seulement celles-là Aller vers une granularité plus fine de l’information bibliographique : des « notices » aux « données » permettre à chacun de récupérer et d’exploiter le niveau d’information qui l’intéresse Mettre les données à disposition des utilisateurs… … là où sont les utilisateurs Participer au Web de données On « dynamite » la notice en données élémentaires combinables à souhait par les utilisateurs. On ne peut plus penser que les utilisateurs viennent dasn les catalogues c’est à nous de les rendre accessibles dans les nouvelles plateformes d’échanges (Réseaux sociaux etc.)

... mais changer au profit de quoi ??? Bon. Changer, OK. ... mais changer au profit de quoi ???

Zoom arrière Nos standards actuels s’appuient sur des outils datant des années 1960 Principes de Paris : 1961 Format MARC : 1967-1969 ISBD : 1969-1971 C’est-à-dire l’époque de la prédominance : des catalogues sur fiches des contenus textuels imprimés

Au tournant du siècle : l’IFLA secoue le cocotier ! Modélisation de l’information bibliographique FRBR (Functional Requirements for Bibliographic Records) publiés en 1998 FRAD (Functional Requirements for Authority Data) publiés en 2009 Nouveaux principes de catalogage PIC (Principes internationaux de catalogage) publiés en 2009 En profiter pour « faire la pub. » des onglets professionnels de la BnF de la BPI, et du site de l’ABES

Et maintenant… Juin 2010 : publication de RDA (Resource Description and Access) 31 mars 2013 : la Bibliothèque du Congrès n’appliquera plus que RDA http://www.loc.gov/catdir/cpso/news_rda_implementation_date.html Courant 2013 : au tour des bibliothèques nationales du Royaume-Uni, d’Australie, du Canada et d’Allemagne

Et maintenant… (bis) Mai 2011 (Library of Congress) : lancement de Bibliographic Framework Transition Initiative (réflexion sur le format futur des échanges d’information bibliographique) abandon du format MARC (d’ici 10 ans ?) création d’un nouveau format aussi robuste que MARC plus apte à exprimer le modèle FRBR mieux adapté aux technologies du Web (XML, RDF…)

En bref Changer… notre manière de structurer l’information bibliographique : FRBR, FRAD nos règles de catalogage : RDA ?? notre format de catalogage : [euh… là, c’est l’inconnu] … pour aller sur le Web de données ! [au fait, c’est quoi, le Web données ?...] Bien différencier si besoin modèles, normes de catalogage, codes de catalogage et formats RDA est bien une évolution du code de catalogage

II. Participer au Web de données … en utilisant les technologies du Web sémantique

Architecture du Web (1) World Wide Web : toile d’araignée de serveurs d’informations reliés les uns aux autres par des liens physiques (le réseau matériel) et des liens logiques (les liens hypertextes) Architecture du Web : infrastructure technologique définie par des standards Standardisation de l’architecture du Web assurée par un organisme, le W3C (World Wide Web Consortium) Les objectifs du W3C Accessibilité pour les logiciels et machines Interopérabilité et portabilité Compatibilité Pérennité des documents Production de contenu Web facilitée Réduction du volume des pages Validation des pages par des services de validation Cohérence et qualité du code garanties Meilleure indexation par les moteurs de recherche Visibilité accrue Accessibilité universelle aux contenus

Architecture du Web (2) Repose sur 3 technologies : Un protocole : HTTP (Hypertext Transfer Protocol) Un langage : HTML (Hypertext Markup Language) Standard défini par le W3C pour la diffusion de documents sur le Web pour pouvoir afficher de l'information à l'aide de balises dont le nombre est limité. Il est interprété par le navigateur Des identifiants : URI (Uniform Resource Identifier) Une ressource : tout objet Ressource identifiées de manière univoque par une URI : chaîne de caractères normalisée permettant d'identifier de manière permanente une ressource abstraite ou physique, accessible ou non sur Internet (personne, organisme, lieu, évènement, concept, …) On distingue 2 types de ressources : les ressources informationnelles : ressources dont on peut obtenir une représentation via HTTP, comme une page web ou une image les ressources non-informationnelles : ressources dont on ne peut pas obtenir de représentation via HTTP mais sur lesquels on va diffuser des informations (ex. : un monument, un lieu, un concept)

Les URI 2 déclinaisons : URN (Uniform Resource Name) URI d’identification d’une ressource par son nom unique dans un espace de noms Utilisé pour identifier une ressource sans s’occuper de son emplacement ou de la manière de la référencer Exemple : urn:isbn:978-2-10-057294-6 = URI de référence à une publication URL (Uniform Resource Locator) URI spécifiant l'adresse physique de localisation d'une ressource sur Internet et la méthode permettant d'y accéder = URI donnant accès à la ressource Ce sont surtout les URL qui sont utilisés sur le réseau Internet. Exemples d’autres applications de la notion d’URI dans le « monde réel » ISBN, code barre 32

Évolutions du web Web 1.0  web de documents permet aux usagers de naviguer facilement sur Internet en utilisant des liens hypertexte une page = un document format : HTML (HyperText Markup Language) ne permet que la mise en forme Web 2.0  web collaboratif évolution du Web du point de vue des technologies employées et des usages Internet n’est plus simplement un media mais une plate-forme de services et d'applications en ligne Permet aux internautes d'interagir sur le contenu des pages et de dialoguer entre eux Web 2.0 : Le développement d’interfaces plus riches et assistées L’offre d’outils accessibles en ligne : : suites bureautiques en ligne (Google Docs, Zoho, …), d’outils de gestion de projet (Basecamp , …), de calendrier partagé (Google Calendar, …) Des plates-formes éditoriales avec le développement des CMS Des plates-formes collaboratives : Wikis, agendas collaboratifs La syndication de contenus avec les flux RSS Les communautés de partage : systèmes de publication d’objets numériques dans un espace personnel (ex. :Youtube, Flickr, Picasa, …) Les réseaux sociaux : construction de réseaux d’affinité pour créer un profil en ligne, échanger avec son réseau de contacts, promouvoir son activité (Facebook, Linkedin, Viadeo, …)

Le Web de documents Documents Données Base de données Hyperlien Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

Limites du Web de documents HTML : langage textuel d’échange de documents semi-structurés Les données sont cachées sous les pages HTML (« web profond ») Seules les pages HTML sont liées entre elles Les pages HTML sont faites pour les humains Ce que veulent les machines : des données structurées = utilisable directement par un ordinateur pour effectuer un calcul car elles se complètent les unes les autres car les liens permettent de naviguer et de découvrir avec des liens qualifiés, signifiants au-delà du « voir aussi » des hyperliens

Le web de données ? Web de données ou Linked Data ou Web of Data Mise sur le Web de données : Mouvement de l’Open Data Mise à disposition de données publiques ouvertes librement accessibles sans restriction de copyright, licence payante, brevet, … Données pouvant être réutilisées, reproduites, redistribuées librement et sans discrimination (cf. http://www.opendefinition.org/okd/) + Mise en relation des données pour construire un réseau global qui permet, à partir d’une donnée, d’accéder aux autres données liées du Web

Le Web de données ? Un Web constitué de données accessibles, structurées, dans un format non-propriétaire, identifiées et liées entre elles sémantiquement (Définition de Tim Berners-Lee dès 1999) Objectif : Mettre à disposition des données en utilisant des techniques standardisées qui garantissent l’interopérabilité : Web documentaire : relations par des liens entre des pages HTML Web de données : extension du Web permettant de relier non pas des documents (pages HTML) mais les données elles-mêmes et de les rendre interprétables par les machines Repose sur le standard URI = relations entre URI qui désignent tout objet décrit Volonté de relier des données isolées dans des « silos »

Le Web de données liées Documents Données Base de données Liens entre les bases de données Hyperlien Base de données Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

Le Web de données aujourd’hui Liens entre les données et transformation du Web en une gigantesque base de connaissances distribuée Le Web de données liées rejoint le Web de données ouvertes : mise à disposition en RDF de sources de données ouvertes

Pile des standards du Web sémantique - Standard URI pour nomme ce que l’on décrit - Standard RDF pour décrire les URI - Liens RDF vers d’autres URI pour fournir des données liées - Utilisation d’ontologies pour permettre l’interconnexion des différentes sources de données

RDF RDF = Resource Description Framework Standard permettant de décrire les ressources Web et métadonnées qui y sont associées Proposé en 1999 par le W3C Permet de décrire, représenter et relier simplement toute ressource du Web : page Web, image, video, personne, objet, évènement, produit, service, … tout ce qui peut être identifié par un URI peut être considéré comme une ressource Objectif : partager les métadonnées pour des ressources identiques par l’utilisation d’une syntaxe commune RDF fournit une structure de données standard et un modèle pour encoder des données et des métadonnées sur n’importe quel sujet sur le Web. Ces sujets sont appelés des ressources et sont identifiés par des URI

RDF : un modèle conceptuel (1) Principe de base : toute chose peut être décrite avec des phrases minimales composées d’un verbe, d’un sujet et d’un complément  déclaration RDF Exemple : Charles Darwin a écrit « On the origin of species » Sujet : Charles Darwin Ressource Verbe : a écrit Prédicat Complément : On the origin of sepcies Objet RDF est l’équivalent d’une grammaire pour le langage humain qui permet d’assurer l’ interopérabilité Le rôle joué par les mots dans le langage humain est joué par les URI en RDF Un URI désigne une ressource et une seule il n’y a pas d’ambigüités possibles

RDF : un modèle conceptuel (2) Modèle de données élémentaires constitué de 3 types d’objets : Ressource toute chose décrite par une déclaration RDF entité d’information identifiée par une URI Propriété caractéristique, attribut ou relation utilisé pour décrire une ressource Déclaration association d’une propriété à une ressource A partir d’une même publication une multitudes de liens sont possibles

RDF : la notion de triplet Une déclaration est composée de 3 éléments = triplet Triplet {sujet , predicat , objet} sujet = ressource prédicat = nom d’une propriété de la ressource (comme l’étiquette d’un champ dans une base de données) objet = valeur ressource liée ou caractéristique exprimée par une chaîne de caractères (= littéral) Exemple : Sujet (Ressource) : Honoré de Balzac Prédicat (Propriété) : Creator Objet (Valeur) : La Comédie humaine

RDF : Graphe La déclaration est représentée visuellement par un graphe (système de nœuds reliés par des flèches) qui permet de parcourir l'information de lien en lien SUJET OBJET PREDICAT Sujet = ressource sur laquelle porte la déclaration, et c'est toujours un indicateur de ressource uniforme (URI) Prédicat = nom d'une propriété de la ressource et c'est toujours une adresse URI Objet = valeur de cette propriété qui peut être une adresse URI ou un littéral (texte, nombre, date, etc.) En utilisant ce standard, les ressources Werb sont plus facilement accessibles pour les moteures de recherche. Objet : The origin of species Sujet : Charles Darwin Prédicat : A écrit = Creator

RDF : modèle de graphe (1) On construit ainsi un modèle de graphe L’objet d’un triplet peut être : Soit une ressource qui peut être le sujet ou l’objet d’autres déclarations Objet : The Origin of species Prédicat : A écrit Sujet : Charles Darwin Sujet : The origin of species Prédicat : Comprend Objet : An introduction on the origin of species

RDF : modèle de graphe (2) L’objet d’un triplet peut être : Soit un littéral = chaîne de caractères, nombre, date Sujet : Charles Darwin Objet : The origin of species Prédicat : A écrit Sujet : The origin of species Prédicat : Et né Prédicat : Comprend «1809» Objet : An introduction on the origin of species

Formalisme RDF Modèle permettant d’encoder toute donnée ou métadonnée Permet de décrire les relations entre les ressources Utilise le mécanisme des URI pour identifier les ressources décrites et représenter explicitement toute relation entre 2 ressources Permet de réaliser le Web de données : Éclatement de l’information Des données et pas des « documents » Plus de souplesse pour manipuler, sélectionner…

RDF : souplesse Cadre conceptuel de description des ressources applicable à n’importe quel domaine Permet de mélanger les vocabulaires Un modèle abstrait à représenter avec un langage concret Peut être exprimé en utilisant diverses syntaxes RDF/XML (eXtensible Markup Language) : seule syntaxe qui fait l’objet actuellement d’une recommandation du W3C RDF NTriples RDF Turtle RDFa : syntaxe pour injecter du RDF dans une page Web Peut s’appliquer à n’importe quel domaine. On est très loin du format MARC réservé aux bibliothèques. Dans les notations, RDFa est également à retenir : permet de mettre du sens dans des pages Web en HTML et notamment de permettre l’extraction de données d’une page : par exemple indication des données Titre et Auteur d’un livre dans une page de catalogue de bibliothèque en ligne

RDF : extensibilité RDF rend les données extensibles Plus besoin de tout dire sur une ressource, une personne, etc. Possibilité d’ajouter une nouvelle déclaration sur une nouvelle ressource ou une ressource déjà publiée pour compléter l’information Recensions, commentaires, etc. Données commerciales, etc. Dictionnaires biographiques, etc. Prendre l’exemple des notices d’autorité dans les catalogues de bibliothèque

Un Web de données … Modèle de données : RDF Modèle universel de représentation, d’échanges et d’interconnexion de métadonnées Langage d’interrogation : SPARQL Simple Protocol And RDF Query Language Langage de requête sur les graphes RDF permettant de spécifier le type de données recherchées Format XML pour représenter les résultats d’une requête SPARQL permet d’interroger les données telles qu’on les a modélisées Première phase du déploiement du web sémantique

… et un Web sémantique Objectif : s’assurer de l’interprétation et de l’utilisation des données Publier avec les données leurs schémas ou vocabulaires Schéma (ou ontologie) Document formel expliquant les catégories de ressources, leurs relations, avec leur sens, la structure et les contraintes associées Exemples : Foaf pour la description d’un profil utilisateur Dublin Core pour la description (simple) d’une ressource ISBD pour la description bibliographique RDF permet de raisonner sur les données, pour les enrichir ou contrôler leur cohérence

Web de données et Web sémantique Web de données : possibilité de relier et d’échanger des données au moyen d’URI Web sémantique : possibilité d’échanger les schémas des données et la sémantique associée Objectif : permettre aux machines de comprendre la sémantique, la signification de l’information sur le Web Selon Jean Delahousse (Knowledge Consult) : « le web sémantique est d’abord un drapeau fédérateur pour les recherches, les standards et les outils. Le Web de données est une application concrète que ce soit en termes de données disponibles ou de nombre d’applications reposant sur ces données. »

Et pour les bibliothèques : Que peut apporter le Web de données ? Relier les catalogues des bibliothèques avec d’autres données existantes Ouverture à d’autres communautés (libraires, éditeurs, …) Plus de visibilité par les moteurs de recherche Navigation par les utilisateurs sans avoir à connaître les formats des bases de données et les langages de requête spécifiques Tirer parti des données structurées des catalogues et des référentiels Interopérabilité  Souplesse pour la réutilisation des données Bien penser ici à rajouter des infos sur l’interopérabilité dire qu’un référentiel Général d'Interopérabilité (RGI) a été élaboré pour décrire l’ensemble des normes et bonnes pratiques communes aux administrations publiques françaises dans le domaine informatique. La même préoccupation existe au niveau européen, avec l'EIF (European Interoperability Framwork) Différencier Interopérabilité et compatibilité

Catalogues de bibliothèques en ligne : une histoire par étapes (1) Publication du catalogue (OPAC) Formulaires de recherche : combinaison de critères Interfaces / machine assez complexes Web invisible : catalogues non indexés par les moteurs de recherche Portails permettant un accès fédéré à des bases de données différentes : Interopérabilité informatique des systèmes OBDC, Z3950, SRU/SRW, API, … Une volonté : pouvoir échanger des flux d’informations Une réalité : des systèmes rigides et fragiles car dépendants de la structure des bases de données 55

Bases de références documentaires

Catalogues de bibliothèques en ligne : une histoire par étapes (2) OAI-PMH Open Archives Initiative – Protocol for Metadata Harvesting Moissonnage en récupérant des métadonnées Utilisation des protocoles et standards du Web Mais : Format de métadonnées Dublin Core réducteur (15 éléments) Possibilité de requêtes limitées (6 verbes OAI-PMH) Limitation à l’échange de métadonnées Aller vers le Web de données … Interopérabilité entre données Utiliser naturellement le Web pour échanger des données Le Web passe du statut de base documentaire à celui de base de données 57

Comment y arriver ? Des données structurées Des vocabulaires normalisés éléments de métadonnées listes de valeurs Des identifiants pérennes : URI pour désigner les ressources pour exprimer les relations entre les données Une syntaxe normalisée : RDF (Resource Description Framework)

Des données structurées On sait déjà structurer l’information dans les bibliothèques. 003 = Identifiant pérenne de la notice

000 cam 22 3 450 001FRBNF42226398000000X 003http://catalogue. bnf 000 cam 22 3 450 001FRBNF42226398000000X 003http://catalogue.bnf.fr/ark:/12148/cb42226398b 010 $a978-2-603-01444-8$brel. 100 $a20100624d2005 m y0frey50 ba 1011 $afre 102 $aFR 105 $a||||z 00||| 106 $ar 2001 $aGuide des chenilles d'Europe$bTexte imprimé$eles chenilles de plus de 500 espèces de papillons sur 165 plantes hôtes$fD.J. Carter$g[ill.] B. Hargreaves 210 $aParis$cDelachaux et Niestlé$dDL 2005 215 $a1 vol. (311 p.)$cill.$d20 cm 2252 $aˆLes ‰guides du naturaliste 300 $aBibliogr. p. 301-303 410 0$034235813$tˆLes ‰Guides du naturaliste$x1022-2707$d2005 454 1$tField guide to caterpillars of butterflies and moths in Britain and Europe 606 $312000511$aChenilles$311931301$yEurope$311975688$xGuides pratiques et mémentos$2rameau 676 $a595.781 39$v22 700 1$312013664$aCarter$bDavid$f1943-....$4070 702 1$312367696$aHargreaves$bBrian$4440 801 0$aFR$bFR-751131015$c20100624$gAFNOR$2intermrc http://catalogue.bnf.fr/ark:/12148/cb34235813n On a déjà des identifiants dans les notices qu’on sait exprimer sous la forme d’une URI. 003 = Identifiant pérenne de la notice 410 = référence à la collection 700 = responsabilité principale 702 = responsabilité secondaire Et on va pouvoir systématiser cela. http://catalogue.bnf.fr/ark:/12148/cb120136648 http://catalogue.bnf.fr/ark:/12148/cb12367696d

Des URI pour désigner les ressources http://catalogue.bnf.fr/ark:/12148/cb42226398b Guide des chenilles d'Europe / D.J. Carter ; [ill.] B. Hargreaves . - Paris : Delachaux et Niestlé, DL 2005 http://catalogue.bnf.fr/ark:/12148/cb34235813n Les Guides du naturaliste Carter, David (1943-....) http://catalogue.bnf.fr/ark:/12148/cb120136648 Hargreaves, Brian http://catalogue.bnf.fr/ark:/12148/cb12367696d

Des vocabulaires normalisés Pour exprimer les relations entre les données 2001 $aGuide des chenilles d'Europe 700 1$312013664$aCarter$bDavid$f1943-.... $4070 200 $a Titre propre DC : Title ISBD : Title proper RDA : Title proper 700 $4070 Auteur du texte DC : Creator RDA : Creator RDA : Author

Des URI pour exprimer les relations (1) Les vocabulaires normalisés sont en cours de déclaration pour être utilisés dans le monde du Web de données. C’est un registre validé par le W3C

Des URI pour exprimer les relations (2) DC : Title http://purl.org/dc/elements/1.1/title ISBD : has title proper http://iflastandards.info/ns/isbd/elements/P1004 RDA : Title proper http://rdvocab.info/Elements/titleProper DC : Creator Les relations ont également des URI et on les utilise pour exprimer des Predicat http://purl.org/dc/elements/1.1/creator RDA : Author http://rdvocab.info/roles/author  

Une syntaxe normalisée Le sujet est toujours une URI Le prédicat est toujours une URI L’objet peut être un texte (« littéral ») ou une URI 2001 $aGuide des chenilles d'Europe Cet ouvrage RDF sujet sujet a pour titre propre prédicat verbe complément d’objet "Guide des chenilles d'Europe" objet http://catalogue.bnf.fr/ark:/12148/cb42226398b http://iflastandards.info/ns/isbd/elements/P1004 "Guide des chenilles d’Europe"

Un réseau de relations entre des données "Guide des chenilles d’Europe" http://iflastandards.info/ns/isbd/elements/P1004 A pour titre propre http://xmlns.com/foaf/0.1/familyName A pour patronyme "Carter" http://rdvocab.info/roles/author   A pour auteur http://catalogue.bnf.fr/ark:/12148/cb42226398b "David" http://xmlns.com/foaf/0.1/givenName A pour prénom http://catalogue.bnf.fr/ark:/12148/cb120136648 http://rdvocab.info/RDARelationshipsWEMI/containedInManifestation Appartient à http://rdvocab.info/ElementsGr2/dateOfBirth A pour date de naissance 1943 http://data.bnf.fr/what-happened/date-1943 http://iflastandards.info/ns/isbd/elements/P1033 A pour titre clé http://catalogue.bnf.fr/ark:/12148/cb34235813n "Les Guides du naturaliste"

Les bibliothèques dans le Web de données aujourd’hui 67

http://richard. cyganiak http://richard.cyganiak.de/2007/10/lod/lod-datasets_2011-09-19_colored.html http://richard.cyganiak.de/2007/10/lod/lod-datasets_2011-09-19_colored.html

Des exemples Isidore : http://www.rechercheisidore.fr Plateforme de recherche permettant l’accès aux données numériques des sciences humaines et sociales Données en accès libre (open access) Moissonnage ciblé des métadonnées et données scientifiques structurées Enrichissement des métadonnées selon les principes du Web de données

Des exemples Data.bnf.fr : http://data.bnf.fr Fiches descriptives des auteurs et des oeuvres Possibilité de télécharger le RDF associé à la fiche descriptive 70

Y aller … avec les bons outils Pour utiliser la boîte à outils du Web sémantique, il faut Identifier les données Construire un réseau de relations entre ces données De quel outil disposons-nous pour analyser les relations entre les données au sein des catalogues de bibliothèques ? 71

III. Modèles FRBR et FRAD ou : Comment représenter tout un catalogue dans un seul schéma ?

Qu’est-ce qu’un modèle conceptuel ? Une représentation abstraite et simplifiée d’une activité : les catégories d’objets (« entités ») concernées par cette activité (incarnées dans des « instances ») les attributs caractérisant ces « entités » les relations entre ces « entités »

Exemple : Instance Entité Attributs Relation instance = {le présent cours} Cours Salle dans intitulé cursus… pendant Tranche horaire date heure de début heure de fin… numéro capacité… instance = {ici} suivi par instance = {maintenant} donné par Enseignant Stagiaire nom affiliation… nom affiliation… instance = {moi} instance = {vous}

Que trouve-t-on dans une notice ?

Des informations sur un exemplaire physique

Des informations sur un produit éditorial

Des informations sur le contenu de ce produit

Des informations destinées à mettre ce contenu en relation avec d’autres produits éditoriaux au contenu « analogue »

Tout ça dans une seule notice...

L’activité de catalogage Que fait-on, quand on catalogue ? On commence par examiner un objet matériel…

L’activité de catalogage … On extrapole les caractéristiques de la publication à laquelle il appartient… Publication Publication Publication Publication Bien expliquer qu’on va déjà naturellement d’un document à un type de document

L’activité de catalogage … On cherche si le contenu intellectuel de cet objet est en relation directe avec le contenu intellectuel d’autres objets Exemple : traduction / texte original Si c’est le cas, on explicite cette relation Exemple : titre original suivi du nom de la langue de traduction Famille de contenus Contenu Contenu Publication Publication

FRBR : un 1er groupe d'entités Item Ce livre est en usuel en salle de lecture Ce livre a été publié par Flammarion en 1992 Ce livre est accessible à un public francophone Ce livre a révolutionné notre vision du vivant un objet matériel Manifestation un produit défini par des caractéristiques communes en termes de contenu, d’aspect physique et de circonstances de production Expression un contenu textuel spécifique Œuvre FRBR = Functional requirement for bibliographic records un contenu conceptuel accessible via divers contenus textuels

FRBR : en tout, 3 groupes d'entités un qui correspond à la notice catalographique (ISBD + données d'exemplaire) deux qui correspondent aux points d’accès Groupe 1 Groupe 2 Groupe 3

Les entités du Groupe 1 Origin… (français). Flammarion 1992. 570.903 092 DARWo Œuvre Expression Manifestation Item

Les entités du Groupe 2 Origin… (français). Flammarion 1992. 570.903 092 DARWo a conçu a réalisé a produit possède Charles Darwin D. Becquemont E. Barbier Flammarion BnF. Département Sciences et techniques Personne Collectivité

FRBR : un 3e groupe d’entités Œuvre C’est à quel sujet ? Lieu Concept Groupe 1 Ex. : chenilles Ex. : Europe (œuvre, expression, manifestation, item) Événement Groupe 2 Objet (personne, collectivité) Ex. : Guerre de 14 Ex. : sonde Curiosity

FRBR : les attributs des entités Attributs = caractéristiques des instances de chaque entité Œuvre titre de l’Œuvre date de l’Œuvre forme de l’Œuvre etc. Manifestation titre propre mention de responsabilité édition lieu de publication éditeur commercial date de publication présentation matérielle etc. Expression titre de l’Expression date de l’Expression forme de l’Expression langue de l’Expression etc. Item localisation provenance état matériel etc.

FRBR : les relations Œuvre Expression Manifestation Item réalisée dans Expression matérialisée dans Manifestation exemplifiée par Entités Groupe 1 Item Relations structurelles au sein du Groupe 1 Cohésion de la notice catalographique

FRBR : les relations Personne Œuvre Collectivité Expression créée par Personne Œuvre réalisée par Collectivité Entités Groupe 2 Expression produite par Manifestation possédé par Entités Groupe 1 Item Relations Groupe 1 / Groupe 2 Relations de responsabilité

FRBR : les relations Personne Concept Œuvre Collectivité Objet est au sujet de Personne Concept Œuvre Collectivité Objet Entités Groupe 2 Expression Événement Lieu Entités Groupe 3 Manifestation Entités Groupe 1 Item Relation Œuvre / Groupes 1, 2 et 3 Relation de sujet

FRBR : les relations Œuvre Expression Manif. Item relié intellectuellement à fait partie de Ave Maria (Schubert) 7 mélodies tirées de la Dame du lac, op. 52 (Schubert) La Dame du lac (Walter Scott) Œuvre met en musique met en musique Expression Texte anglais Traduction allemande (Adam Storck) Notation de l'édition princeps de 1826 reproduit présentation alternative Édition brochée Édition reliée Édition de 1826 Num. par l'Université de Harvard Manif. reproduit reproduit Exemplaire coté 8/49d Microforme Exemplaire coté Merritt Mus 800.1.711.15 PHI Item

Relations Œuvre / Expression Relation intellectuelle Tout / Partie Œuvre Œuvre Œuvre Tout / Partie Expression Expression Expression Relations intellectuelles

Relations intellectuelles DEV 10 - 18 juin 2012 95

FRBR : les relations Œuvre Expression Manifestation Item intellectuellement en relation avec est une partie de Expression intellectuellement en relation avec intellectuellement en relation avec est une partie de présentation alternative de Manifestation reproduit est une partie de reconfiguration de Entités Groupe 1 Item reproduit reproduit est une partie de Relations au sein du Groupe 1 autres que les relations « structurelles »

Autour du modèle FRBR 1990 (séminaire de Stockholm) : commande d’une étude visant à évaluer scientifiquement les fonctions d’un catalogue (objectif : réduire les coûts) 1992 : constitution d’un groupe d’étude IFLA 1997 : approbation du Rapport final sur les fonctionnalités requises des notices bibliographiques (publié en 1998) le modèle FRBR n’en est qu’une partie  Qu’y a-t-il d’autre dans ce Rapport ?

Le Rapport final sur les Fonctionnalités requises des notices bibliographiques (1) Objectifs : Définir les fonctions des notices bibliographiques en prenant en compte les différents types de documents et de supports les différentes utilisations les différents besoins des utilisateurs Formuler des recommandations sur le niveau minimal d’une notice bibliographique nationale pour réduire les coûts de catalogage tout en répondant aux besoins essentiels des utilisateurs

Le Rapport final sur les Fonctionnalités requises des notices bibliographiques (2) Moyens : Définir quatre « tâches utilisateur » (user tasks) correspondant à ce que l’on est présumé vouloir faire quand on consulte un catalogue de bibliothèque Évaluer la pertinence par rapport à ces « tâches utilisateur » : de chaque attribut défini pour chaque entité et de chaque relation les plus pertinents doivent figurer dans les notices produites par les agences bibliographiques nationales les autres peuvent être rendus optionnels

Les « tâches utilisateur » FRBR : tâches utilisateur sur les données bibliographiques trouver les ressources correspondant à une recherche identifier confirmer que la ressource trouvée correspond bien à la recherche distinguer entre des ressources analogues sélectionner entre des ressources analogues, choisir celle qui correspond à ses besoins obtenir avoir accès à une ressource

Après le modèle FRBR 1999 : création d’un autre groupe de travail pour étendre le modèle FRBR aux données d'autorité 2009 : publication du Rapport final sur les fonc-tionnalités requises des données d’autorité (FRAD, Functional requirements for authority data) le modèle FRAD n’en est qu’une partie Tous ces rapports sont disponibles sur le site de la BnF

Le Rapport final FRAD (1) Objectifs : Définir les fonctionnalités requises des données indispensables au contrôle d’autorité gestion des points d’accès dans un catalogue identification des entités représentées par ces points d’accès pour permettre de répondre aux besoins des utilisateurs des données d’autorité de partager et de réutiliser les données d’autorité Le modèle met l’accent sur les données, non sur leur organisation dans des notices La notice autorité devient une entité indépendante elle n’est plus obligatoirement liée à une ressource

Le Rapport final FRAD (2) Moyens : Définir quatre « tâches utilisateur » (user tasks) correspondant à ce que l’on est présumé vouloir faire quand on consulte des données d’autorité mais aussi quand on en crée Évaluer la pertinence par rapport à ces « tâches utilisateur » : de chaque attribut défini pour chaque entité et de chaque relation les plus pertinents doivent figurer dans un fichier d’autorité national les autres peuvent être rendus optionnels

Les « tâches utilisateur » FRAD : tâches utilisateur sur les données d’autorité trouver des informations sur les entités décrites par les données d'autorité identifier confirmer que l’entité trouvée correspond bien à la recherche distinguer entre des entités analogues contextualiser expliciter les relations entre les entités ou entre une entité et un nom (par exemple : nom d’alliance, pseudonyme…) justifier les choix du catalogueur (par exemple : justifier par une source une forme rejetée)

FRAD Ajoute une 3e entité au Groupe 2 : Famille Ajoute 1 groupe d’entités : Groupe des Noms et des Identifiants Ajoute 3 autres entités : Point d’accès contrôlé Règles [de catalogage] Agence [de catalogage]

Point d’accès contrôlé FRAD : les entités « Entités bibliographiques » Groupe 1 Groupe 2 Groupe 3 Nom Identifiant a pour appellation se voit attribuer Point d’accès contrôlé sert de base à Règles est régi par Agence crée/modifie applique

Point d’accès contrôlé FRAD : les attributs Éléments d’information et de gestion Exemple : type statut usage prévu source etc. Point d’accès contrôlé attributs :

FRAD : les relations A] Au sein des « Entités bibliographiques » alias (pseudonymes / entrée en religion, etc.) fausses attributions ("Pseudo-Sénèque") pseudonymes collectifs collaborateurs / parents, etc. souche / descendance membre Personne Famille membre fondateur propriétaire Œuvre Collectivité dérivation description inclusion accompagnement succession hiérarchie succession

FRAD : les relations B] Entre différents types de Noms succession (notamment : nom d’alliance) variante linguistique autres variantes variante linguistique Nom de Personne Nom de Famille Nom d’Œuvre Nom de Collectivité acronyme / forme développée variante linguistique autres variantes forme conventionnelle variante linguistique autres variantes

FRAD : les relations C] Entre points d’accès contrôlés Expression dans une langue parallèle (même statut juridique) Expression dans un autre système d’écriture Forme établie selon d’autres règles Relation entre une forme verbale et un indice de classification Point d’accès contrôlé

Un catalogage FRBRisé ? Rôle croissant des notices d’autorité, dès la période de transition (SIGB existants) notices bibliographiques pour les manifestations notices d’exemplaires pour les exemplaires notices d’autorité pour les œuvres personnes collectivités familles concepts objets événements lieux pour les expressions nouveau ! établir systématiquement des notices d’autorité pour les œuvres Dans la structure actuelle des catalogues (qui correspond aux scénarios 2 et 3 d’implémentation de RDA, voir plus loin), les notices d’autorité existantes sont utilisées pour décrire les entités du modèle FRBR correspondant aux 2 entités décrivant le contenu intellectuel ou artistique d’une ressource (Œuvre et Expression), ainsi que les entités du Groupe 2 et du Groupe 3. Les notices d’autorité deviennent systématiques pour les Œuvres et gèrent le point d’accès autorisé à l’Œuvre dans toutes les notices bibliographiques. Les notices d’autorité sont établies pour les Expressions lorsqu’il est nécessaire de distinguer différentes Expressions d’une même Œuvre ; dans le cas d’une Œuvre n’ayant fait l’objet que d’une seule Expression (souvent elle-même matérialisée dans une seule Manifestation), les informations descriptives de l’Expression et le point d’accès autorisé identifiant celle-ci sont gérés directement dans les notices bibliographiques qui sont des notices composites, car elles continuent de contenir des informations sur les entités Œuvre et Expression contenues dans la Manifestation, en plus des informations décrivant la Manifestation elle-même. si nécessaire de distinguer différentes expressions 111

Notices d’autorité Évolution du rôle des notices d’autorité de simple outil de gestion des points d’accès vers celui de notice informative à part entière description de l’entité : ses attributs et ses relations avec d’autres entités (liens entre notices) Dans les grands catalogues des agences bibliographiques nationales, les notices d’autorité ont déjà un rôle d’identification et de description des entités et contiennent la plupart des attributs définis par le modèle FRAD. L’évolution est surtout sensible dans les notices de catalogues locaux où le rôle des notices d’autorité est centré sur le contrôle des points d’accès et leur contenu souvent limité à la gestion des variantes de formes, avec moins d’éléments descriptifs et surtout peu de liens entre notices d’autorité. Dans les deux cas, l’évolution concerne l’autonomie des notices décrivant les différentes entités et, à terme, l’absence de redondance des informations entre les notices décrivant les différentes entités (notamment les entités du Groupe 1). 112

FRBR et RDA RDA est entièrement construit sur une interprétation du modèle FRBR dans sa structure dans sa terminologie dans la détermination des éléments d’information indispensables pour que le catalogue rende aux utilisateurs les services souhaités  Il est utile de connaître FRBR pour appliquer RDA… 113