La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Sandrine Lagore – Nadia Raïs

Présentations similaires


Présentation au sujet: "Sandrine Lagore – Nadia Raïs"— Transcription de la présentation:

1 Sandrine Lagore – Nadia Raïs
Modélisation de l’information bibliographique et nouveau code de catalogage : FRBR, FRAD, RDA Médiadix -16 novembre 2012 Sandrine Lagore – Nadia Raïs Version adaptée des supports développés par Françoise Leresche et Patrick Le Bœuf (BNF)

2 Programme Les enjeux Evolution des pratiques des utilisateurs
Enjeux liés au Web Participer au Web de données Architecture du Web Standards du Web de données : URI, RDF Modèles FRBR et FRAD Notion de modèle conceptuel FRBR : entités, attributs et relations FRAD : entités, attributs et relations Présentation de RDA Objectifs et Organisation générale Cataloguer avec RDA Scénarios d'implémentation Limites de RDA Autour de RDA RDA en France 2

3 ou Pourquoi vouloir tout changer quand tout allait si bien ?...
I. Les enjeux ou Pourquoi vouloir tout changer quand tout allait si bien ?...

4 Tableau On avait notre ISBD… … nos normes AFNOR… … nos formats MARC…
… notre SIGB… Où était le problème ? ISBD intégré depuis 2011 qui prend en compte tous les types de documents Pensez à parler du babel MARC (LCMARC, MARC, DKMARC etc.)

5 Ombres au tableau Catalogues dans le « Web profond »  il faut y aller exprès « Dis, Madame, comment on cherche dans ton catalogue ? » L’utilisateur : « Je veux tout, tout de suite, sans effort. » Le catalogue : « Votre requête ramène 614 réponses. Bonne chance. » Catalogues de bibliothèques n’émergent pas en premier quand on fait une recherche : il faut y aller exprès ! Une recherche sur une œuvre a de fortes chances de donner en 1er Amazon

6 Aurez-vous la patience d’aller jusqu’à la 62ème page

7 Source : Sylvain Machefert
Voir l’étude icrossing.com “The importance of page-one visibility” (site consulté le 3/12/2012) Source : Sylvain Machefert

8 Source : Sylvain Machefert

9 Le « syndrome Google » On n’a plus l’habitude de chercher par index
Les recherches par mots dans nos catalogues ramènent trop de réponses classées de manière plus ou moins anarchique Nos catalogues doivent évoluer pour mieux cibler

10 Par exemple…

11 Par exemple encore…

12 Bien présenter data. bnf
Bien présenter data.bnf.fr comme expérience de frbérisation d’une partie du catalogue amenée à se développer et à se perfectionner ce n’est aucun casbien sûr le remplacement du catalogue général

13 Ou encore Voir le catalogue collectif ciné-ressources

14 « Super » Notice d'autorité « nom de personne »
C'est pas merveilleux, Cette page de résultats ?!

15 Ombres au tableau (suite)
La recherche d’info, aujourd’hui, pour beaucoup de gens, c’est le Web… Le Web ne parle pas MARC Le Web a ses propres normes Le Web ne fréquente pas les fournisseurs de SIGB Le Web concerne tout le monde Le Web suit son évolution propre… vers le Web sémantique

16 Enjeux liés au Web Pourquoi changer
Adopter les standards du Web sémantique pour sortir de notre « niche » technologique pour avancer du même pas que les autres pour que la maintenance de nos catalogues coûte moins cher But : dans un souci économique utiliser des outils qui ne soient pas spécifiquement développés pour les bibliothèques

17 Enjeux liés au confort des utilisateurs
Pourquoi changer ? Adopter les standards du Web de données pour sortir nos catalogues du Web invisible Modifier la structure de l’information bibliographique pour adapter nos catalogues aux besoins des utilisateurs et à leurs nouvelles pratiques de recherche pour mieux structurer les résultats d’une recherche simple

18 Enjeux liés au confort des bibliothécaires
Pourquoi changer ? Adopter les standards du Web de données pour récupérer des données produites ailleurs Modifier la structure de l’information bibliographique pour ne pas avoir à répéter indéfiniment les mêmes informations quand une œuvre est souvent éditée pour harmoniser l’information fournie exemple : Toujours dans une logique de partage des tâches

19 Ce que montre surtout cet exemple c’est la notion de « strates » dans les ctalogues
à la BnF :…

20 Une indexation-matière recréée pour chaque notice
L’accès par sujets à l’oeuvre devient très aléatoire. Il serait plus cohérent de faire l’indexation matière au niveau de la notion d’oeuvre plutôt que de la notice des différentes éditions … et dans le SUDOC :

21 Enjeux liés au confort de ….?....
Pourquoi changer ? Adopter les standards du Web de données et créer des « Données liées ouvertes » pour que n’importe qui puisse réutiliser n’importe lesquelles de nos données de n’importe quelle manière

22 En bref Répondre aux attentes des utilisateurs d’aujourd’hui
permettre à des utilisateurs extérieurs de récupérer les infos qui les intéressent, et seulement celles-là Aller vers une granularité plus fine de l’information bibliographique : des « notices » aux « données » permettre à chacun de récupérer et d’exploiter le niveau d’information qui l’intéresse Mettre les données à disposition des utilisateurs… … là où sont les utilisateurs Participer au Web de données On « dynamite » la notice en données élémentaires combinables à souhait par les utilisateurs. On ne peut plus penser que les utilisateurs viennent dasn les catalogues c’est à nous de les rendre accessibles dans les nouvelles plateformes d’échanges (Réseaux sociaux etc.)

23 ... mais changer au profit de quoi ???
Bon. Changer, OK. ... mais changer au profit de quoi ???

24 Zoom arrière Nos standards actuels s’appuient sur des outils datant des années 1960 Principes de Paris : 1961 Format MARC : ISBD : C’est-à-dire l’époque de la prédominance : des catalogues sur fiches des contenus textuels imprimés

25 Au tournant du siècle : l’IFLA secoue le cocotier !
Modélisation de l’information bibliographique FRBR (Functional Requirements for Bibliographic Records) publiés en 1998 FRAD (Functional Requirements for Authority Data) publiés en 2009 Nouveaux principes de catalogage PIC (Principes internationaux de catalogage) publiés en 2009 En profiter pour « faire la pub. » des onglets professionnels de la BnF de la BPI, et du site de l’ABES

26 Et maintenant… Juin 2010 : publication de RDA (Resource Description and Access) 31 mars 2013 : la Bibliothèque du Congrès n’appliquera plus que RDA Courant 2013 : au tour des bibliothèques nationales du Royaume-Uni, d’Australie, du Canada et d’Allemagne

27 Et maintenant… (bis) Mai 2011 (Library of Congress) : lancement de Bibliographic Framework Transition Initiative (réflexion sur le format futur des échanges d’information bibliographique) abandon du format MARC (d’ici 10 ans ?) création d’un nouveau format aussi robuste que MARC plus apte à exprimer le modèle FRBR mieux adapté aux technologies du Web (XML, RDF…)

28 En bref Changer… notre manière de structurer l’information bibliographique : FRBR, FRAD nos règles de catalogage : RDA ?? notre format de catalogage : [euh… là, c’est l’inconnu] … pour aller sur le Web de données ! [au fait, c’est quoi, le Web données ?...] Bien différencier si besoin modèles, normes de catalogage, codes de catalogage et formats RDA est bien une évolution du code de catalogage

29 II. Participer au Web de données
… en utilisant les technologies du Web sémantique

30 Architecture du Web (1) World Wide Web : toile d’araignée de serveurs d’informations reliés les uns aux autres par des liens physiques (le réseau matériel) et des liens logiques (les liens hypertextes) Architecture du Web : infrastructure technologique définie par des standards Standardisation de l’architecture du Web assurée par un organisme, le W3C (World Wide Web Consortium) Les objectifs du W3C Accessibilité pour les logiciels et machines Interopérabilité et portabilité Compatibilité Pérennité des documents Production de contenu Web facilitée Réduction du volume des pages Validation des pages par des services de validation Cohérence et qualité du code garanties Meilleure indexation par les moteurs de recherche Visibilité accrue Accessibilité universelle aux contenus

31 Architecture du Web (2) Repose sur 3 technologies :
Un protocole : HTTP (Hypertext Transfer Protocol) Un langage : HTML (Hypertext Markup Language) Standard défini par le W3C pour la diffusion de documents sur le Web pour pouvoir afficher de l'information à l'aide de balises dont le nombre est limité. Il est interprété par le navigateur Des identifiants : URI (Uniform Resource Identifier) Une ressource : tout objet Ressource identifiées de manière univoque par une URI : chaîne de caractères normalisée permettant d'identifier de manière permanente une ressource abstraite ou physique, accessible ou non sur Internet (personne, organisme, lieu, évènement, concept, …) On distingue 2 types de ressources : les ressources informationnelles : ressources dont on peut obtenir une représentation via HTTP, comme une page web ou une image les ressources non-informationnelles : ressources dont on ne peut pas obtenir de représentation via HTTP mais sur lesquels on va diffuser des informations (ex. : un monument, un lieu, un concept)

32 Les URI 2 déclinaisons : URN (Uniform Resource Name)
URI d’identification d’une ressource par son nom unique dans un espace de noms Utilisé pour identifier une ressource sans s’occuper de son emplacement ou de la manière de la référencer Exemple : urn:isbn: = URI de référence à une publication URL (Uniform Resource Locator) URI spécifiant l'adresse physique de localisation d'une ressource sur Internet et la méthode permettant d'y accéder = URI donnant accès à la ressource Ce sont surtout les URL qui sont utilisés sur le réseau Internet. Exemples d’autres applications de la notion d’URI dans le « monde réel » ISBN, code barre 32

33 Évolutions du web Web 1.0  web de documents
permet aux usagers de naviguer facilement sur Internet en utilisant des liens hypertexte une page = un document format : HTML (HyperText Markup Language) ne permet que la mise en forme Web 2.0  web collaboratif évolution du Web du point de vue des technologies employées et des usages Internet n’est plus simplement un media mais une plate-forme de services et d'applications en ligne Permet aux internautes d'interagir sur le contenu des pages et de dialoguer entre eux Web 2.0 : Le développement d’interfaces plus riches et assistées L’offre d’outils accessibles en ligne : : suites bureautiques en ligne (Google Docs, Zoho, …), d’outils de gestion de projet (Basecamp , …), de calendrier partagé (Google Calendar, …) Des plates-formes éditoriales avec le développement des CMS Des plates-formes collaboratives : Wikis, agendas collaboratifs La syndication de contenus avec les flux RSS Les communautés de partage : systèmes de publication d’objets numériques dans un espace personnel (ex. :Youtube, Flickr, Picasa, …) Les réseaux sociaux : construction de réseaux d’affinité pour créer un profil en ligne, échanger avec son réseau de contacts, promouvoir son activité (Facebook, Linkedin, Viadeo, …)

34 Le Web de documents Documents Données Base de données Hyperlien
Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

35 Limites du Web de documents
HTML : langage textuel d’échange de documents semi-structurés Les données sont cachées sous les pages HTML (« web profond ») Seules les pages HTML sont liées entre elles Les pages HTML sont faites pour les humains Ce que veulent les machines : des données structurées = utilisable directement par un ordinateur pour effectuer un calcul car elles se complètent les unes les autres car les liens permettent de naviguer et de découvrir avec des liens qualifiés, signifiants au-delà du « voir aussi » des hyperliens

36 Le web de données ? Web de données ou Linked Data ou Web of Data Mise sur le Web de données : Mouvement de l’Open Data Mise à disposition de données publiques ouvertes librement accessibles sans restriction de copyright, licence payante, brevet, … Données pouvant être réutilisées, reproduites, redistribuées librement et sans discrimination (cf. + Mise en relation des données pour construire un réseau global qui permet, à partir d’une donnée, d’accéder aux autres données liées du Web

37 Le Web de données ? Un Web constitué de données accessibles, structurées, dans un format non-propriétaire, identifiées et liées entre elles sémantiquement (Définition de Tim Berners-Lee dès 1999) Objectif : Mettre à disposition des données en utilisant des techniques standardisées qui garantissent l’interopérabilité : Web documentaire : relations par des liens entre des pages HTML Web de données : extension du Web permettant de relier non pas des documents (pages HTML) mais les données elles-mêmes et de les rendre interprétables par les machines Repose sur le standard URI = relations entre URI qui désignent tout objet décrit Volonté de relier des données isolées dans des « silos »

38 Le Web de données liées Documents Données Base de données
Liens entre les bases de données Hyperlien Base de données Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

39 Le Web de données aujourd’hui
Liens entre les données et transformation du Web en une gigantesque base de connaissances distribuée Le Web de données liées rejoint le Web de données ouvertes : mise à disposition en RDF de sources de données ouvertes

40 Pile des standards du Web sémantique
- Standard URI pour nomme ce que l’on décrit - Standard RDF pour décrire les URI - Liens RDF vers d’autres URI pour fournir des données liées - Utilisation d’ontologies pour permettre l’interconnexion des différentes sources de données

41 RDF RDF = Resource Description Framework
Standard permettant de décrire les ressources Web et métadonnées qui y sont associées Proposé en 1999 par le W3C Permet de décrire, représenter et relier simplement toute ressource du Web : page Web, image, video, personne, objet, évènement, produit, service, … tout ce qui peut être identifié par un URI peut être considéré comme une ressource Objectif : partager les métadonnées pour des ressources identiques par l’utilisation d’une syntaxe commune RDF fournit une structure de données standard et un modèle pour encoder des données et des métadonnées sur n’importe quel sujet sur le Web. Ces sujets sont appelés des ressources et sont identifiés par des URI

42 RDF : un modèle conceptuel (1)
Principe de base : toute chose peut être décrite avec des phrases minimales composées d’un verbe, d’un sujet et d’un complément  déclaration RDF Exemple : Charles Darwin a écrit « On the origin of species » Sujet : Charles Darwin Ressource Verbe : a écrit Prédicat Complément : On the origin of sepcies Objet RDF est l’équivalent d’une grammaire pour le langage humain qui permet d’assurer l’ interopérabilité Le rôle joué par les mots dans le langage humain est joué par les URI en RDF Un URI désigne une ressource et une seule il n’y a pas d’ambigüités possibles

43 RDF : un modèle conceptuel (2)
Modèle de données élémentaires constitué de 3 types d’objets : Ressource toute chose décrite par une déclaration RDF entité d’information identifiée par une URI Propriété caractéristique, attribut ou relation utilisé pour décrire une ressource Déclaration association d’une propriété à une ressource A partir d’une même publication une multitudes de liens sont possibles

44 RDF : la notion de triplet
Une déclaration est composée de 3 éléments = triplet Triplet {sujet , predicat , objet} sujet = ressource prédicat = nom d’une propriété de la ressource (comme l’étiquette d’un champ dans une base de données) objet = valeur ressource liée ou caractéristique exprimée par une chaîne de caractères (= littéral) Exemple : Sujet (Ressource) : Honoré de Balzac Prédicat (Propriété) : Creator Objet (Valeur) : La Comédie humaine

45 RDF : Graphe La déclaration est représentée visuellement par un graphe (système de nœuds reliés par des flèches) qui permet de parcourir l'information de lien en lien SUJET OBJET PREDICAT Sujet = ressource sur laquelle porte la déclaration, et c'est toujours un indicateur de ressource uniforme (URI) Prédicat = nom d'une propriété de la ressource et c'est toujours une adresse URI Objet = valeur de cette propriété qui peut être une adresse URI ou un littéral (texte, nombre, date, etc.) En utilisant ce standard, les ressources Werb sont plus facilement accessibles pour les moteures de recherche. Objet : The origin of species Sujet : Charles Darwin Prédicat : A écrit = Creator

46 RDF : modèle de graphe (1)
On construit ainsi un modèle de graphe L’objet d’un triplet peut être : Soit une ressource qui peut être le sujet ou l’objet d’autres déclarations Objet : The Origin of species Prédicat : A écrit Sujet : Charles Darwin Sujet : The origin of species Prédicat : Comprend Objet : An introduction on the origin of species

47 RDF : modèle de graphe (2)
L’objet d’un triplet peut être : Soit un littéral = chaîne de caractères, nombre, date Sujet : Charles Darwin Objet : The origin of species Prédicat : A écrit Sujet : The origin of species Prédicat : Et né Prédicat : Comprend «1809» Objet : An introduction on the origin of species

48 Formalisme RDF Modèle permettant d’encoder toute donnée ou métadonnée
Permet de décrire les relations entre les ressources Utilise le mécanisme des URI pour identifier les ressources décrites et représenter explicitement toute relation entre 2 ressources Permet de réaliser le Web de données : Éclatement de l’information Des données et pas des « documents » Plus de souplesse pour manipuler, sélectionner…

49 RDF : souplesse Cadre conceptuel de description des ressources applicable à n’importe quel domaine Permet de mélanger les vocabulaires Un modèle abstrait à représenter avec un langage concret Peut être exprimé en utilisant diverses syntaxes RDF/XML (eXtensible Markup Language) : seule syntaxe qui fait l’objet actuellement d’une recommandation du W3C RDF NTriples RDF Turtle RDFa : syntaxe pour injecter du RDF dans une page Web Peut s’appliquer à n’importe quel domaine. On est très loin du format MARC réservé aux bibliothèques. Dans les notations, RDFa est également à retenir : permet de mettre du sens dans des pages Web en HTML et notamment de permettre l’extraction de données d’une page : par exemple indication des données Titre et Auteur d’un livre dans une page de catalogue de bibliothèque en ligne

50 RDF : extensibilité RDF rend les données extensibles
Plus besoin de tout dire sur une ressource, une personne, etc. Possibilité d’ajouter une nouvelle déclaration sur une nouvelle ressource ou une ressource déjà publiée pour compléter l’information Recensions, commentaires, etc. Données commerciales, etc. Dictionnaires biographiques, etc. Prendre l’exemple des notices d’autorité dans les catalogues de bibliothèque

51 Un Web de données … Modèle de données : RDF
Modèle universel de représentation, d’échanges et d’interconnexion de métadonnées Langage d’interrogation : SPARQL Simple Protocol And RDF Query Language Langage de requête sur les graphes RDF permettant de spécifier le type de données recherchées Format XML pour représenter les résultats d’une requête SPARQL permet d’interroger les données telles qu’on les a modélisées Première phase du déploiement du web sémantique

52 … et un Web sémantique Objectif : s’assurer de l’interprétation et de l’utilisation des données Publier avec les données leurs schémas ou vocabulaires Schéma (ou ontologie) Document formel expliquant les catégories de ressources, leurs relations, avec leur sens, la structure et les contraintes associées Exemples : Foaf pour la description d’un profil utilisateur Dublin Core pour la description (simple) d’une ressource ISBD pour la description bibliographique RDF permet de raisonner sur les données, pour les enrichir ou contrôler leur cohérence

53 Web de données et Web sémantique
Web de données : possibilité de relier et d’échanger des données au moyen d’URI Web sémantique : possibilité d’échanger les schémas des données et la sémantique associée Objectif : permettre aux machines de comprendre la sémantique, la signification de l’information sur le Web Selon Jean Delahousse (Knowledge Consult) : « le web sémantique est d’abord un drapeau fédérateur pour les recherches, les standards et les outils. Le Web de données est une application concrète que ce soit en termes de données disponibles ou de nombre d’applications reposant sur ces données. »

54 Et pour les bibliothèques : Que peut apporter le Web de données ?
Relier les catalogues des bibliothèques avec d’autres données existantes Ouverture à d’autres communautés (libraires, éditeurs, …) Plus de visibilité par les moteurs de recherche Navigation par les utilisateurs sans avoir à connaître les formats des bases de données et les langages de requête spécifiques Tirer parti des données structurées des catalogues et des référentiels Interopérabilité  Souplesse pour la réutilisation des données Bien penser ici à rajouter des infos sur l’interopérabilité dire qu’un référentiel Général d'Interopérabilité (RGI) a été élaboré pour décrire l’ensemble des normes et bonnes pratiques communes aux administrations publiques françaises dans le domaine informatique. La même préoccupation existe au niveau européen, avec l'EIF (European Interoperability Framwork) Différencier Interopérabilité et compatibilité

55 Catalogues de bibliothèques en ligne : une histoire par étapes (1)
Publication du catalogue (OPAC) Formulaires de recherche : combinaison de critères Interfaces / machine assez complexes Web invisible : catalogues non indexés par les moteurs de recherche Portails permettant un accès fédéré à des bases de données différentes : Interopérabilité informatique des systèmes OBDC, Z3950, SRU/SRW, API, … Une volonté : pouvoir échanger des flux d’informations Une réalité : des systèmes rigides et fragiles car dépendants de la structure des bases de données 55

56 Bases de références documentaires

57 Catalogues de bibliothèques en ligne : une histoire par étapes (2)
OAI-PMH Open Archives Initiative – Protocol for Metadata Harvesting Moissonnage en récupérant des métadonnées Utilisation des protocoles et standards du Web Mais : Format de métadonnées Dublin Core réducteur (15 éléments) Possibilité de requêtes limitées (6 verbes OAI-PMH) Limitation à l’échange de métadonnées Aller vers le Web de données … Interopérabilité entre données Utiliser naturellement le Web pour échanger des données Le Web passe du statut de base documentaire à celui de base de données 57

58 Comment y arriver ? Des données structurées
Des vocabulaires normalisés éléments de métadonnées listes de valeurs Des identifiants pérennes : URI pour désigner les ressources pour exprimer les relations entre les données Une syntaxe normalisée : RDF (Resource Description Framework)

59 Des données structurées
On sait déjà structurer l’information dans les bibliothèques. 003 = Identifiant pérenne de la notice

60 000 cam 22 3 450 001FRBNF42226398000000X 003http://catalogue. bnf
000 cam FRBNF X 003http://catalogue.bnf.fr/ark:/12148/cb b 010 $a $brel $a d2005 m y0frey50 ba 1011 $afre $aFR $a||||z 00||| $ar 2001 $aGuide des chenilles d'Europe$bTexte imprimé$eles chenilles de plus de espèces de papillons sur 165 plantes hôtes$fD.J. Carter$g[ill.] B. Hargreaves $aParis$cDelachaux et Niestlé$dDL $a1 vol. (311 p.)$cill.$d20 cm $aˆLes ‰guides du naturaliste $aBibliogr. p $ $tˆLes ‰Guides du naturaliste$x $d $tField guide to caterpillars of butterflies and moths in Britain and Europe $ $aChenilles$ $yEurope$ $xGuides pratiques et mémentos$2rameau $a $v $ $aCarter$bDavid$f $ $ $aHargreaves$bBrian$ $aFR$bFR $c $gAFNOR$2intermrc On a déjà des identifiants dans les notices qu’on sait exprimer sous la forme d’une URI. 003 = Identifiant pérenne de la notice 410 = référence à la collection 700 = responsabilité principale 702 = responsabilité secondaire Et on va pouvoir systématiser cela.

61 Des URI pour désigner les ressources
Guide des chenilles d'Europe / D.J. Carter ; [ill.] B. Hargreaves . - Paris : Delachaux et Niestlé, DL 2005 Les Guides du naturaliste Carter, David ( ) Hargreaves, Brian

62 Des vocabulaires normalisés
Pour exprimer les relations entre les données 2001 $aGuide des chenilles d'Europe 700 1$ $aCarter$bDavid$f $4070 200 $a Titre propre DC : Title ISBD : Title proper RDA : Title proper 700 $4070 Auteur du texte DC : Creator RDA : Creator RDA : Author

63 Des URI pour exprimer les relations (1)
Les vocabulaires normalisés sont en cours de déclaration pour être utilisés dans le monde du Web de données. C’est un registre validé par le W3C

64 Des URI pour exprimer les relations (2)
DC : Title ISBD : has title proper RDA : Title proper DC : Creator Les relations ont également des URI et on les utilise pour exprimer des Predicat RDA : Author  

65 Une syntaxe normalisée
Le sujet est toujours une URI Le prédicat est toujours une URI L’objet peut être un texte (« littéral ») ou une URI 2001 $aGuide des chenilles d'Europe Cet ouvrage RDF sujet sujet a pour titre propre prédicat verbe complément d’objet "Guide des chenilles d'Europe" objet "Guide des chenilles d’Europe"

66 Un réseau de relations entre des données
"Guide des chenilles d’Europe" A pour titre propre A pour patronyme "Carter"   A pour auteur "David" A pour prénom Appartient à A pour date de naissance 1943 A pour titre clé "Les Guides du naturaliste"

67 Les bibliothèques dans le Web de données aujourd’hui
67

68 http://richard. cyganiak

69 Des exemples Isidore : http://www.rechercheisidore.fr
Plateforme de recherche permettant l’accès aux données numériques des sciences humaines et sociales Données en accès libre (open access) Moissonnage ciblé des métadonnées et données scientifiques structurées Enrichissement des métadonnées selon les principes du Web de données

70 Des exemples Data.bnf.fr : http://data.bnf.fr
Fiches descriptives des auteurs et des oeuvres Possibilité de télécharger le RDF associé à la fiche descriptive 70

71 Y aller … avec les bons outils
Pour utiliser la boîte à outils du Web sémantique, il faut Identifier les données Construire un réseau de relations entre ces données De quel outil disposons-nous pour analyser les relations entre les données au sein des catalogues de bibliothèques ? 71

72 III. Modèles FRBR et FRAD
ou : Comment représenter tout un catalogue dans un seul schéma ?

73 Qu’est-ce qu’un modèle conceptuel ?
Une représentation abstraite et simplifiée d’une activité : les catégories d’objets (« entités ») concernées par cette activité (incarnées dans des « instances ») les attributs caractérisant ces « entités » les relations entre ces « entités »

74 Exemple : Instance Entité Attributs Relation
instance = {le présent cours} Cours Salle dans intitulé cursus… pendant Tranche horaire date heure de début heure de fin… numéro capacité… instance = {ici} suivi par instance = {maintenant} donné par Enseignant Stagiaire nom affiliation… nom affiliation… instance = {moi} instance = {vous}

75 Que trouve-t-on dans une notice ?

76 Des informations sur un exemplaire physique

77 Des informations sur un produit éditorial

78 Des informations sur le contenu de ce produit

79 Des informations destinées à mettre ce contenu en relation avec d’autres produits éditoriaux au contenu « analogue »

80 Tout ça dans une seule notice...

81 L’activité de catalogage
Que fait-on, quand on catalogue ? On commence par examiner un objet matériel…

82 L’activité de catalogage
… On extrapole les caractéristiques de la publication à laquelle il appartient… Publication Publication Publication Publication Bien expliquer qu’on va déjà naturellement d’un document à un type de document

83 L’activité de catalogage
… On cherche si le contenu intellectuel de cet objet est en relation directe avec le contenu intellectuel d’autres objets Exemple : traduction / texte original Si c’est le cas, on explicite cette relation Exemple : titre original suivi du nom de la langue de traduction Famille de contenus Contenu Contenu Publication Publication

84 FRBR : un 1er groupe d'entités
Item Ce livre est en usuel en salle de lecture Ce livre a été publié par Flammarion en 1992 Ce livre est accessible à un public francophone Ce livre a révolutionné notre vision du vivant un objet matériel Manifestation un produit défini par des caractéristiques communes en termes de contenu, d’aspect physique et de circonstances de production Expression un contenu textuel spécifique Œuvre FRBR = Functional requirement for bibliographic records un contenu conceptuel accessible via divers contenus textuels

85 FRBR : en tout, 3 groupes d'entités
un qui correspond à la notice catalographique (ISBD + données d'exemplaire) deux qui correspondent aux points d’accès Groupe 1 Groupe 2 Groupe 3

86 Les entités du Groupe 1 Origin… (français). Flammarion DARWo Œuvre Expression Manifestation Item

87 Les entités du Groupe 2 Origin… (français). Flammarion DARWo a conçu a réalisé a produit possède Charles Darwin D. Becquemont E. Barbier Flammarion BnF. Département Sciences et techniques Personne Collectivité

88 FRBR : un 3e groupe d’entités
Œuvre C’est à quel sujet ? Lieu Concept Groupe 1 Ex. : chenilles Ex. : Europe (œuvre, expression, manifestation, item) Événement Groupe 2 Objet (personne, collectivité) Ex. : Guerre de 14 Ex. : sonde Curiosity

89 FRBR : les attributs des entités
Attributs = caractéristiques des instances de chaque entité Œuvre titre de l’Œuvre date de l’Œuvre forme de l’Œuvre etc. Manifestation titre propre mention de responsabilité édition lieu de publication éditeur commercial date de publication présentation matérielle etc. Expression titre de l’Expression date de l’Expression forme de l’Expression langue de l’Expression etc. Item localisation provenance état matériel etc.

90 FRBR : les relations Œuvre Expression Manifestation Item
réalisée dans Expression matérialisée dans Manifestation exemplifiée par Entités Groupe 1 Item Relations structurelles au sein du Groupe 1 Cohésion de la notice catalographique

91 FRBR : les relations Personne Œuvre Collectivité Expression
créée par Personne Œuvre réalisée par Collectivité Entités Groupe 2 Expression produite par Manifestation possédé par Entités Groupe 1 Item Relations Groupe 1 / Groupe 2 Relations de responsabilité

92 FRBR : les relations Personne Concept Œuvre Collectivité Objet
est au sujet de Personne Concept Œuvre Collectivité Objet Entités Groupe 2 Expression Événement Lieu Entités Groupe 3 Manifestation Entités Groupe 1 Item Relation Œuvre / Groupes 1, 2 et 3 Relation de sujet

93 FRBR : les relations Œuvre Expression Manif. Item
relié intellectuellement à fait partie de Ave Maria (Schubert) 7 mélodies tirées de la Dame du lac, op. 52 (Schubert) La Dame du lac (Walter Scott) Œuvre met en musique met en musique Expression Texte anglais Traduction allemande (Adam Storck) Notation de l'édition princeps de 1826 reproduit présentation alternative Édition brochée Édition reliée Édition de 1826 Num. par l'Université de Harvard Manif. reproduit reproduit Exemplaire coté 8/49d Microforme Exemplaire coté Merritt Mus PHI Item

94 Relations Œuvre / Expression
Relation intellectuelle Tout / Partie Œuvre Œuvre Œuvre Tout / Partie Expression Expression Expression Relations intellectuelles

95 Relations intellectuelles
DEV juin 2012 95

96 FRBR : les relations Œuvre Expression Manifestation Item
intellectuellement en relation avec est une partie de Expression intellectuellement en relation avec intellectuellement en relation avec est une partie de présentation alternative de Manifestation reproduit est une partie de reconfiguration de Entités Groupe 1 Item reproduit reproduit est une partie de Relations au sein du Groupe 1 autres que les relations « structurelles »

97 Autour du modèle FRBR 1990 (séminaire de Stockholm) : commande d’une étude visant à évaluer scientifiquement les fonctions d’un catalogue (objectif : réduire les coûts) 1992 : constitution d’un groupe d’étude IFLA 1997 : approbation du Rapport final sur les fonctionnalités requises des notices bibliographiques (publié en 1998) le modèle FRBR n’en est qu’une partie  Qu’y a-t-il d’autre dans ce Rapport ?

98 Le Rapport final sur les Fonctionnalités requises des notices bibliographiques (1)
Objectifs : Définir les fonctions des notices bibliographiques en prenant en compte les différents types de documents et de supports les différentes utilisations les différents besoins des utilisateurs Formuler des recommandations sur le niveau minimal d’une notice bibliographique nationale pour réduire les coûts de catalogage tout en répondant aux besoins essentiels des utilisateurs

99 Le Rapport final sur les Fonctionnalités requises des notices bibliographiques (2)
Moyens : Définir quatre « tâches utilisateur » (user tasks) correspondant à ce que l’on est présumé vouloir faire quand on consulte un catalogue de bibliothèque Évaluer la pertinence par rapport à ces « tâches utilisateur » : de chaque attribut défini pour chaque entité et de chaque relation les plus pertinents doivent figurer dans les notices produites par les agences bibliographiques nationales les autres peuvent être rendus optionnels

100 Les « tâches utilisateur »
FRBR : tâches utilisateur sur les données bibliographiques trouver les ressources correspondant à une recherche identifier confirmer que la ressource trouvée correspond bien à la recherche distinguer entre des ressources analogues sélectionner entre des ressources analogues, choisir celle qui correspond à ses besoins obtenir avoir accès à une ressource

101 Après le modèle FRBR 1999 : création d’un autre groupe de travail pour étendre le modèle FRBR aux données d'autorité 2009 : publication du Rapport final sur les fonc-tionnalités requises des données d’autorité (FRAD, Functional requirements for authority data) le modèle FRAD n’en est qu’une partie Tous ces rapports sont disponibles sur le site de la BnF

102 Le Rapport final FRAD (1)
Objectifs : Définir les fonctionnalités requises des données indispensables au contrôle d’autorité gestion des points d’accès dans un catalogue identification des entités représentées par ces points d’accès pour permettre de répondre aux besoins des utilisateurs des données d’autorité de partager et de réutiliser les données d’autorité Le modèle met l’accent sur les données, non sur leur organisation dans des notices La notice autorité devient une entité indépendante elle n’est plus obligatoirement liée à une ressource

103 Le Rapport final FRAD (2)
Moyens : Définir quatre « tâches utilisateur » (user tasks) correspondant à ce que l’on est présumé vouloir faire quand on consulte des données d’autorité mais aussi quand on en crée Évaluer la pertinence par rapport à ces « tâches utilisateur » : de chaque attribut défini pour chaque entité et de chaque relation les plus pertinents doivent figurer dans un fichier d’autorité national les autres peuvent être rendus optionnels

104 Les « tâches utilisateur »
FRAD : tâches utilisateur sur les données d’autorité trouver des informations sur les entités décrites par les données d'autorité identifier confirmer que l’entité trouvée correspond bien à la recherche distinguer entre des entités analogues contextualiser expliciter les relations entre les entités ou entre une entité et un nom (par exemple : nom d’alliance, pseudonyme…) justifier les choix du catalogueur (par exemple : justifier par une source une forme rejetée)

105 FRAD Ajoute une 3e entité au Groupe 2 : Famille
Ajoute 1 groupe d’entités : Groupe des Noms et des Identifiants Ajoute 3 autres entités : Point d’accès contrôlé Règles [de catalogage] Agence [de catalogage]

106 Point d’accès contrôlé
FRAD : les entités « Entités bibliographiques » Groupe 1 Groupe 2 Groupe 3 Nom Identifiant a pour appellation se voit attribuer Point d’accès contrôlé sert de base à Règles est régi par Agence crée/modifie applique

107 Point d’accès contrôlé
FRAD : les attributs Éléments d’information et de gestion Exemple : type statut usage prévu source etc. Point d’accès contrôlé attributs :

108 FRAD : les relations A] Au sein des « Entités bibliographiques »
alias (pseudonymes / entrée en religion, etc.) fausses attributions ("Pseudo-Sénèque") pseudonymes collectifs collaborateurs / parents, etc. souche / descendance membre Personne Famille membre fondateur propriétaire Œuvre Collectivité dérivation description inclusion accompagnement succession hiérarchie succession

109 FRAD : les relations B] Entre différents types de Noms
succession (notamment : nom d’alliance) variante linguistique autres variantes variante linguistique Nom de Personne Nom de Famille Nom d’Œuvre Nom de Collectivité acronyme / forme développée variante linguistique autres variantes forme conventionnelle variante linguistique autres variantes

110 FRAD : les relations C] Entre points d’accès contrôlés
Expression dans une langue parallèle (même statut juridique) Expression dans un autre système d’écriture Forme établie selon d’autres règles Relation entre une forme verbale et un indice de classification Point d’accès contrôlé

111 Un catalogage FRBRisé ? Rôle croissant des notices d’autorité, dès la période de transition (SIGB existants) notices bibliographiques pour les manifestations notices d’exemplaires pour les exemplaires notices d’autorité pour les œuvres personnes collectivités familles concepts objets événements lieux pour les expressions nouveau ! établir systématiquement des notices d’autorité pour les œuvres Dans la structure actuelle des catalogues (qui correspond aux scénarios 2 et 3 d’implémentation de RDA, voir plus loin), les notices d’autorité existantes sont utilisées pour décrire les entités du modèle FRBR correspondant aux 2 entités décrivant le contenu intellectuel ou artistique d’une ressource (Œuvre et Expression), ainsi que les entités du Groupe 2 et du Groupe 3. Les notices d’autorité deviennent systématiques pour les Œuvres et gèrent le point d’accès autorisé à l’Œuvre dans toutes les notices bibliographiques. Les notices d’autorité sont établies pour les Expressions lorsqu’il est nécessaire de distinguer différentes Expressions d’une même Œuvre ; dans le cas d’une Œuvre n’ayant fait l’objet que d’une seule Expression (souvent elle-même matérialisée dans une seule Manifestation), les informations descriptives de l’Expression et le point d’accès autorisé identifiant celle-ci sont gérés directement dans les notices bibliographiques qui sont des notices composites, car elles continuent de contenir des informations sur les entités Œuvre et Expression contenues dans la Manifestation, en plus des informations décrivant la Manifestation elle-même. si nécessaire de distinguer différentes expressions 111

112 Notices d’autorité Évolution du rôle des notices d’autorité
de simple outil de gestion des points d’accès vers celui de notice informative à part entière description de l’entité : ses attributs et ses relations avec d’autres entités (liens entre notices) Dans les grands catalogues des agences bibliographiques nationales, les notices d’autorité ont déjà un rôle d’identification et de description des entités et contiennent la plupart des attributs définis par le modèle FRAD. L’évolution est surtout sensible dans les notices de catalogues locaux où le rôle des notices d’autorité est centré sur le contrôle des points d’accès et leur contenu souvent limité à la gestion des variantes de formes, avec moins d’éléments descriptifs et surtout peu de liens entre notices d’autorité. Dans les deux cas, l’évolution concerne l’autonomie des notices décrivant les différentes entités et, à terme, l’absence de redondance des informations entre les notices décrivant les différentes entités (notamment les entités du Groupe 1). 112

113 FRBR et RDA RDA est entièrement construit sur une interprétation du modèle FRBR dans sa structure dans sa terminologie dans la détermination des éléments d’information indispensables pour que le catalogue rende aux utilisateurs les services souhaités  Il est utile de connaître FRBR pour appliquer RDA… 113


Télécharger ppt "Sandrine Lagore – Nadia Raïs"

Présentations similaires


Annonces Google