La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Comprendre lévolution des catalogues et des règles de catalogage : enjeux, Web de données, FRBR, RDA Journée dinformation Médiadix – 6 mars 2014 Marie-Line.

Présentations similaires


Présentation au sujet: "1 Comprendre lévolution des catalogues et des règles de catalogage : enjeux, Web de données, FRBR, RDA Journée dinformation Médiadix – 6 mars 2014 Marie-Line."— Transcription de la présentation:

1 1 Comprendre lévolution des catalogues et des règles de catalogage : enjeux, Web de données, FRBR, RDA Journée dinformation Médiadix – 6 mars 2014 Marie-Line GUILLAUMEE (BIU Sorbonne) Marie-Thérèse NISHIOKA (BSG) Support élaboré à partir des travaux du groupe national de formateurs RDA

2 2 Programme I.Les enjeux – Enjeux liés aux pratiques des utilisateurs – Enjeux liés au Web – Rappel historique II.Participer au Web de données – Architecture du Web – Standards du Web de données : RDF, URI III.Modèles FRBR et FRAD – Notion de modèle conceptuel – FRBR : entités, attributs et relations – FRAD : entités, attributs et relations IV.Présentation de RDA – Objectifs et Organisation générale – Cataloguer avec RDA – Scénarios d'implémentation – Limites de RDA V.Autour de RDA VI.RDA en France

3 3 I. Les enjeux ou Pourquoi vouloir tout changer quand tout allait si bien ?...

4 4 Tableau On avait notre ISBD… … nos normes AFNOR… … nos formats MARC… … notre SIGB… Où était le problème ?

5 5 Enjeux liés aux pratiques des utilisateurs Catalogues dans le « Web profond » il faut y aller exprès « Dis, Madame, comment on cherche dans ton catalogue ? » Lutilisateur : « Je veux tout, tout de suite, sans effort. » Le catalogue SU : « Votre requête [charles darwin] ramène 614 réponses »

6 6 Recherche dans le SU « charles darwin »

7 7 Source : Sylvain Machefert

8 8 Le « syndrome Google » On na plus lhabitude de chercher par index Les recherches par mots dans nos catalogues –ramènent trop de réponses –classées de manière plus ou moins anarchique Nos catalogues doivent évoluer pour mieux cibler

9 9 Enjeux liés au confort des utilisateurs Adopter les standards du Web de données –pour sortir nos catalogues du « Web invisible », « Web profond » Adopter les standards du Web de données et créer des « Données liées ouvertes » –pour que nimporte qui puisse réutiliser nimporte lesquelles de nos données Modifier la structure de linformation bibliographique –pour adapter nos catalogues aux besoins des utilisateurs et à leurs nouvelles pratiques de recherche –pour mieux structurer les résultats dune recherche simple

10 10 Enjeux liés au confort des bibliothécaires Adopter les standards du Web de données –pour récupérer des données produites ailleurs Modifier la structure de linformation bibliographique –pour ne pas avoir à répéter indéfiniment les mêmes informations quand une œuvre est souvent éditée –pour harmoniser linformation fournie exemple : lindexation matière

11 11 à la BnF :…

12 12 … et dans le SUDOC : A priori, le même contenu

13 13 En fait, une indexation- matière a été recréée pour chaque notice

14 14 Et si on harmonisait tout cela à un niveau supérieur ?

15 15 En bref Répondre aux attentes des utilisateurs daujourdhui –permettre à des utilisateurs extérieurs de récupérer les infos qui les intéressent, et seulement celles-là Aller vers une granularité plus fine de linformation bibliographique : des « notices » aux « données » –permettre à chacun de récupérer et dexploiter le niveau dinformation qui lintéresse Mettre les données à disposition des utilisateurs… … là où sont les utilisateurs Participer au Web de données

16 16

17 Zoom arrière : rappel historique Les standards actuels sont fondés sur des principes datant des années 60 (norme Afnor Z …) : prédominance des catalogues sur fiches et de limprimé. Règles caduques aujourdhui car elles ne permettent pas dêtre visible sur le Web et ne prennent pas en compte les nouvelles pratiques des utilisateurs. Dans les années , de nouveaux modèles émergent : FRBR (Functional requirements for bibliographic records = Fonctionnalités requises des notices bibliographiques) : FRAD (Functional requirements for authority data) : PIC (Principes internationaux de catalogage) : publiés en 2009 De nouveaux codes de catalogage aussi : REICAT (règles de catalogage italiennes) : 2009 ISBD consolidé (fusion de tous les ISBD) : 2010 RDA (Resource description and access : code de catalogage) : juin 2010 Les bibliothèques françaises vont devoir choisir entre : retenir lISBD consolidé comme règle de description (publié en 2011) adopter REICAT adopter RDA qui se veut un code international et est articulé sur les FRBR 17

18 18 En bref Il faut changer… –notre manière de structurer linformation bibliographique : FRBR, FRAD –nos règles de catalogage : RDA ?? –notre format de catalogage : [là, cest linconnu] … pour aller sur le Web de données ! –[au fait, cest quoi, le Web de données ?...]

19 19 Journées ABES mai Philippe Le Pape -- ABES Aujourdhui les catalogues de bibliothèques se trouvent dans le web invisible ou web profond Les solutions pour sortir les catalogues de bibliothèques des oubliettes : un modèle conceptuel : FRBR (Fonctionnalités requises des notices bibliographiques) des nouvelles règles de catalogage : RDA (Resource Description and Access ) une syntaxe : RDF (Resource Description Framework ) et lentrée des catalogues dans le web de données

20 20 II. Participer au Web de données … en utilisant les technologies du Web sémantique

21 21 Architecture du Web (1) World Wide Web : toile daraignée de serveurs dinformations reliés les uns aux autres par des liens physiques (le réseau matériel) et des liens logiques (les liens hypertextes) Architecture du Web : infrastructure technologique définie par des standards Standardisation de larchitecture du Web assurée par un organisme, le W3C (World Wide Web Consortium) : accessibilité pour les logiciels et machines et accessibilité universelle aux contenus

22 22 Architecture du Web (2) Repose sur 3 technologies : Un protocole : HTTP (Hypertext Transfer Protocol) Un langage : HTML (Hypertext Markup Language) –Standard défini par le W3C pour la diffusion de documents sur le Web pour pouvoir afficher de l'information à l'aide de balises dont le nombre est limité. Il est interprété par le navigateur Des identifiants Web : URI (Uniform Resource Identifier) –Une ressource : tout objet –Ressource identifiée de manière univoque par un URI : chaîne de caractères normalisée permettant d'identifier de manière permanente une ressource abstraite ou physique, accessible ou non sur Internet (personne, organisme, lieu, évènement, concept, …)

23 23 Les URI 2 déclinaisons : –URN (Uniform Resource Name) URI didentification dune ressource par son nom unique Utilisé pour identifier une ressource sans soccuper de son emplacement ou de la manière de la référencer Exemple : urn : isbn: = URI de référence à une publication –URL (Uniform Resource Locator) URI spécifiant l'adresse physique de localisation d'une ressource sur Internet et la méthode permettant d'y accéder = URI donnant accès à la ressource

24 24 Évolutions du web Web 1.0 Web de documents –permet aux usagers de naviguer facilement sur Internet en utilisant des liens hypertextes une page = un document –format : HTML (HyperText Markup Language) ne permet que la mise en forme Web 2.0 Web collaboratif –évolution du Web du point de vue des technologies employées et des usages –Internet nest plus simplement un media mais une plate-forme de services et d'applications en ligne –Permet aux internautes d'interagir sur le contenu des pages et de dialoguer entre eux Web 3.0 Web de données ou Web sémantique : permet aux machines de trouver et dexploiter les données contenues dans les documents : format RDF (Resource Description Framework) qui permet de décrire et de relier des ressources

25 25 La recette du Web

26 26 Le Web de documents Base de données Données Documents Base de données Hyperlien Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

27 27 Limites du Web de documents HTML : langage textuel déchange de documents semi-structurés Les données sont cachées sous les pages HTML (« web profond ») Seules les pages HTML sont liées entre elles Les pages HTML sont faites pour les humains Ce que veulent les machines : des données structurées = utilisable directement par un ordinateur pour effectuer un calcul –car elles se complètent les unes les autres –car les liens permettent de naviguer et de découvrir avec des liens qualifiés, signifiants –au-delà du « voir aussi » des hyperliens

28 28 Le Web de données Un Web constitué de données accessibles, structurées, dans un format non-propriétaire, identifiées et liées entre elles sémantiquement (Définition de Tim Berners-Lee dès 1999) Extension du Web permettant de relier non pas des documents (pages HTML) mais les données elles-mêmes, et de les rendre exploitables par des machines Repose sur les mêmes technologies de base – HTTP : transfert des données – URI : nommage des ressources Utilisation dun autre langage : il ne sagit plus déchanger des documents destinés à être immédiatement visualisés, mais des données structurées : XML (eXtensible Markup Language) : – RDF = langage du Web de données liées

29 29 Le Web de données liées Base de données Données Documents Base de données Hyperlien Yann Nicolas, Le Web de données, enssib, 11 octobre 2012 Liens entre les bases de données

30 30 Le web de données ? Web de données ou Linked Data ou Web of Data Mise sur le Web de données : –Mouvement de lOpen Data –Mise à disposition de données publiques ouvertes librement accessibles sans restriction de copyright, licence payante, brevet, … –Données pouvant être réutilisées, reproduites, redistribuées librement et sans discrimination (cf. Mise en relation des données pour construire un réseau global qui permet, à partir dune donnée, daccéder aux autres données liées du Web

31 31 Le Web de données aujourdhui Liens entre les données et transformation du Web en une gigantesque base de connaissances distribuée

32 32 Le Web de données aujourdhui

33 33 Pile des standards du Web sémantique

34 34 RDF = Resource Description Framework Nouveau modèle généraliste et standardisé pour encoder, échanger et réutiliser des métadonnées structurées Proposé en 1999 par le W3C Permet de décrire, représenter et relier simplement toute ressource (= donnée) du Web : – page Web, image, vidéo, personne, objet, évènement, produit, service, … – tout ce qui peut être identifié par un URI peut être considéré comme une ressource Objectif : partager les métadonnées pour des ressources identiques par lutilisation dune syntaxe commune (RDF/XML)

35 35 RDF : un modèle conceptuel Principe de base : toute chose peut être décrite avec des phrases minimales composées dun verbe, dun sujet et dun complément déclaration RDF Exemple : Charles Darwin a écrit « Lorigine des espèces » Sujet : Charles Darwin Verbe : a écrit Complément : Lorigine des espèces

36 36 RDF : la notion de triplet Un document RDF est un ensemble de triplets Un triplet est composé de 3 éléments Lensemble forme une déclaration Triplet {sujet, prédicat, objet} –sujet : représente la ressource à décrire, cest toujours un URI –prédicat : représente un type de propriété applicable à la ressource, cest toujours un URI –objet : représente une ressource liée (URI) ou une caractéristique exprimée par une chaîne de caractères (= littéral) : cest la valeur de la propriété Exemple : Sujet (Ressource) : Charles Darwin Prédicat (Propriété) : a écrit Objet (Valeur) : Lorigine des espèces

37 37 RDF : la représentation par graphe La déclaration est représentée visuellement par un graphe (système de nœuds reliés par des flèches) qui permet de parcourir l'information de lien en lien SUJET OBJET PREDICAT Sujet : Charles Darwin Objet : Lorigine des espèces Prédicat : A écrit

38 38 RDF : modèle de graphe (2) Lobjet dun triplet peut être : – Soit une ressource qui peut être le sujet ou lobjet dautres déclarations – Soit un littéral = chaîne de caractères, nombre, date Prédicat : A écrit Prédicat : Comprend «1809» Prédicat : Est né Sujet : Charles Darwin Objet : The origin of species Sujet : The origin of species Objet : An introduction on the origin of species

39 39 Formalisme RDF Modèle permettant dencoder toute donnée ou métadonnée Permet de décrire les relations entre les ressources Utilise le mécanisme des URI pour identifier les ressources décrites et représenter explicitement toute relation entre 2 ressources Permet de réaliser le Web de données : –Éclatement de linformation –Des données et pas des « documents » –Plus de souplesse pour manipuler, sélectionner…

40 40 RDF : souplesse Cadre conceptuel de description des ressources applicable à nimporte quel domaine Permet de mélanger les vocabulaires Un modèle abstrait à représenter avec un langage concret Peut être exprimé en utilisant diverses syntaxes –RDF/XML (eXtensible Markup Language) : seule syntaxe qui fait lobjet actuellement dune recommandation du W3C –RDFa : syntaxe pour injecter du RDF dans une page Web… RDF rend les données extensibles : –Plus besoin de tout dire sur une ressource, une personne, etc. –Possibilité dajouter une nouvelle déclaration sur une ressource déjà publiée pour compléter linformation

41 41 Un Web de données … Modèle de données : RDF –Modèle universel de représentation, déchanges et dinterconnexion de métadonnées Langage dinterrogation : SPARQL –Simple Protocol And RDF Query Language –Langage de requête sur les graphes RDF permettant de spécifier le type de données recherchées –Format XML pour représenter les résultats dune requête –SPARQL permet dinterroger les données telles quon les a modélisées Première phase du déploiement du web sémantique

42 42 … et un Web sémantique Objectif : sassurer de linterprétation et de lutilisation des données Publier avec les données leurs schémas ou vocabulaires Schéma (ou ontologie) –Document formel expliquant les catégories de ressources, leurs relations, avec leur sens, la structure et les contraintes associées –Exemples : Foaf pour la description dun profil utilisateur Dublin Core pour la description (simple) dune ressource ISBD pour la description bibliographique RDF permet de raisonner sur les données, pour les enrichir ou contrôler leur cohérence

43 43 Web de données et Web sémantique Web de données : possibilité de relier et déchanger des données au moyen dURI Web sémantique : possibilité déchanger les schémas de données et la sémantique associée –Objectif : permettre aux machines de comprendre la sémantique, la signification de linformation sur le Web

44 44 Et pour les bibliothèques : Que peut apporter le Web de données ? Relier les catalogues des bibliothèques avec dautres données existantes Ouverture à dautres communautés (libraires, éditeurs, …) Plus de visibilité par les moteurs de recherche Navigation par les utilisateurs sans avoir à connaître les formats des bases de données et les langages de requête spécifiques Tirer parti des données structurées des catalogues et des référentiels Interopérabilité Souplesse pour la réutilisation des données

45 45 Des données structurées Des vocabulaires normalisés –éléments de métadonnées (title, creator…) –listes de valeurs (codes pays, langues…) Des identifiants pérennes : URI –pour désigner les ressources –pour exprimer les relations entre les données Une syntaxe normalisée : RDF (Resource Description Framework) Web de données et bibliothèques : Comment y arriver ?

46 46 003http://catalogue.bnf.fr/ark:/12148/cb b 010 $a $brel. 100 $a d2005 m y0frey50 ba 1011 $afre 102 $aFR 105 $a||||z 00||| 106 $ar 2001 $aGuide des chenilles d'Europe$bTexte imprimé$eles chenilles de plus de 500 espèces de papillons sur 165 plantes hôtes$fD.J. Carter$g[ill.] B. Hargreaves 210 $aParis$cDelachaux et Niestlé$dDL $a1 vol. (311 p.)$cill.$d20 cm 2252 $aˆLes guides du naturaliste 300 $aBibliogr. p $ $tˆLes Guides du naturaliste$x $d $tField guide to caterpillars of butterflies and moths in Britain and Europe 606 $ $aChenilles$ $yEurope$ $xGuides pratiques et mémentos$2rameau 676 $a $v $ $aCarter$bDavid$f $ $ $aHargreaves$bBrian$ $aFR$bFR $c $gAFNOR$2intermrchttp://catalogue.bnf.fr/ark:/12148/cb b Des données structurées

47 47 Des vocabulaires normalisés Pour exprimer les relations entre les données 200 1#$aGuide des chenilles d'Europe 700 #1$ $aCarter$bDavid$f $ $a Titre propre 700 $4070 Auteur du texte DC : Creator RDA : Creator DC : Title ISBD : Title proper RDA : Title proper RDA : Author

48 48 Des URI pour désigner les ressources Guide des chenilles d'Europe / D.J. Carter ; [ill.] B. Hargreaves. - Paris : Delachaux et Niestlé, DL 2005 Carter, David ( ) Les Guides du naturaliste Hargreaves, Brian

49 49 Des URI pour exprimer les relations (1) ISBD : has title proper DC : Creator DC : Title RDA : Author RDA : Title proper

50 50 Des URI pour exprimer les relations (2)

51 51

52 52 Une syntaxe normalisée Cet ouvrage "Guide des chenilles d'Europe" a pour titre propre Cet ouvrage a pour titre propre sujet verbe complément dobjet "Guide des chenilles dEurope" prédicat objet sujet Le sujet est toujours un URI Le prédicat est toujours un URI Lobjet peut être un texte (« littéral ») ou un URI 2001 $aGuide des chenilles d'Europe URI pour désigner la ressource Identifiant de la notice + caractère de contrôle URI pour exprimer les relations

53 53 Un réseau de relations entre des données "Guide des chenilles dEurope" "Carter" "David" 1943 "Les Guides du naturaliste" A pour titre propre Appartient à A pour titre clé A pour patronyme A pour prénom A pour date de naissance A pour auteur

54 54 Les bibliothèques dans le Web de données aujourdhui

55 55 Y aller … avec les bons outils Pour utiliser la boîte à outils du Web sémantique, il faut –Identifier les données –Construire un réseau de relations entre ces données De quel outil disposons-nous pour analyser les relations entre les données au sein des catalogues de bibliothèques ?


Télécharger ppt "1 Comprendre lévolution des catalogues et des règles de catalogage : enjeux, Web de données, FRBR, RDA Journée dinformation Médiadix – 6 mars 2014 Marie-Line."

Présentations similaires


Annonces Google