La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Web de données et RDA. 2 Architecture du Web (1) World Wide Web : toile d'araignée de serveurs d'informations reliés les uns aux autres par des liens.

Présentations similaires


Présentation au sujet: "Web de données et RDA. 2 Architecture du Web (1) World Wide Web : toile d'araignée de serveurs d'informations reliés les uns aux autres par des liens."— Transcription de la présentation:

1 Web de données et RDA

2 2 Architecture du Web (1) World Wide Web : toile d'araignée de serveurs d'informations reliés les uns aux autres par des liens physiques (le réseau matériel) et des liens logiques (les liens hypertextes) Architecture du Web = les standards définissant linfrastructure technologique Rôle du W3C (World Wide Web Consortium) : soccupe de la standardisation de larchitecture du Web

3 33 Les objectifs du W3C Accessibilité pour les logiciels et machines –Interopérabilité et portabilité –Production de contenu Web facilitée –Réduction du volume des pages –Meilleure visibilité et indexation par les moteurs de recherche –Compatibilité –Pérennité des documents –Validation des pages par des services de validation pour garantir la cohérence et la qualité du code Accessibilité universelle aux contenus

4 Architecture du Web (2) Repose sur 3 technologies : Un protocole : HTTP (Hypertext Transfer Protocol) Un langage : HTML (Hypertext Markup Language) Standard défini par le W3C pour la diffusion de documents sur le Web pour pouvoir afficher de l'information à l'aide de balises dont le nombre est limité. Il est interprété par le navigateur Des identifiants : URI (Uniform Resource Identifier) Une ressource : tout objet Ressource identifiées de manière univoque par une URI : chaîne de caractères normalisée permettant d'identifier de manière permanente une ressource abstraite ou physique, accessible ou non sur Internet (personne, organisme, lieu, évènement, concept, …)

5 Les URI 2 déclinaisons : URN (Uniform Resource Name) URI didentification dune ressource par son nom unique dans un espace de noms Utilisé pour identifier une ressource sans soccuper de son emplacement ou de la manière de la référencer Exemple : urn:isbn: = URI de référence à une publication URL (Uniform Resource Locator) URI spécifiant l'adresse physique de localisation d'une ressource sur Internet et la méthode permettant d'y accéder = URI donnant accès à la ressource

6 Évolutions du web Web 1.0 web de documents permet aux usagers de naviguer facilement sur Internet en utilisant des liens hypertexte une page = un document format : HTML (HyperText Markup Language) ne permet que la mise en forme Web 2.0 web collaboratif évolution du Web du point de vue des technologies employées et des usages Internet nest plus simplement un media mais une plate-forme de services et d'applications en ligne Permet aux internautes d'interagir sur le contenu des pages et de dialoguer entre eux

7 Le Web de documents Base de données Données Documents Base de données Hyperlien Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

8 Limites du Web de documents HTML : langage textuel déchange de documents semi- structurés Les données sont cachées sous les pages HTML (« web profond ») Seules les pages HTML sont liées entre elles Les pages HTML sont faites pour les humains Ce que veulent les machines : des données structurées = utilisable directement par un ordinateur pour effectuer un calcul car elles se complètent les unes les autres car les liens permettent de naviguer et de découvrir avec des liens qualifiés, signifiants au-delà du « voir aussi » des hyperliens

9 Le Web de données ? Web de données ou Linked Data ou Web of Data Mise sur le Web de données : Mouvement de lOpen Data Mise à disposition de données publiques ouvertes (etalab, creative comm.) librement accessibles sans restriction de copyright, licence payante, brevet, … Données pouvant être réutilisées, reproduites, redistribuées librement et sans discrimination (cf. + Mise en relation des données pour construire un réseau global qui permet, à partir dune donnée, daccéder aux autres données liées du Web

10 Le Web de données ? Un Web constitué de données accessibles, structurées, dans un format non-propriétaire, identifiées et liées entre elles sémantiquement (Définition de Tim Berners-Lee dès 1999) Objectif : Mettre à disposition des données en utilisant des techniques standardisées qui garantissent linteropérabilité : Web documentaire : relations par des liens entre des pages HTML Web de données : extension du Web permettant de relier non pas des documents (pages HTML) mais les données elles- mêmes et de les rendre interprétables par les machines Repose sur le standard URI = relations entre URI qui désignent tout objet décrit

11 Le Web de données liées Base de données Données Documents Base de données Hyperlien Yann Nicolas, Le Web de données, enssib, 11 octobre 2012 Liens entre les bases de données

12 Voilà ce à quoi rêvent nos machines…

13 RDF RDF = Resource Description Framework Standard permettant de décrire les ressources Web et métadonnées qui y sont associées Proposé en 1999 par le W3C Permet de décrire, représenter et relier simplement toute ressource du Web : page Web, image, video, personne, objet, évènement, produit, service, … tout ce qui peut être identifié par un URI peut être considéré comme une ressource Objectif : partager les métadonnées pour des ressources identiques par lutilisation dune syntaxe commune

14 RDF ?? Cest aussi simple que ça : SUJET OBJET PREDICAT Sujet : Charles Darwin Objet : The origin of species Prédicat : A écrit = Creator

15 15 RDF : un modèle conceptuel Principe de base : toute chose peut être décrite avec des phrases minimales composées dun verbe, dun sujet et dun complément = déclaration RDF Exemple : Honoré de Balzac a écrit "La Comédie humaine" Sujet : Honoré de Balzac Ressource Verbe : a écrit Predicat Complément : La Comédie humaine Objet

16 16 RDF : la notion de triplet Une déclaration est composée de 3 éléments = triplet Triplet {ressource – propriété – valeur} –sujet = ressource –predicat = propriété : nature de la relation –objet = valeur : caractéristique ou ressource liée Exemple : Sujet (Ressource) : Honoré de Balzac Predicat (Propriété) : Creator Objet (Valeur) : La Comédie humaine

17 17 RDF : Graphe La déclaration est représentée visuellement par un graphe (système de nœuds reliés par des flèches) qui permet de parcourir l'information de lien en lien SUJET OBJET PREDICAT

18 18 RDF : modèle de graphe Chaque membre du triplet est une ressource qui peut être le sujet ou lobjet dautres déclarations On construit ainsi un modèle de graphe

19 RDF : modèle de graphe (2) Lobjet dun triplet peut aussi être : un littéral = chaîne de caractères, nombre, date Prédicat : A écrit Prédicat : Comprend «1809» Prédicat : Est né Sujet : Charles Darwin Objet : The origin of species Sujet : The origin of species Objet : An introduction on the origin of species

20 20 RDF : un langage extensible Cadre conceptuel de description des ressources applicable à nimporte quel domaine dapplication Peut être exprimé en utilisant la syntaxe RDF/XML (eXtensible Markup Language) : seule syntaxe qui fait lobjet actuellement dune recommandation du W3C

21 000 cam FRBNF X 003http://catalogue.bnf.fr/ark:/12148/cb b 010 $a $brel. 100 $a d2005 m y0frey50 ba 1011 $afre 102 $aFR 105 $a||||z 00||| 106 $ar 2001 $aGuide des chenilles d'Europe$bTexte imprimé$eles chenilles de plus de 500 espèces de papillons sur 165 plantes hôtes$fD.J. Carter$g[ill.] B. Hargreaves 210 $aParis$cDelachaux et Niestlé$dDL $a1 vol. (311 p.)$cill.$d20 cm 2252 $aˆLes guides du naturaliste 300 $aBibliogr. p $ $tˆLes Guides du naturaliste$x $d $tField guide to caterpillars of butterflies and moths in Britain and Europe 606 $ $aChenilles$ $yEurope$ $xGuides pratiques et mémentos$2rameau 676 $a $v $ $aCarter$bDavid$f $ $ $aHargreaves$bBrian$ $aFR$bFR $c $gAFNOR$2intermrchttp://catalogue.bnf.fr/ark:/12148/cb b

22 Des URI pour désigner les ressources Guide des chenilles d'Europe / D.J. Carter ; [ill.] B. Hargreaves. - Paris : Delachaux et Niestlé, DL 2005 Carter, David ( ) Les Guides du naturaliste Hargreaves, Brian

23 Des vocabulaires normalisés pour exprimer les relations entre les données 2001 $aGuide des chenilles d'Europe 700 1$ $aCarter$bDavid$f $ $a Titre propre 700 $4070 Auteur du texte DC : Creator RDA : Creator DC : Title ISBD : Title proper RDA : Title proper RDA : Author

24 Des URI pour exprimer les relations

25 ISBD : has title proper DC : Creator DC : Title RDA : Author RDA : Title proper

26 Une syntaxe normalisée Cet ouvrage "Guide des chenilles d'Europe" a pour titre propre sujet verbe complément dobjet "Guide des chenilles dEurope" prédicat objet sujet Le sujet est toujours une URI Le prédicat est toujours une URI Lobjet peut être un texte (« littéral ») ou une URI 2001 $aGuide des chenilles d'Europe

27 Un réseau de relations entre des données "Guide des chenilles dEurope" "Carter" "David" 1943 "Les Guides du naturaliste" A pour titre propre Appartient à A pour titre clé A pour patronyme A pour prénom A pour date de naissance A pour auteur

28 Pour aller vers le Web de données Vers le web de données Vers le web sémantique 3 avril Bordeaux -- Urfist/Médiaquitaine Philippe Le Pape -- ABES Constitué déléments de données liés les uns aux autres Les données portent en elles leur identification et leur fonction (leur « sens »), selon une syntaxe lisible par les « machines du web » À condition dutiliser les standards du web

29 Cest très bien tout ça mais… Quel rapport avec la bibliothèque, le catalogue, le catalogage ? 29 Zoom sur Le lecteur

30 30 Les bibliothèques dans le Web de données aujourdhui

31 Que peut nous apporter le Web de données ? Relier les catalogues des bibliothèques avec dautres données existantes Ouverture à dautres communautés (libraires, éditeurs, …) Navigation par les utilisateurs sans avoir à connaître les formats des bases de données et les langages de requête spécifiques Plus de visibilité par les moteurs de recherche Tirer parti des données structurées des catalogue et des référentiels Interopérabilité = Souplesse pour la réutilisation des données

32 Des exemples Isidore : Plateforme de recherche permettant laccès aux données numériques des sciences humaines et sociales Données en accès libre (open access) Moissonnage ciblé des métadonnées et données scientifiques structurées Enrichissement des métadonnées selon les principes du Web de données

33 Des exemples Data.bnf.fr : Fiches descriptives des auteurs et des oeuvres Possibilité de télécharger le RDF associé à la fiche descriptive VIAF (Virtual International Authority File) Valoriser les fichiers d'autorité des bibliothèques (visibilité et liens entre les données) Rationnaliser la gestion des fichiers dautorités

34 Y aller … avec les bons outils Pour utiliser la boîte à outils du Web sémantique, il faut, nous lavons vu : Identifier les données Construire un réseau de relations entre ces données Pour savoir si vous avez suivi : « De quel outil disposons-nous pour analyser les relations entre les données au sein des catalogues de bibliothèques ? »

35 Tous les chemins mènent à… Organisation de linformation bibliographique : ISBD F R B R Web de données ! Formats dencodage MARC Format compatible RDF (BIBFRAME ?) Web de données ! Normes de catalogage AACR Afnor REICAT Etc… R D A ? Web de données !


Télécharger ppt "Web de données et RDA. 2 Architecture du Web (1) World Wide Web : toile d'araignée de serveurs d'informations reliés les uns aux autres par des liens."

Présentations similaires


Annonces Google