Linked Data – les données sur le web pourquoi et comment? Jean-Luc Cochard – 21.2 2018
La numérisation en marche
«Politique des données», «Suisse digitale» Les données sont le nouveau pétrole du 21ème siècle Les données sont une partie de notre infrastructure publique
Les archives publient déjà des données
Savoir Connaissances Informations Données Les archives publient déjà des données – Vraiment? Non! Les sites web servent à fournir des informations aux humains qui les consultent Savoir Résultat d’une ana-lyse faisant intervenir l’expérience Connaissances Signification qu’un humain assigne aux données en s’ap-puyant sur des conventions Informations Représentation formalisée d’observations communicables et utilisables par un processus Données
La sophistication du web est-elle contre-productive? Tim Berners Lee propose en 1989 une solution pour partager des documents informatiques en s’appuyant sur l’internet. C’est la naissance du WWW, qu’on peut aussi appeler le web (la toile) des documents. Les documents (pages web) sont identifiés par des URLs et sont rattachés entre eux par des liens. En résumé, le web des documents livre des informations pour les humains. Mais pas seulement!
La sophistication du web est-elle contre-productive? D’un langage de marquage à un langage de «maquillage»
La sophistication du web est-elle contre-productive? pour aboutir au Web 2.0 (Social Web)
Où sont les données?
Pourquoi améliorer la situation? Nos sites web actuels ne sont pas des canaux de publication de données La publication de données permet d’utiliser les nouvelles technologies informatiques pour découvrir de nouvelles connaissances Ces compétences pointues ne sont en général pas dans nos institutions Nous devons simplifier l’accès aux données si nous voulons éviter que seuls les GAFA puissent les extraire La main d’œuvre en Suisse est chère – nous devons donc éviter de mettre des barrières en générant du travail inutile
Comment améliorer la situation? Choisir un mode d’exportation / mise à disposition des données Effort : préparation et utilisation Institution faible faible faible moyen moyen élevé Utilisateur très élevé élevé élevé très élevé moyen élevé
Comment utiliser le web pour publier des données Le Web des données (linked data, en anglais) est une initiative du W3C (Consortium World Wide Web) visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d'informations. Source : Wikipédia
Comment représenter des données structurées? RDF: Resource Description Framework Sujet Objet Prédicat Le livre «Les Misérables» a été écrit par Victor Hugo lesMiserables victorHugo creator
RDF peut décrire sans perte le contenu d’une BD ID Nom Prénom email 1234 Cochard Jean-Luc jean.cochard@bar.admin.ch 1235 Merzaghi Michele michele.merzaghi@bar.admin.ch Nom Nom 1235 Merzaghi Prénom 1234 Cochard Prénom Michele Jean-Luc email michele.marzaghi@ email jean-luc.cochard@
La force du web – les URLs http://archivesonline.org http://www.bar.admin.ch http://ge.ch/archives/ A la fois un identifiant unique et une existence digitale
Les URIs pour avoir des noms uniques lesMiserables victorHugo creator Comment rendre cela unique et clair pour une communauté étendue? http://example.org/book/lesMiserables http://example.org/person/victorHugo http://purl.org/dc/elements/1.1/creator PREFIX dc : <http://purl.org/dc/elements/1.1/> http://example.org/book/lesMiserables http://example.org/person/victorHugo dc:creator
Triple-store au centre du modèle Utilisateurs triple-store SPARQL-endpoint SPARQL : SPARQL Protocol And RDF Query Language
SPARQL-Endpoint
URI = URL : chaque entité existe comme page web
Représentation des données
Fournisseurs de données Résumé Fournisseurs de données L E T R D F