Journée de lAUSIDEF – Lyon, 10-11 juin 2010 RDF et le Web de données.

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
W3Line | 10 Ter, Rue Pasteur – BOURG LES VALENCE | Tél. : – Fax : | – Web :
Corese Moteur de recherche sémantique pour RDF
Le langage de requêtes SPARQL SPARQL Protocol And RDF Query Language
Le langage de requêtes SPARQL SPARQL Protocol And RDF Query Language
Implémentation de la gestion de réseau dans Windows 2000 et plus
XML - Henry Boccon-Gibod 1 XML, Langage de description La question du choix de formalismes Les entités et leur représentations modalités de modèles et.
Les espaces de nommage XML par Philippe Poulard 1
Documentation numérique sur l’Internet
Cours Web sémantique Langage SPARQL
Ontologie, Méta-données, Sémiotiques
De nouveaux modèles de données pour les catalogues de bibliothèques Médiathèque de la Cité de la musique, Paris - France Patrice Verrier, Coordinateur.
Domaines nominaux XSLT
Design Pattern MVC En PHP5.
Métadonnées pour les thèses numériques françaises
Initiation aux bases de données et à la programmation événementielle
Soutenance de stage · Par : Guillaume Prévost · Entreprise : Cynetic
1 ARCHITECTURE DACCÈS la méthode générale modèle de données définitions module daccès / modules métiers construction des modèles les modules daccès, les.
Nouvelles Pratiques des catalogues. Rendre les données plus utiles sur le web. Publier des pages HTML sur lesquelles les utilisateurs et les moteurs de.
Développement d’applications web
Etude des Technologies du Web services
Intégrer IdRef dans les applications documentaires de votre université. Pourquoi ? Comment ? Atelier JABES2011.
XML-Family Web Services Description Language W.S.D.L.
Les autorités Sudoc au-delà du Sudoc JABES Stratégie ABES Connecter des notices bibliographiques aux autorités Sudoc » Notamment les Personnes Quelles.
Web Sémantique: Le Relief Actuel
Chap 4 Les bases de données et le modèle relationnel
Le portail des MSH
1 Initiation aux bases de données et à la programmation événementielle Cours N°9 : Gestion de la cohérence avec des sous-formulaires. Support de cours.
Université de La Rochelle Saisie et Mise à jour des fiches ECTS le 01/12/2000.
RDF(S)
L’utilisation des bases de données
Gestion des bases de données
Services fournis par le SI et technologies associées
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
Chercher et trouver Module 1 Déroulement : Souhaiter la bienvenue
Web sémantique : Web de demain
Management of Information Technology - e-business
Conseil de la Documentation, 2 juillet 2010 Évolutions fonctionnelles du SID en 2010.
ENS-LYON juin 2013 Evolution des catalogues : Métadonnées, Interopérabilité, web sémantique, FRBR et RDA Participer.
Initiation aux bases de données et à la programmation événementielle
La veille numérique : un outil pour s'informer intelligemment &
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
Content Management System CMS. Pourquoi ? Obligation de ressaisir des contenus publiés à plusieurs endroits Pas d’outils de gestion de qualité de l’information.
E-Technology lab Plateformes, Technologies et Architectures pour les systèmes eGouvernement Par: Dr Mamadou Koné Université Laval, Québec, Canada et Houda.
Les réseaux - Internet Historique Réseau local Internet Les protocoles
Web sémantique Par Lydia Carine Mampais KI Bamba SISSOKO
Mediadix – Novembre 2013 Marie-Line GUILLAUMEE (BIU Sorbonne)
Comment trouver un document dans la base de données du CDI
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Martine Toussaint Desir
Moteurs de recherche ontologiques
Web sémantique est pratique documentaire
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
Soutenance du mémoire de synthèse
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
Cours sur le DOI COULET Alban GREMONT Baptiste GIDO2A Le 13/12/2007.
La veille à l’Institut national du cancer Identifier des sources d’information fiables Rencontre De la veille à la gestion des connaissances, Bordeaux,
eXtensible Markup Language. Généralités sur le XML.
Analyse du sujet -1- Eléments issus de la lecture du sujet
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Présenter une bibliographie en lycée
1 Initiation aux bases de données et à la programmation événementielle Cours N°8 : Gestion de la cohérence avec des zones de liste déroulantes. Souheib.
Faire un dossier documentaire
Parcours FRBR 3 : format RDF et FRBRisation Le « J.e-cours » va bientôt commencer, merci de votre patience…… Merci de désactiver votre micro : - Repérer.
Bibliothèque Centrale de l’École Polytechnique PSC X2014 Mai-Juin 2015 Module 3 Rédiger sa biblio Formation à la recherche documentaire Module 1 Où trouver.
Préparé par : Marouane FELJA
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 4 Support de cours rédigé par Bernard COFFIN Université.
Transcription de la présentation:

Journée de lAUSIDEF – Lyon, juin 2010 RDF et le Web de données

En guise de préambule…

Problèmes dintégration des outils de référencement dans les systèmes dinformation ou systèmes dingénierie documentaire Catalogue local Catalogue collectifPériodiques en ligne Thèses en ligne e-books Ressources pédagogiques Ressources multimédias Bases de signets Enregistrements sonores Catalogues de bibliothèques associées ou partenaires Archives ouvertes

Un point dentré unique ? Catalogue local Catalogue collectif Périodiques en ligne Thèses en ligne e-books Ressources pédagogiques Ressources multimédias Bases de signets Enregistrements sonores Catalogues de bibliothèques associées ou partenaires Archives ouvertes Ok Catalogue de la bibliothèque Documentation scientifique et technique Bibliothèques / agences bibliographiques nationales Supports pédagogiques Documents multimédias Revues e-books Vidéos oai-pmh API OpenURL Z SRU Z WebService v v v v v v iso 2709

Web invisible (« deep web, hidden web ») Le Web invisible ou Web caché est la partie du Web correspondant à l'ensemble des documents qui ne sont pas indexés par les outils de recherche traditionnels. « Les ressources du Web invisible comprennent, entre autres -les sites Web construits autour d'une base de données (interrogeable uniquement par un moteur de recherche interne) - les pages accessibles par un formulaire de recherche - les pages protégées par un mot de passe - les pages interdites aux robots d'indexation - les pages écrites dans des formats propriétaires - les intranets et - les extranets. » [AFUL] Les données sont contrôlées par des applications, et chaque application les garde pour son propre usage… Pour accéder à ces données, un utilisateur doit passer par un portail ou un moteur de recherche dédié qui créée un chemin vers le données prisonnières dune base de données.

Catalogue local Catalogue collectif Périodiques en ligne Thèses en ligne e-books Ressources pédagogiques Ressources multimédias Bases de signets Enregistrements sonores Catalogues de bibliothèques associées ou partenaires Archives ouvertes Ok Catalogue de la bibliothèque Documentation scientifique et technique Bibliothèques / agences bibliographiques nationales Supports pédagogiques Documents multimédias Revues e-books Vidéos oai-pmh API OpenURL Z SRU Z WebService v v v v v v iso 2709

SQL > select base1.UNIMARC.UNIMARC12,base1.UNIMARC.UNIQUE_KEY from base1.UNIMARC,system.EXEMPLAIRE where substr(system.EXEMPLAIRE.CATALOG_ID,17,10) = to_char(base1.UNIMARC.UNIQUE_KEY) and system.EXEMPLAIRE.SECTION='1' and system.EXEMPLAIRE.STATUS in (1,2,3,5,6,100,101,110,210) and base1.UNIMARC.UNIMARC12 in ('2008', '2009'); Je veux restreindre un corpus de résultats aux ouvrages de sciences édités en 2008 et 2009

Il y a 10 ans, lenjeu était de promouvoir son catalogue sur le web (« opacweb »). On consacre aujourdhui encore beaucoup de temps à ladministration dun SIGB ou dun SID w eb opac web réseau interne BDD On travaille à rendre son application interopérable, capable daller puiser des informations dans des sources hétérogènes, et capable de fournir des informations à dautres applications. Demain on travaillera peut-être à rendre nos données compatibles avec le web sémantique BDD opac web Réseaux sociaux moteurs commerciaux Agences bibliograph iques

SIGB Z3950 OAI-PMH SID OpenURL SRU ENT shibboleth

VS

Le Web sémantique

WEB de documents http

Problème :Le contenu du web est fait pour être lu par des humains, pas par des ordinateurs. Problème? : avec laccroissement du nombre de pages web, les recherches deviennent de moins en moins efficaces. on arrive aujourdhui à la limite de lefficacité des metatags. (crawlés par moteurs de recherche). Une éventuelle solution ? Consisterait rendre ces contenus compréhensibles par des machines, que les machines puissent identifier leur nature sans ambiguïté. >> dune certaine façon, donner du sens au contenu (doù « sémantique »). Mise en œuvre : il faut mettre à disposition un langage pour décrire des ressources de façon intelligibles (RDF) qui va permettre de définir des structures. RDF est plus mode de stockage des définitions, un modèle, donc Une remarque :il faut distinguer cette entreprise de lIA qui centralise les données dans une base de données, alors quavec RDF, elles peuvent être nimporte où, sans quon ait besoin de les stocker : chaque élément RDF peut être appelé par un URI. Pour éviter que les « agents » ou programmes rencontrent des situations ambiguës, (homonymies ou synonymies), il faut introduire des ontologies, qui reposent sur des classes (OWL) Des promesses : les applications reposant sur ces structures de données vont pouvoir traiter et manipuler des données sans les humains Des projets ? Pour linstant le web sémantique est mis en application dans le domaine du commerce électronique, mais cela peut sétendre dautres types de données (les bibliothèques, peut-être ?) et dautres biens de consommation (domotique par exemple). Du boulot : il faut que les documents soient décrits comme lattend le web sémantique…

web « traditionnel »vsweb sémantique « espace universel déchange consultable par tout internaute » objectif : apporter la sémantique formelle nécessaire pour que les machines, elles aussi, puissent consulter et interpréter les informations présentes sur le web sappuie sur 3 couches de base XML : support ou cadre dimplémentation RDF : cadre de description des ressources, modèle dannotation sous forme dURI OWL : moyen décrire des ontologies sur le web « ensemble structuré de savoirs dans un domaine de connaissance particulier »

Web… sémantique ? Gère des documents.htm,.html.pdf.xml.mp3 Gère des « objets » personnes endroits événements musique films.??? organisations… concerts σ μα

événement lévenement ou comporte des propriétés qui peuvent être supportées par des web services :,,, Ces propriétés ou « sèmes » sont reliées entre elles. on pourrait ajouter et proposer un, suivi dune la aurait elle-même comme propriété obligatoire :,,,, etc.

Quelques mots-clés pour indexer cette journée… RDF* OWL* RDFS* FRAD FRBR RDA SKOS FRBRoo FOAF XML * NB la plupart des documentions importantes de W3C ont été traduites en français ! SPARQL*

RDF : Resource description Framework = Cadre de description des ressources « Modalité dannotation dune ressource (sous forme dURI) sur la base dun vocabulaire partagé. » La syntaxe de base sexprime sous forme dun triplet resource property literal On parle aussi de représentation par « graphe »

Blaise Cendrars est_auteur_de Rhum <rdf:RDF xmlns:rdf=" " xmlns:s=" Blaise Cendrars Expression du triplet dans un fichier RDF : NAME SPACE obligatoire A propos de Rhum, il y a un auteur : Blaise Cendrars On a utilisé lattribut rdf:about. Il existe dautres attributs : rdf:ID, rdf:type, rdf;bag, rdf:seq, rdf:alt On a introduit la relation s:creator, mais elle peut être subdivisée n sous-classes ; interprète, compositeur, préfacier, etc.

Son outil de recherche : SPARQL Les requêtes SPARQL sinspirent de SQL (modèle simple). On peut ajouter une clause DISTINCT après SELECT ou LIMIT, OFFSET, et ORDER après WHERE des clauses : OPTIONAL UNION FILTER Ex: rapatrier le nom dune personne et éventuellement son pict Ex. Trouver les personnes qui ont un et celles qui ont un pict Impose des contraintes sur les variables (Ex. on veut trouver toutes les auteurs des publications du mois de septembre 2009) Dans la documentation SPARQL, il est fait mention dune autre syntaxe un peu différente : Turtle (pour « Terse RDF Triple Language) Soit lensemble de données ns:. :book1 dc:title "SPARQL Tutorial". :book1 ns:price 42. :book2 dc:title "The Semantic Web". :book2 ns:price 23. Soit la requête : PREFIX dc: PREFIX ns: SELECT ?title ?price FROM WHERE { ?x dc:title ?title. OPTIONAL { ?x ns:price ?price. FILTER (?price < 30) } } Résultat :| title | price | ============================== | "The Semantic Web" | 23 | | "SPARQL Tutorial" | |

RDF-S (RDF-Schema) Permet de définir un modèle ou schéma dans un domaine dexpertise : - définition de hiérarchies de classes et de propriétés - formulation de contraintes. Comment déclarer une classe de ressource : 2 moyens 1. utiliser lattribut rdf:type en se référant au type Class <rdf:Description rdf:about=" Class"/> 2. utiliser lespace de nom rdfs à laide dune déclaration xmlns:rdfs= #Artist Dans un éditeur de graphe, la fonction AddSubclassOf permet dajouter une sous-classe #Painter à la Classe #Artist #Painter

Pourquoi passer de RDF-S à OWL ? RDF-S apparaît vite comme insuffisant, en empruntant des éléments de la logique formelle : rdfs:range définit le domaine de valeurs dune propriété quelle que soit la classe concernée Ex. ne permet pas dexprimer que les vaches ne mangent que de lherbe, alors que dautres sortes danimaux mangent aussi de la viande Pas de possibilité dexprimer que deux classes sont disjointes Ex. La classe des hommes et des femmes sont disjointes Ne permet pas de créer des classes par combinaison ensembliste dautres classes (inter, union, complément) Ex. Si lon veut construire la classe Personne comme lunion disjointe des classes Hommes et Femmes Ne permet pas de définir de restriction sur le nombre doccurrences de valeurs que peut prendre une propriété. Ex. On ne peut pas dire quune personne a exactement deux parents ne permet pas de définir certaines caractéristiques des propriétés: transitivité (ex: estPlusGrand- Que), unicité (ex: estLePèreDe), inverse (ex: mange est la propriété inverse de estMangéPar). [Paul] – a_pour_sœur [Virginie] Si les contraintes dexpressivité sont trop grandes, il faut passer à des définitions ontologiques « déportées », extérieures au schéma, qui vont uniquement gérer la complexité des relations logiques entre classes, doù OWL

Ontologies ?

ville code postal mairie site internet département région pays(OWL)

ville code postal mairie site internet département région pays adresse téléphone URL

Et pour les bibliothèques ?

Il faut absolument veiller à conserver les fonctionnalités de recherche (!), (Ce qui donne du sens au travail des bibliothécaires et de la valeur aux SID.) mais elles peuvent émerger/sexprimer différemment. Elles peuvent peut-être saffiner, mais pas disparaître. Contrat des FRBR : Un catalogue doit permettre de « trouver, identifier, sélectionner et obtenir » une ressource (B. Tillet) « Je cherche les Variations Goldberg de J.-S. Bach …» Mais « Jaimerais bien écouter les Variations Goldberg, interprétées par Daniel Barenboim, en concert à Buenos Aires en Je crois que ça existe chez Erato » Rendre les applications interopérables : on sait faire (à peu près…) Rendre les données portables dans dautres contextes, pour dautres usages et utilisables par dautres médias : on ne sait pas (encore) faire (pas pour tout en tout cas).

[A propos du web sémantique] Parmi les changements que les bibliothèques vont avoir besoin de mettre en oeuvre pour y pourvoir doit figurer la migration du catalogue public dune base de données de notices bibliographiques, autonome et isolée, vers un ensemble de données hyperliées qui peut interagir avec les ressources informationnelles du web. On pourra alors intégrer les données documentaires aux environnements numériques de travail des utilisateurs, auxquels les bibliothèques apporteront leur service. ALAs Library Technology Reports is publishing Understanding the Semantic Web: Bibliographic Data and Metadata by Karen CoyleUnderstanding the Semantic Web: Bibliographic Data and MetadataKaren Coyle

examen programme document diplôme préparé droits de prêt situation localisation droits daccès heures douverture

examen programme document diplôme préparé droits de prêt situation localisation droits daccès heures douverture

examen programme document diplôme préparé droits de prêt situation localisation droits daccès heures douverture

programme document droits daccès auteur titre éditeur mots-clés niveau « événement » niveau bibliographique œuvre manifestation

La conclusion approche… …ou : « pourquoi sinquiéter ? » …et : « pour quoi sinquiéter ? »

##$a $bbr. 073 #0$a programming$bTexte imprimé$eWeb applications and Web services with JSP and ASP$fAlexander Nakhimovsky, Tom Myers 210 ##$aBerkeley, Calif.$cApress$dcop ##$a1 vol. (XVIII-555 p.)$cill., couv. ill. en coul.$d24 cm 225 voice$ebooks for professionals by professionals 300 ##$aLa couv. porte en plus : "Learn practical and up-to-date information on XML specifications and related technologies, including XLink, XPointer, XML Schema, RELAX NG, SOAP, WSDL, UDDI; "Find substantial examples in Java and VB/VB Script that are written to be understandable by any programmer, whatever his or her language background"; "Create Web applications and Web services that use DOM, SAX, and XSLT to process XML data, both virtual (generated in memory) and persistent (stored in files or databases) 320 ##$aIndex 410 for professionals by professionals 605 server pages$2lc 606 ##$aXML (Document markup language)$2lc 606 ##$aMicrosoft Visual BASIC$2lc 606 ##$aJavaServer pages$2lc 606 ##$aWeb sites$xDesign$2lc 606 ##$aWeb site development$2lc 606 ##$aJava (Computer program language)$2lc 606 ##$ XML (langage de balisage)$2rameau 606 ##$ JavaServer pages (logiciel)$2rameau 606 ##$ Sites Web -- Développement$2rameau 606 ##$ Fournisseurs de services applicatifs$2rameau 680 ##$aQA76.76.H94$bN355x #1$ Nakhimovsky, Alexander D.$ #1$ Myers, Thomas J. ( )$ #0 $bPPT$gAACR2 801 #1 $bPPT$gAACR2

##$a $bbr. 073 #0$a programming$bTexte imprimé$eWeb applications and Web services with JSP and ASP$fAlexander Nakhimovsky, Tom Myers 210 ##$aBerkeley, Calif.$cApress$dcop ##$a1 vol. (XVIII-555 p.)$cill., couv. ill. en coul.$d24 cm 225 voice$ebooks for professionals by professionals 300 ##$aLa couv. porte en plus : "Learn practical and up-to-date information on XML specifications and related technologies, including XLink, XPointer, XML Schema, RELAX NG, SOAP, WSDL, UDDI; "Find substantial examples in Java and VB/VB Script that are written to be understandable by any programmer, whatever his or her language background"; "Create Web applications and Web services that use DOM, SAX, and XSLT to process XML data, both virtual (generated in memory) and persistent (stored in files or databases) 320 ##$aIndex 410 for professionals by professionals 605 server pages$2lc 606 ##$aXML (Document markup language)$2lc 606 ##$aMicrosoft Visual BASIC$2lc 606 ##$aJavaServer pages$2lc 606 ##$aWeb sites$xDesign$2lc 606 ##$aWeb site development$2lc 606 ##$aJava (Computer program language)$2lc 606 ##$ XML (langage de balisage)$2rameau 606 ##$ JavaServer pages (logiciel)$2rameau 606 ##$ Sites Web -- Développement$2rameau 606 ##$ Fournisseurs de services applicatifs$2rameau 680 ##$aQA76.76.H94$bN355x #1$ Nakhimovsky, Alexander D.$ #1$ Myers, Thomas J. ( )$ #0 $bPPT$gAACR2 801 #1 $bPPT$gAACR2

id= oeuvre.Titre=« XML Programming » id= Personne.Nom= Tom Myers id= Personne.Nom= Alexander Nakhimovsky id= édition id= vedette rameau.Forme retenue= XML (langage de balisage) id= Langue.Libellé=« English » id= Collection.Titre=« Books for profesionnals » a_pour_auteur a_pour_sujet a_pour_langue appartient_à a_pour_éditeur adapté de Yann Nicolas

On peut présumer que le formalisme introduit par RDF et OWL permet de mieux structurer les données pour les présenter sur le web. MAIS : produire des données sous forme de graphe nest pas dans les habitudes. Pour les bibliothécaires, Il faudra passer dune représentation syntagmatique / paradigmatique à une représentation atomique Les outils pour produire ces données sont demandent à être améliorés (bien quoffrant déjà de grandes possibilités : Cela ne se fera quau prix de «changements assez importants dans la gestion des flux informationnels ». Cela se produira sans doute par étapes, par exemple en commençant par lintroduction de microformats (« ensembles de conventions permettant dajouter des notions sémantiques aux documents html » sans recourir à de nouveaux langages. Cela ne se fera pas sans une observation stricte des normes et des formats ! Pas de web sémantique sans saisie des données… …ni avec un minimum de contrôle des données. cest nous ! cest nous aussi !

Journée de lAUSIDEF – Lyon, juin 2010 Merci de votre attention !