Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parNoé Courtois Modifié depuis plus de 10 années
1
Sudoc, Calames, theses.fr et le Web de données Atelier JABES2011
2
Vers le Web de données ApplicationLancementFormat RDFDonnées à jourRichesse des liens Calames2008RDFaOui+ theses.fr2010RDFa + RDF/XML 2011 Oui+ IdRef2010RDF/XML + RDFa 2011 Oui++ Sudoc2011RDF/XML 2011 Oui+++
3
Il faut participer au Web de données [Acquis]
4
Objectifs de latelier Faire un bilan détape Montrer les données Justifier certains choix Expliquer comment ça marche Manipuler quelques outils simples Esquisser la suite du travail à mener – Nous – Vous
5
Partons du connu
7
Sagit-il de données RDF ou dune simple notice Dublin Core ?
8
RDF nu
9
about En RDF, il faut expliciter de quoi on parle en lidentifiant par une URL : http://www.sudoc.fr/013041932/id http://www.sudoc.fr/013041932/id http://www.sudoc.fr/013041932/id est lidentifiant du document décrit http://www.sudoc.fr/013041932/id http://www.sudoc.fr/013041932/id est décrit à cette page-là http://www.sudoc.fr/013041932 http://www.sudoc.fr/013041932/idhttp://www.sudoc.fr/013041932
10
triplets En RDF, tout est décomposé en triplets Chaque triplet est indépendant Chaque triplet pourrait être stocké séparément Pas de notice finie Une autre source peut la compléter, si elle parle de la même chose : http://www.sudoc.fr/013041932/idhttp://www.sudoc.fr/013041932/id Interopérabilité. Extensibilité.
11
Identifier la langue avec le référentiel Lexvo
13
Mettre en relation un document et une langue La langue nest pas un code (fre) La langue est une entité à part entière – Avec son propre identifiant http://lexvo.org/id/iso639-3/fra http://lexvo.org/id/iso639-3/fra – et ses propres propriétés La propriété dcterms:language met en relation deux entités
14
http://www.lexvo.org/id/iso639-3/frahttp://www.lexvo.org/id/iso639-3/fra décrite en HTML
15
http://www.lexvo.org/id/iso639-3/fra http://www.lexvo.org/id/iso639-3/fra décrite en RDF
16
De fil en aiguille La description de la langue poursuit la description du document Sudoc Où sarrêter ? Cest sans fin Cest le Web de données
17
Identifier les personnes avec IdRef
19
IdRef, fournisseur didentifiants et de référentiels www.idref.fr = application Web ouverte www.idref.fr – Ouverte sur le Web de données – Ouverte à dautres applications IST (France) Par son Web Service de recherche Par ses fonctions dintégration (Javascript) Différents moyens/services pour récupérer et exploiter les identifiants et les données des autorités Sudoc ABES.
20
IDREF Autorités Sudoc Sudoc et IdRef Sudoc
21
Autorités Sudoc Les autorités Sudoc, pivot du Linked data ABES theses.fr Calames Sudoc Thèses soutenues et Thèses en cours (2011)
22
RDFa de Calames Pas de page RDF/XML Le RDF est caché dans le HTML de http://www.calames.abes.fr/pub/ms/Calames-2010914119419211 http://www.calames.abes.fr/pub/ms/Calames-2010914119419211 Pour révéler le RDF caché, utiliser un outil comme
23
RDFa de Calames http://www.calames.abes.fr/pub/ms/Calames-2010914119419211
24
RDFa de theses.fr Pas encore de page RDF/XML Le RDF est caché dans le HTML de http://www.theses.fr/2009TOUR3802 http://www.theses.fr/2009TOUR3802 Pour révéler le RDF caché, utiliser un outil comme
25
Les thèses portant sur les correspondants de Goethe PREFIX foaf: PREFIX dc: PREFIX ead: PREFIX tef: SELECT ?these { ?ms dc:creator. ?ms ead:destinataire ?destinataire. ?these a tef:Thesis. ?these dc:subject ?destinataire } La requête exploite les données Calames et STAR
26
Lier les données à IdRef, au-delà de lABES
27
Autorités Sudoc Linked data IST.fr ? theses.fr Calames Sudoc Thèses soutenues et Thèses en cours ( 2011) HAL ? revues. org ? revues. org ? Persée ? Presses univ. de Y ? Plateforme pédagogiq. ? ? ?
28
IdRef comme nœud régional Positionnement dIdRef : IST français En complémentarité avec dautres fournisseurs didentifiants et de référentiels : – Local : identifiants propres à une application, à un annuaire – Régional : BnF, auteurs HAL, CERL, DAI (NL)CERLDAI – Global : VIAF, DBpedia
29
Autorités Sudoc theses.fr Calames Sudoc HAL ? revues. org ? revues. org ? Persée ? Presses univ. de Y ? Plateforme pédagogiq. ? Autorités BnF DBpedia VIAF
30
Lier les données de lIST entre elles, au-delà dIdRef
31
Autorités Sudoc Linked data IST.fr ? Les labos ! theses.fr Calames Sudoc HAL revues. org revues. org Persée Presses univ. de Y Plateforme pédagogiqu e X ? ? Référentiel des laboratoires
32
Autorités Sudoc Linked data IST.fr ? Les affiliations theses.fr Calames Sudoc HAL revues. org revues. org Persée Presses univ.s de Y Plateforme pédagogiqu e X PRISMES (AMUE) locaux Référentiel des laboratoires
33
On parle de la même chose owl:sameAs
34
Identifier et nommer les personnes avec IdRef
36
Identifier les concepts avec IdRef et RAMEAU
38
IdRef et Rameau Identifiants IdRef pour Rameau A lier aux identifiants canoniques, ceux du centre national Rameau (BnF) quand ils seront officiellement publiés. MeSH Dewey
39
Préciser le rôle des agents avec les MARC Relators
42
Lembarras du choix ? dcterms:creator dcterms:contributor marcrel:aut rda:authorWork tef:auteur ?
43
Qui utilise explicitement marcrel:aut utilise implicitement dc:contributor
44
Raisonnement Le Sudoc dit : http://www.sudoc.fr/012367206/id marcrel:aut http://www.idref.fr/ 026975262 /id La Bibliothèque du Congrès dit (ici) :ici Marcrel:aut rdfs:subPropertyOf dc:contributor Un outil de raisonnement pourra en déduire que : http://www.sudoc.fr/012367206/id dc:contributor http://www.idref.fr/ 026975262 /id
45
Qui utilise marcrel:aut peut également tef:auteur, malgré la redondance apparente
46
tef:auteur Ne semble rien dire de plus que marcrel:aut Mais possède une propriété intéressante : Cest une propriété fonctionnelle = Une thèse ne peut avoir quun auteur = si une thèse a deux auteurs, cest deux fois le même !
47
Raisonnement Quelquun dit : http://www.sudoc.fr/012367206/id tef:auteur http://www.idref.fr/035200898/id Quelquun dautre dit : http://www.sudoc.fr/012367206/id tef:auteur http://www.viaf.org/123456789 Une ontologie TEF dit : http://www.abes.fr/tef/auteur rdf:type owl:ObjectProperty owl:FunctionalProperty (une thèse ne peut avoir qu1 auteur, au sens de tef:auteur) (mais elle peut avoir 2 dc:creator) Un outil de raisonnement pourra en déduire que : http://www.idref.fr/035200898/id owl:sameAs http://www.viaf.org/123456789
48
DÉMO Fichier (fusion des triplets RDF) : http://193.52.69.127/xml/rdf/sperber_turtle.txt http://193.52.69.127/xml/rdf/sperber_turtle.txt Outils de raisonnement : http://www.ivan-herman.net/Misc/2008/owlrl/ http://inspector.sindice.com
49
Raisonnement RDF, cest de la logique Travaux en cours avec le LIRMM pour ADONIS sur les données Persée Oblige à qualité des données et rigueur de la modélisation Sinon : on génère nimporte quoi ! Usages : – Enrichir les données – Expliciter les données – Mettre au jour des incohérences
50
Page RDF complète
52
Une pincée de RDA et de FRBR
53
CONCLUSION
54
Convertir en RDF Aussi indéterminé que « convertir en Excel » ! Quelle modélisation ? Quels vocabulaires réutiliser ? Forger son propre vocabulaire ? Nos données historiques sont-elles éligibles à ces nouvelles modélisations ? » cf. notre dc:format et notre dc:publisher
55
Trois lièvres à la fois PrioritéObjectifVocabulaires Parler à la cantonadeInteropérabilité généraledc, foaf Modéliser de manière exhaustive nos données métier Se passer de MARCrda, isbd, frbr Faire raisonner les donnéesTirer le maximum des données Contrôler leur qualité Aide au catalogage ad hoc si nécessaire
56
La suite Enrichir encore les conversions en RDF Multiplier si nécessaire les vocabulaires employés, sans craindre les redondances Ajouter des liens internes et externes (IST française, BnF, OCLC, Dbpedia, Freebase, etc.) Encourager les partenaires à diffuser leurs données en RDF, en sappuyant sur des référentiels communs (IdRef) Continuer à exploiter ces données en RDF avec le LIRMM et dautres
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.