La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Sudoc, Calames, theses.fr et le Web de données Atelier JABES2011.

Présentations similaires


Présentation au sujet: "Sudoc, Calames, theses.fr et le Web de données Atelier JABES2011."— Transcription de la présentation:

1 Sudoc, Calames, theses.fr et le Web de données Atelier JABES2011

2 Vers le Web de données ApplicationLancementFormat RDFDonnées à jourRichesse des liens Calames2008RDFaOui+ theses.fr2010RDFa + RDF/XML 2011 Oui+ IdRef2010RDF/XML + RDFa 2011 Oui++ Sudoc2011RDF/XML 2011 Oui+++

3 Il faut participer au Web de données [Acquis]

4 Objectifs de latelier Faire un bilan détape Montrer les données Justifier certains choix Expliquer comment ça marche Manipuler quelques outils simples Esquisser la suite du travail à mener – Nous – Vous

5 Partons du connu

6

7 Sagit-il de données RDF ou dune simple notice Dublin Core ?

8 RDF nu

9 about En RDF, il faut expliciter de quoi on parle en lidentifiant par une URL : http://www.sudoc.fr/013041932/id http://www.sudoc.fr/013041932/id http://www.sudoc.fr/013041932/id est lidentifiant du document décrit http://www.sudoc.fr/013041932/id http://www.sudoc.fr/013041932/id est décrit à cette page-là http://www.sudoc.fr/013041932 http://www.sudoc.fr/013041932/idhttp://www.sudoc.fr/013041932

10 triplets En RDF, tout est décomposé en triplets Chaque triplet est indépendant Chaque triplet pourrait être stocké séparément Pas de notice finie Une autre source peut la compléter, si elle parle de la même chose : http://www.sudoc.fr/013041932/idhttp://www.sudoc.fr/013041932/id Interopérabilité. Extensibilité.

11 Identifier la langue avec le référentiel Lexvo

12

13 Mettre en relation un document et une langue La langue nest pas un code (fre) La langue est une entité à part entière – Avec son propre identifiant http://lexvo.org/id/iso639-3/fra http://lexvo.org/id/iso639-3/fra – et ses propres propriétés La propriété dcterms:language met en relation deux entités

14 http://www.lexvo.org/id/iso639-3/frahttp://www.lexvo.org/id/iso639-3/fra décrite en HTML

15 http://www.lexvo.org/id/iso639-3/fra http://www.lexvo.org/id/iso639-3/fra décrite en RDF

16 De fil en aiguille La description de la langue poursuit la description du document Sudoc Où sarrêter ? Cest sans fin Cest le Web de données

17 Identifier les personnes avec IdRef

18

19 IdRef, fournisseur didentifiants et de référentiels www.idref.fr = application Web ouverte www.idref.fr – Ouverte sur le Web de données – Ouverte à dautres applications IST (France) Par son Web Service de recherche Par ses fonctions dintégration (Javascript) Différents moyens/services pour récupérer et exploiter les identifiants et les données des autorités Sudoc ABES.

20 IDREF Autorités Sudoc Sudoc et IdRef Sudoc

21 Autorités Sudoc Les autorités Sudoc, pivot du Linked data ABES theses.fr Calames Sudoc Thèses soutenues et Thèses en cours (2011)

22 RDFa de Calames Pas de page RDF/XML Le RDF est caché dans le HTML de http://www.calames.abes.fr/pub/ms/Calames-2010914119419211 http://www.calames.abes.fr/pub/ms/Calames-2010914119419211 Pour révéler le RDF caché, utiliser un outil comme

23 RDFa de Calames http://www.calames.abes.fr/pub/ms/Calames-2010914119419211

24 RDFa de theses.fr Pas encore de page RDF/XML Le RDF est caché dans le HTML de http://www.theses.fr/2009TOUR3802 http://www.theses.fr/2009TOUR3802 Pour révéler le RDF caché, utiliser un outil comme

25 Les thèses portant sur les correspondants de Goethe PREFIX foaf: PREFIX dc: PREFIX ead: PREFIX tef: SELECT ?these { ?ms dc:creator. ?ms ead:destinataire ?destinataire. ?these a tef:Thesis. ?these dc:subject ?destinataire } La requête exploite les données Calames et STAR

26 Lier les données à IdRef, au-delà de lABES

27 Autorités Sudoc Linked data IST.fr ? theses.fr Calames Sudoc Thèses soutenues et Thèses en cours ( 2011) HAL ? revues. org ? revues. org ? Persée ? Presses univ. de Y ? Plateforme pédagogiq. ? ? ?

28 IdRef comme nœud régional Positionnement dIdRef : IST français En complémentarité avec dautres fournisseurs didentifiants et de référentiels : – Local : identifiants propres à une application, à un annuaire – Régional : BnF, auteurs HAL, CERL, DAI (NL)CERLDAI – Global : VIAF, DBpedia

29 Autorités Sudoc theses.fr Calames Sudoc HAL ? revues. org ? revues. org ? Persée ? Presses univ. de Y ? Plateforme pédagogiq. ? Autorités BnF DBpedia VIAF

30 Lier les données de lIST entre elles, au-delà dIdRef

31 Autorités Sudoc Linked data IST.fr ? Les labos ! theses.fr Calames Sudoc HAL revues. org revues. org Persée Presses univ. de Y Plateforme pédagogiqu e X ? ? Référentiel des laboratoires

32 Autorités Sudoc Linked data IST.fr ? Les affiliations theses.fr Calames Sudoc HAL revues. org revues. org Persée Presses univ.s de Y Plateforme pédagogiqu e X PRISMES (AMUE) locaux Référentiel des laboratoires

33 On parle de la même chose owl:sameAs

34 Identifier et nommer les personnes avec IdRef

35

36 Identifier les concepts avec IdRef et RAMEAU

37

38 IdRef et Rameau Identifiants IdRef pour Rameau A lier aux identifiants canoniques, ceux du centre national Rameau (BnF) quand ils seront officiellement publiés. MeSH Dewey

39 Préciser le rôle des agents avec les MARC Relators

40

41

42 Lembarras du choix ? dcterms:creator dcterms:contributor marcrel:aut rda:authorWork tef:auteur ?

43 Qui utilise explicitement marcrel:aut utilise implicitement dc:contributor

44 Raisonnement Le Sudoc dit : http://www.sudoc.fr/012367206/id marcrel:aut http://www.idref.fr/ 026975262 /id La Bibliothèque du Congrès dit (ici) :ici Marcrel:aut rdfs:subPropertyOf dc:contributor Un outil de raisonnement pourra en déduire que : http://www.sudoc.fr/012367206/id dc:contributor http://www.idref.fr/ 026975262 /id

45 Qui utilise marcrel:aut peut également tef:auteur, malgré la redondance apparente

46 tef:auteur Ne semble rien dire de plus que marcrel:aut Mais possède une propriété intéressante : Cest une propriété fonctionnelle = Une thèse ne peut avoir quun auteur = si une thèse a deux auteurs, cest deux fois le même !

47 Raisonnement Quelquun dit : http://www.sudoc.fr/012367206/id tef:auteur http://www.idref.fr/035200898/id Quelquun dautre dit : http://www.sudoc.fr/012367206/id tef:auteur http://www.viaf.org/123456789 Une ontologie TEF dit : http://www.abes.fr/tef/auteur rdf:type owl:ObjectProperty owl:FunctionalProperty (une thèse ne peut avoir qu1 auteur, au sens de tef:auteur) (mais elle peut avoir 2 dc:creator) Un outil de raisonnement pourra en déduire que : http://www.idref.fr/035200898/id owl:sameAs http://www.viaf.org/123456789

48 DÉMO Fichier (fusion des triplets RDF) : http://193.52.69.127/xml/rdf/sperber_turtle.txt http://193.52.69.127/xml/rdf/sperber_turtle.txt Outils de raisonnement : http://www.ivan-herman.net/Misc/2008/owlrl/ http://inspector.sindice.com

49 Raisonnement RDF, cest de la logique Travaux en cours avec le LIRMM pour ADONIS sur les données Persée Oblige à qualité des données et rigueur de la modélisation Sinon : on génère nimporte quoi ! Usages : – Enrichir les données – Expliciter les données – Mettre au jour des incohérences

50 Page RDF complète

51

52 Une pincée de RDA et de FRBR

53 CONCLUSION

54 Convertir en RDF Aussi indéterminé que « convertir en Excel » ! Quelle modélisation ? Quels vocabulaires réutiliser ? Forger son propre vocabulaire ? Nos données historiques sont-elles éligibles à ces nouvelles modélisations ? » cf. notre dc:format et notre dc:publisher

55 Trois lièvres à la fois PrioritéObjectifVocabulaires Parler à la cantonadeInteropérabilité généraledc, foaf Modéliser de manière exhaustive nos données métier Se passer de MARCrda, isbd, frbr Faire raisonner les donnéesTirer le maximum des données Contrôler leur qualité Aide au catalogage ad hoc si nécessaire

56 La suite Enrichir encore les conversions en RDF Multiplier si nécessaire les vocabulaires employés, sans craindre les redondances Ajouter des liens internes et externes (IST française, BnF, OCLC, Dbpedia, Freebase, etc.) Encourager les partenaires à diffuser leurs données en RDF, en sappuyant sur des référentiels communs (IdRef) Continuer à exploiter ces données en RDF avec le LIRMM et dautres


Télécharger ppt "Sudoc, Calames, theses.fr et le Web de données Atelier JABES2011."

Présentations similaires


Annonces Google