La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Le Web sémantique. Un Web de métadonnées Tutoriel JABES 2010 – Yann Nicolas.

Présentations similaires


Présentation au sujet: "Le Web sémantique. Un Web de métadonnées Tutoriel JABES 2010 – Yann Nicolas."— Transcription de la présentation:

1 Le Web sémantique. Un Web de métadonnées Tutoriel JABES 2010 – Yann Nicolas

2 W EB DE DOCUMENTS VS W EB DE DONNÉES Le Web est une collection de documents (HTML, PDF…) Le Web devient une collection de bases de données (RDF, RDFa)

3 hier aujourdhui demain

4 L E CONTENU DES DONNÉES EST UTILISÉ DANS UN DOCUMENT HTML Le Document HTML est fait pour être lu par des humains ; pas pour être exploité par des programmes Données Page HTML

5 hier aujourdhui demain

6 LES DONNÉES SONT PRÉSENTES DANS LE DOCUMENT HTML Le Document HTML + RDFa peut être lu par des humains et exploité par des programmes La base de données est dans le Web, pas sous le Web (deep Web) Données Page HTML HTML + RDFa Donnée s

7 L A VICTOIRE DES MÉTADONNÉES Rich snippets SearchMonkey Open Graph Protocol

8 M ÉTADONNÉES DE … Documents Produits commerciaux Entreprises et autres organismes Evénements Jeux Recettes de cuisine

9 M ÉTADONNÉES DE RECETTE G OOGLE PropertyDescription name (fn)Required. The name of the dish. recipeType (tag)The type of dish: for example, appetizer, entree, dessert... photoImage of the dish being prepared. publishedThe date the recipe was published, in ISO date format.ISO date format summaryA short summary describing the dish. reviewA review of the dish. Can include nested review information.review information prepTime The length of time it takes to prepare the recipe for dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time.ISO 8601 duration format cookTime The time it takes to actually cook the dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time.ISO 8601 duration format totalTime (duration) The total time it takes to prepare the cook the dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time.ISO 8601 duration format nutrition Nutrition information about the recipe. Can contain the following child elements: servingSize, calories, fat, saturatedFat, unsaturatedFat, carbohydrates, sugar, fiber, protein, cholesterol. These elements are not explicitly part of the hRecipe microformat, but Google will recognize them. instructionsThe steps to make the dish. Can contain the child element instruction, which can be used to annotate each step. yieldThe quantity produced by the recipe (for example, number of people served, number of servings, etc). ingredient An ingredient used in the recipe. Can contain child items name (name of the ingredient) and amount. Use this to identify individual ingredients. authorCreator of the recipe. Can include nested person information.person

10 M ÉTADONNÉES DE DOCUMENTS selon Yahoo

11 M ÉTADONNÉES DE DOCUMENTS SELON Y AHOO

12 L ENJEU Que le Web de données ne parle pas seulement de vidéos, de produits commerciaux, de congrès et de recettes de cuisine mais également des fonds de nos bibliothèques, de nos thèses, de nos manuscrits, de nos articles, de nos revues… et de nos auteurs, directeurs de thèse, organismes, vocabulaires …

13 C OMMENT METTRE NOS MÉTADONNÉES SUR LE W EB DE DONNÉES ? Sudoc.zip

14 C OMMENT METTRE NOS MÉTADONNÉES SUR LE W EB DE DONNÉES sans y mettre nos notices ? Notices = paquets ficelés Ouvrir ces paquets ! Dissection dune notice MARC Vers des métadonnées en RDF

15 Partons dune notice Sudoc en UNIMARC décrivant lédition commerciale dune thèse

16 cam $a $bbr.$d38 EUR 073 1$a $a d2009 k y0frey0103 ba $afre 102 $aFR 105 $ay va 001yy 106 $ar $aAnthropologie juridique de la personne morale$bTexte imprimé$fJean- François Quievy,...$gpréface de Didier R. Martin, $aParis$cLGDJ-Lextenso éd.$dDL $a1 vol. (XI-416 p.)$d24 cm $aBibliothèque de droit privé$x $vtome $aLGDJ = Librairie générale de droit et de jurisprudence 320 $aBibliogr. p. [369]-396. Notes bibliogr. Index 328 0$zTexte remanié de$bThèse de doctorat$cDroit privé$eParis 11$d |$tBibliothèque de droit privé$x $v |$tAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François Quievy$c[S.l.]$n[s.n.]$d2008$p1 vol. (343 p.) 606 $aAnthropologie juridique$2rameau 606 $aSociétés$xDroit$2rameau 606 $aPersonnes morales$2rameau 686 $aKA.111$2local_cujas 700 1$aQuievy$bJean-François$f $ $aMartin$bDidier$f $ $aFR$bAbes$c $gAFNOR

17 Notice = paquet Mais jai triché

18 cam $a $bbr.$d38 EUR 073 1$a $a d2009 k y0frey0103 ba $afre 102 $aFR 105 $ay va 001yy 106 $ar $aAnthropologie juridique de la personne morale$bTexte imprimé$fJean- François Quievy,...$gpréface de Didier R. Martin, $aParis$cLGDJ-Lextenso éd.$dDL $a1 vol. (XI-416 p.)$d24 cm $aBibliothèque de droit privé$x $vtome $aLGDJ = Librairie générale de droit et de jurisprudence 320 $aBibliogr. p. [369]-396. Notes bibliogr. Index 328 0$zTexte remanié de$bThèse de doctorat$cDroit privé$eParis 11$d |$ $tBibliothèque de droit privé$x $v |$ $tAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François Quievy$c[S.l.]$n[s.n.]$d2008$p1 vol. (343 p.) 606 $ $aAnthropologie juridique$2rameau 606 $ $aSociétés$xDroit$2rameau 606 $ $aPersonnes morales$2rameau 686 $aKA.111$2local_cujas 700 1$ $aQuievy$bJean-François$f $ $ $aMartin$bDidier$f $ $aFR$bAbes$c $gAFNOR Liens aux autorités

19 Notice bibliographique avec liens aux autorités = plusieurs paquets liés entre eux

20 Edition de la Thèse. Titre = « Anthropologie… ». Langue = « fre » Id= Personne. Nom = « Jean-François Quiévy » Id= Personne. Nom = « Didier martin» Id= Concept Rameau. Forme retenue = « Personnes morales » Id= Collection. Titre = « Bibliothèque de droit privé » Id= a pour directeur a pour sujet a pour auteur appartient à

21 Edition de la Thèse. Titre = « Anthropologie… ». Langue = « fre » Id= Personne. Nom = « Jean-François Quiévy » Id= Personne. Nom = « Didier martin» Id= Concept Rameau. Forme retenue = « Personnes morales » Id= Collection. Titre = « Bibliothèque de droit privé » Id= a pour directeur a pour sujet a pour auteur appartient à Langue. Libellé= « Français » Id= iso639-3/fra a pour langue

22 Edition de la Thèse. Titre = « Anthropologie… ». Langue = « fre » Id= Personne. Nom = « Jean-François Quiévy » Id= Personne. Nom = « Didier martin» Id= Concept Rameau. Forme retenue = « Personnes morales » Id= Collection. Titre = « Bibliothèque de droit privé » Id= a pour directeur a pour sujet a pour auteur appartient à Langue. Libellé= « Français » Id= iso639-3/fra a pour langue La thèse comme Œuvre. Titre = « Anthropologie… » Id= a pour édition

23 D ÉMARCHE Vider la notice bibliographique Déporter le maximum dinformation dans des notices dautorité Linformation contenue dans une autorité est »séparée »plus facile à réutiliser Web de données : une façon de pousser cette logique jusquau bout

24 D ÉFAIRE LE PAQUET DE MÉTADONNÉES Décomposer la notice en affirmations élémentaires et indépendantes (triplets) est de type Thèse a pour auteur a pour nom« Jean-François Quiévy » a pour édition est de typeEdition appartient à est de type Collection a pour titre « Bib. De droit privé »

25 O N EST PASSÉ DE MARC À RDF (Resource Description Framework – W3C) a pour auteur a pour nom« J.F. Quiévy » 2 informations indépendantes lune de lautre 2 informations dans la même base ou non ! Information distribuée sur le Web

26 Comment faire des liens si les informations qui composaient le paquet-notice sont éclatées ??sur le Web ?

27 D ES INFORMATIONS DÉCENTRALISÉES ET DES IDENTIFIANTS GLOBAUX Information gérée par la base catalogue : a pour auteur Information gérée par la base référentiel : a pour nom« J.F. Quiévy »

28 Quest-ce que ça change ?????#1

29 N IMPORTE QUI PEUT COMPLÉTER LA « NOTICE » ! Car nimporte qui peut affirmer quelque chose sur ma thèse Exemple : possède-un-exemplaire-de Je mexemplarise dans le Sudoc… ps : je prête aussi

30 N IMPORTE QUI PEUT RÉUTILISER MES DONNÉES ! Car tout le monde comprend les triplets RDF (bientôt). Exemple : De nouvelles interfaces, de nouveaux outils Où sont les limites du catalogue ? Une AOC ?

31 R AISONNER Nimporte qui peut tirer de mes données des choses que jignorais Exemple : Le catalogue dit que ce livre appartient à la collection La base ISSN dit que cette collection est une collection douvrages de droit privé (règle). « on » peut en déduire que ce livre est un livre de droit privé (ce qui nétait pas dans la notice)

32 L EVER LE DILEMME DE L INTEROPÉRABILITÉ Dilemme : Populaire mais pauvre (Dublin Core simple) Rester riche et mourir seul (MARC, TEF) Solution : tef:auteur sous-propriété de dc:creator

33 N OS DONNÉES DANS LE W EB DE DONNÉES CalamesRDFa en 2008 AutoritésFin 2010 STARFin 2010 Portail des thèses2011

34 Aller plus loin RDF Primer RDFa (RDF dans une page HTML)

35


Télécharger ppt "Le Web sémantique. Un Web de métadonnées Tutoriel JABES 2010 – Yann Nicolas."

Présentations similaires


Annonces Google