Informatique documentaire Sylvain Machefert 12 MARS 2 0 1 0.

Slides:



Advertisements
Présentations similaires
Le rôle des Métadonnées
Advertisements

Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Bibliothèque Centrale de l’École Polytechnique Session pratique Recherches documentaires en sciences dures PSC 2011 septembre/octobre 2011 Denis Roura,
FAIRE SA BIBLIOGRAPHIE DE THESE AVEC ZOTERO Traitements de texte pris en compte: Word et LibreOffice.
Composants Matériels de l'Ordinateur Plan du cours : Ordinateurs et applications Types d'ordinateurs Représentation binaires des données Composants et.
Donner du style à sa thèse Sylvain Machefert – SCD Bordeaux 3 smachefert
AID - Recherches - Stéphanie Vial & Patrick Johner Page 1 Journée 6 Pour une veille documentaire ou bibliographique.
Celinat Catalogue en ligne d'informations numériques de l'académie de Toulouse.
1 Chaîne éditoriale et catalogue de formation Université de Picardie Jules Verne.
Formation web sémantique J.M. Vanel RDF, RDF Schema, SPARQL, OWL, Modélisation, moteurs de règles Licence Creative Commons.
L'OpenURL Une piste pour la valorisation des ressources électroniques ? Sylvain Machefert - 29/11/2007 CC-BY-SA // Sugree // FlickrFlickr.
AVRIL Les ressources libres Sylvain Machefert.
Informatique documentaire « une courte introduction » Sylvain Machefert – 17·02·2011.
Introduction aux technologies du Web Mercredi 12 décembre 2007 Patrice Pillot
AVRIL Gestion de contenu // Wikipédia Sylvain Machefert.
Donner du style à sa thèse Sylvain Machefert – SCD Bordeaux 3 smachefert
Le xml.
Cours Initiation aux Bases De Données
Téléchargement de fichiers
Rechercher des articles et des sites web
Rechercher des livres et des DVD
Logiciel libre de gestion bibliographique
Je collecte l’information Je mets en place une veille informationnelle
ABES - Réunion des centres régionaux du SUDOC-PS – 12 mai 2017
Bases de données multimédia
Votre Archive ouverte du réseau collégial québécois
Quelques Termes INFORMATIQUE ? ORDINATEUR ( Système Informatique)?
Politique de dépôt et de services dans ProdInra
Rechercher des articles et des sites web
Formation d'auxiliaire de bibliothèque Traitement bibliographique – 1
Rechercher des articles et des sites web
OWL-S.
L’open data du SIE état d’avancement
Chiffrement de bout en bout
LE MASHUP.
Les technologies AJAX.
Rechercher des articles et des sites web
Module 1 : Réaliser un site internet
Je collecte l’information J’accède aux documents sources
1 Exemple d’un document (article). 2 XML: eXtensible Markup Language Wikipédia XML (Extensible Markup Language, « langage de balisage extensible ») est.
Structure D’une Base De Données Relationnelle
L’information est structurée sous forme de notice
</Présentation de solutions documentaires>
Introduction à Internet
A. DAAIF ENSET Mohammedia Université Hassan II Casablanca.
Structuration du contenu
Module bibliothèques numériques - Formats de bibliothèques
Cours 10 : Les Web Services et WSDL Février Version 1.0 -
Transmission de données
Linked Data – les données sur le web pourquoi et comment?
Catherine Cyrot - bibliothèques numériques - Cours 5
ZOTERO ATELIER D’INITIATION AUX FONCTIONS DE BASE DE CE LOGICIEL DE GESTION BIBLIOGRAPHIQUE.
Structuration des documents pédagogiques
Catherine Cyrot - bibliothèques numériques - Cours 5
Programmation Web : Introduction à XML
PRESENTATION ACCESS Editeur : Microsoft Environnement Windows (SE)
Base de données Table des clients Table des fournisseurs Table des commandes clients Formulaire des clients Formulaire des fournisseurs Formulaire des.
PLATE FORME DE GESTION ÉLECTRONIQUE DE DOCUMENTS Présenté par: Amine LARIBI.
TP1 - DBMAIN BFSH Lausanne - Switzerland - Tel Université de Lausanne.
Catherine Cyrot - bibliothèques numériques - cours 3
Catherine Cyrot - bibliothèques numériques - Cours 5
Projet CRImage UNIVERSITE STENDHAL GRENOBLE
Definition de html sommaire. Présentation de html, css et javascript Module 1.
ScienceDirect Guide d’utilisation de la base de données : ScienceDirect Pr R. EL OUAHBI.
Qu’est ce qu’une page web? Comment fonctionne un site web?
DONNÉE DE BASE QM Manuel de formation. Agenda 2  Introduction  Objectif de la formation  Données de base QM: Caractéristique de contrôle Catalogue.
Business Intelligence en ACube OLAP et Reporting avec ACubeOLAP et GRaM.
Module bibliothèques numériques - Formats de bibliothèques
Site web, Ce qu’il faut savoir ?
Internet Stage – Semaine 5.
Transcription de la présentation:

Informatique documentaire Sylvain Machefert 12 MARS

2 Informatique documentaire Généralités Identifiants Structuration Métadonnées Échanges

CC-BY // Patrick Hoesly // FlickrFlickr Généralité s

4 Le document numérique « Dans son acception courante un document est généralement défini comme le support physique d'une information. Plus précisément on peut le définir comme un ensemble de données informatives présentes sur un support, sous une forme permanente et lisible par l’homme ou par une machine (permanent par opposition à volatil). » t

5 Le document numérique Le document numérique peut être compris dans un sens plus large, comme étant un ensemble de données informatives sous forme de chiffres (= numérique) lisible par un dispositif informatique restituant les informations. Généralités

6 Éléments de vocabulaire ● bit → le fameux 0 ou 1 ● octet → 8 bits → 256 combinaisons ● kilooctets → 1024 octets ● mégaoctet → 1024 kilooctets ● gigaoctet → 1024 mégaoctets ● téraoctet → 1024 gigaoctets Généralités

7 Le codage des caractères Généralités

8 Enjeux ● Interopérabilité des systèmes ● Accessibilité des informations ● Pérennité des informations Généralités

CC-BY // Joe Shlabotnik // FlickrFlickr Identifiant s

10 Identifiants ● Différents types d'identifiants : ensemble numérique ou alpha-numérique ● Pour des unités d'information qui peuvent concerner : – une entité physique – une entité logique (article, contribution dans un périodique, un livre, voir une partie dans un article : différents niveaux de granularité) Identifiants

11 Identifier l'unité physique ● Numéro international normalisé du livre imprimé : ISBN ● ● Numéro international normalisé des publications en série : ISSN ● ● Numéro international normalisé de la musique imprimée : ISMN ● M Identifiants

12 ● Code international normalisé des enregistrements musicaux (sonore et audiovisuel) : ISRC ● FR-AB ● Numéro international normalisé d’œuvre audiovisuelle : ISAN ● ISAN : D U L ● Code international normalisé des textes : ISTC ● ISTC A BE-A ● Serial Item and Contribution Identifier : SICI ● (199412)45: TX;2-M Identifier l'unité physique Identifiants

13 Identifier en ligne ● Enjeu important ● Dépasse le cadre des identifiants « physiques » ● Principe générique des URI : ensemble des technologies et moyens permettant de – Nommer, – Adresser, – Jusqu'à un certain point, décrire les ressources du Web Identifiants

14 URN ● Uniform Resource Name ● Identifie la ressource indépendamment de son emplacement ● → nécessite un mécanisme capable de faire le lien entre l'identifiant et l'emplacement de la ressource ● Repose sur un répertoire de correspondance urn:isbn: Identifiants

15 URL ● Uniform Resource Locator ● Utilisé par le protocole HTTP pour la localisation des pages Web ● Très lié à l'institution hébergeante ● → Non pérenne protocol e sous- domaine nom de domaine de 2 nd niveau nom de domaine de 1 er niveau nom de la ressource Identifiants

16 Pérennité, lisibilité des URL ● Nécessité pour un accès direct ● Facilite la citation ● Indexation dans les moteurs de recherche ● Moissonnage OAI Identifiants

17 ARK ● Archival Resource Key ● Créé et maintenu par la California Digital Library ● Faciliter la citabilité et le référencement de document numériques ● Mis en place par la BnF pour Gallica et BN Opale Plus ● Différents niveau de granularité : – Page précise d'un document – Une image dans un lot d'images Identifiants

18 ARK ark:/12148/bpt6k103226k/f263.pagination adresse du résolveur (optionnel)espace de nom institutio n Identifiant unique niveau plus fin Identifiants

19 DOI ● Digital Object Identifier (1998) ● Sous-partie d'un élément plus important : handle ● Gérés par Crossref pour le domaine de la recherche ● Fin 2009 : 43 millions d'enregistrements doi: /may2006-apps espace de nom code handle du DOI organisme gestionnaire identifiant de l'objet résolveur Identifiants

CC-BY-SA // Aloriel // FlickrFlickr La structuration

21 HTML ● Langage de structuration des pages web (1989) ● Langage de présentation (peu de sémantique) ● Support varié Structuration

22 CSS ● Feuille de style en cascade (~1995) ● Structure // Présentation main.css Structuration

23 XML ● eXtensible Markup Language (1998) ● Recommandation du W3C ● Lié aux technologies du web ● Structure arborescente ● Format générique de balisage décliné en schémas Structuration

24 Validation - DTD ● Document Type Definition ● Description des éléments du XML – Noms des éléments – Contenus – Attributs ● Peut être décrit en XML ● Pas de typage Stéphane Dupond Masculin 1er janv. 82 DTD XML Valide Structuration

25 Validation - XSD ● XML Schema ● Définition plus précise ● Typage des données Stéphane Dupond Masculin XSD XML valide Structuration

26 XSL ● Extensible stylesheet language ● Feuilles de styles associées au XML – XSLT : transformation – XPath : navigation dans le document – XSL-FO : mise en forme CC-BY-SA // Ripounet // Wikimedia CommonsWikimedia Commons Transformation XSL Chemin XPath Structuration

27 XML - Applications ● TEI : Text Encoding Initiative Structuration de textes électroniques en Sciences Humaines et Sociales ● EAD : Encoded Archival Description Encodage des instruments de recherches archivistiques (utilisé dans Calames) ● TEF : Thèses Électroniques Françaises Regroupe la description et les informations de gestion ● METS : Metadata Encoding and Transmission Standard Description de collections d'objets numériques Structuration

28 Application émergente : EPUB ● Format ouvert (1997) pour les livres électroniques :.epub ● Archive de XHTML, CSS, images CC-BY // Dan Taylor // Flickr Flickr Structuration

CC-BY // MG Shelton // FlickrFlickr Les métadonnées

30 Généralités ● Plusieurs types – Métadonnées descriptives – Métadonnées techniques – Métadonnées juridiques ● Importance des choix de format ● Suivre une norme pour ne pas s'isoler ● Stockage des métadonnées – Dans la ressource – Dans une base associée Les métadonnées

31 Description vs Stockage Format de description Dublin Core, MARC, Onix ≠ Format de stockage Iso2709, XML, Format binaire Les métadonnées

32 Description – Formats MARC ● Depuis 1965 ● Par et pour les bibliothécaires ● Arborescence à deux niveaux ● Variations nationales (Unimarc, marc-21...) ● Principaux formats en bibliothèques Les métadonnées

33 Description – ONIX ● Première version en 2000 ● Initié par les acteurs commerciaux (éditeurs, libraires) ● Plus de 200 champs différents (~30 constituant la base) ● Passerelles vers les formats MARC pour les bibliothèques ● Données enrichies : – Résumés – Image de couverture – Prix, disponibilité Les métadonnées

34 Description – Dublin Core ● Plus récent (1995), plus connu ● Dublin Core Element Sets : 15 éléments de base – Contenu : titre, type, sujet... – Propriété intellectuelle : créateur, éditeur... – Instanciation : date, identifiant, format ● Étendus par le Dublin Core qualifié Les métadonnées

35 Description – RDF ● Resource Description Framework ● Description des ressources du Web et leurs Métadonnées ● Définition à l'aide de triplets : Sujet – Prédicat – Objet – ● Relations définies dans des vocabulaires – FOAF : pour la description des personnes et leurs relations – SKOS : relations de types thésaurus et classification – Le linked Data Le linked Data – Exemples d'utilisation dans DBPedia Exemples d'utilisation dans DBPedia Les métadonnées

36 Stockage : OÙ ? ● Dans le document : – Métadonnées exif, xmp pour les photos – RDF sur une page web ● Dans une base associée, lien par un identifiant – Notice associée par un code barre – Notice associée par un DOI Les métadonnées

37 Stockage - XML ● Utilisation d'un format lisible ● Nombreux formats définis (ou adaptations) Les métadonnées

38 Stockage - iso2709 ● Lié aux formats MARC ● Spécification ouverte ● Format très spécifiques aux bibliothèques Les métadonnées

39 Stockage – format binaire ● Solution utilisée par certains éditeurs pour stocker leurs données en base. ● Nécessite le programme de l'éditeur pour décoder ● Être sûr que l'on a les outils associés Les métadonnées

40 Choix du format ● Importance de la normalisation par rapport au domaine ● Qui peut le plus peut le moins Les métadonnées

CC-BY // JC i Nuria // FlickrFlickr Échange & Interopérabilité

42 Échanger ses données pour... ● Être présent sur le web ● Limiter les opérations de saisie déjà faites ailleurs ● Faciliter l'intégration au sein du SI ● Faciliter la vie des usagers ● Permettre de faire vivre le système Échanges & Interopérabilité

43 OAI - PMH ● Format d'échange basé sur XML ● Fourniture des données en Dublin Core ● Protocole très simple – Informations sur un serveur Informations sur un serveur – Liste des enregistrements Liste des enregistrements ● Nécessite d'avoir des urls pérennes Échanges & Interopérabilité

44 Web services (usagers divers) ● Technologies web ● Échange de données entre applications web ● Pour faciliter : – l'intégration avec d'autres outils – Les possibilités de développements annexes (mash-up) ● AJAX : Asynchronous JavaScript and XML ● exemple : Disponibilité dans les B.U. exemple : Disponibilité dans les B.U. Échanges & Interopérabilité

45 Z39.50 (Interrogation) ● Norme historique des bibliothèques (1970) ● Protocole client-serveur ● Possibilités très étendues, implantation variable ● Utilisé pour – Dériver des notices – Faire des moteurs de recherche fédérée Échanges & Interopérabilité

46 SRU / SRW (Recherche) ● Interrogation de base de données via CQL ● Technologies du web, exemple de Web Services ● Réponse en XML ● Trois services de base d%22bordeaux%22&maximumRecords=10&recordSchema=mods Échanges & Interopérabilité

47 OpenURL ● Lier les métadonnées à la ressource qu'elles décrivent en fonction des accès dont dispose l'utilisateur ● « résolveur de lien » pour fournir ce lien et/ou d'autres services Échanges & Interopérabilité

48 OpenURL Notice repérée Recherche au catalogue Site de l’éditeur Texte intégral Échanges & Interopérabilité

49 OpenURL Notice repérée Recherche au catalogue Site de l’éditeur Texte intégral Échanges & Interopérabilité

50 OpenURL 12 Échanges & Interopérabilité

51 COinS ● Cacher des métadonnées dans une page web <span class="Z3988" title="ctx_ver=Z & ft_val_fmt=info:ofi/fmt:kev:mtx:journal& rft.issn= "/> ● Exemple sur un article de wikipédia : OpenURLOpenURL ● De plus en plus présents – Copac – Sudoc depuis l'année dernière –... Échanges & Interopérabilité

52 RSS ● Really Simple Syndication / Rich Site Summary ● S'abonner aux mises à jour d'un site ● Centraliser les alertes sur ces mises à jour Échanges & Interopérabilité

53 Aller plus loin Décembre 2005 ISBN : Septembre 2007 ISBN : Échanges & Interopérabilité

MERCI symac u-bordeaux3.fr Inspiré du support de cours d'Anita Largouet SCD Bordeaux 3 Support mis à disposition sous licence Creative Commons BY SA