Mettre en place un projet de numérisation – Sylvain Machefert –

Slides:



Advertisements
Présentations similaires
Julien Delmas Formateur TICE Médiapôle d’Argenteuil Formation TICE à la carte Traitement de texte avancé Médiapôle d’Argenteuil Lundi 4 mai 2008.
Advertisements

GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
Conduire un projet de numérisation Sylvain Machefert 12 MARS
La bibliothèque numérique (en 3 heures …) Sylvain Machefert – SCD Bordeaux 3.
Université de Lorraine JRES 2011 PETALE Archive OAI de la production scientifique des universités de Lorraine Alain Le Drezen, Université Paul Verlaine.
Donner du style à sa thèse Sylvain Machefert – SCD Bordeaux 3 smachefert
AID - Recherches - Stéphanie Vial & Patrick Johner Page 1 Journée 6 Pour une veille documentaire ou bibliographique.
Cloud computing Présenté par Robert Ogryzek, Teddy Frontin, Kevin Lambert et Matthew Cronne.
Au delà du logiciel : les licences libres comme vecteur de culture.
L'OpenURL Une piste pour la valorisation des ressources électroniques ? Sylvain Machefert - 29/11/2007 CC-BY-SA // Sugree // FlickrFlickr.
@rchiveSIC Archive Ouverte en Sciences de l’Information et de la Communication Gabriel.
AVRIL Les ressources libres Sylvain Machefert.
KOSMOS 1 Communiquer et publier de l’information Module 4 1.Transmettre des informations par les services des rubriques 2.Animer un blog 3.Notifier des.
Analyser un tableau avec un diaporama. Les droits de l'image ● Toutes les images ne sont pas libres de droits ● L'usage d'images non libres de droit est.
Savoirs en partage Le portail de ressources de l'AUF Objectifs ● Proposer de.
AVRIL Gestion de contenu // Wikipédia Sylvain Machefert.
1 Gestion Electronique de documents (GED) ✔ Définition Efficacité d'une entreprise dépend de la capacité à traiter et consulter les informations qu'elle.
GHU 9/09/2016 Atelier : De la prise de vue numérique à la publication 1)L'appareil de photo numérique 2)La prise de vue et ses réglages 3)Profondeur de.
Donner du style à sa thèse Sylvain Machefert – SCD Bordeaux 3 smachefert
Octobre 2013 Smartweb Refonte des sites Internet AIDE – K-Sup v6.
Notre site Internet Un outil d'information au service de tous
Acquisition Multicanal
Le bureau Windows (XP) Bureau Windows Icônes Menu démarrer
Un site internet : pourquoi faire ?
pour les appareils multifonctions
Téléchargement de fichiers
dans sa pratique de classe ? « Culture numérique et apprentissages »
Rechercher des articles et des sites web
Rechercher des livres et des DVD
Développer le livre numérique : l'action du ministère de la culture
SAVOIRS 2.0 Ouverture du savoir scientifique et du terrain pour une didactique de collaboration E. Duplàa, M.J. Berger.
? AUTOUR DU LOGICIEL CALIBRE Un outil de gestion de bibliothèque
ABES - Réunion des centres régionaux du SUDOC-PS – 12 mai 2017
Formation « Administrateur ATRIUM »
Wikimédia France et les institutions culturelles
Votre Archive ouverte du réseau collégial québécois
La Bibliothèque numérique élève: Prisecariu mihaela classe – la Xe a professeur coordinateur: Bengescu otiliA.
Politique de dépôt et de services dans ProdInra
Se connecter toujours depuis TecfaMoodle
Le livret scolaire unique, c’est quoi ?
Wikipédia : un outil pour le monde universitaire ?
Les Outils Documentaires
projet de numérisation
Produire, collaborer, partager avec un blog d’école
Réaliser une bibliographie
Journée pédagogique 16 septembre 2014
Gestion du cours Aissa Boulmerka.
Calibre Introduction - Les services Conseils I6T.
Extension de fichiers*
Wikipedia en 10 diapositives
Utiliser des images trouvées sur le web
Une offre de services adaptée aux utilisateurs de téléphones mobiles
</Présentation de solutions documentaires>
Catherine Cyrot - bibliothèques numériques - Cours 2
Kit de formation multimedia
UTILISER UNE PRESENTATION POWERPOINT (PPT)
TD Multimédia : cours 1 Année Groupe C TD multimédia.
Catherine Cyrot - Cours bibliothèques numériquesz - cours 4
Fourniture de reproductions de documents reproductibles*
PLATE FORME DE GESTION ÉLECTRONIQUE DE DOCUMENTS Présenté par: Amine LARIBI.
Présentation des services IT
Conception de sites web marchands: TD 2
Module bibliothèques numériques : le format PDF
Projet CRImage UNIVERSITE STENDHAL GRENOBLE
ScienceDirect Guide d’utilisation de la base de données : ScienceDirect Pr R. EL OUAHBI.
DONNÉE DE BASE QM Manuel de formation. Agenda 2  Introduction  Objectif de la formation  Données de base QM: Caractéristique de contrôle Catalogue.
FORMATION DANE NC RNE Le 05/09/2018
Module bibliothèques numériques
Module bibliothèques numériques - Formats de bibliothèques
Transcription de la présentation:

Mettre en place un projet de numérisation – Sylvain Machefert –

Contexte CC-BY-SA // Manfrys // FlickrFlickr

Sujet d'actualité et de surcroît « brûlant » en matière de bibliothéconomie, la numérisation ne laisse pas de susciter maints commentaires Conduire un projet de numérisation / Contexte Un sujet d'actualité

● Corpus de documents, le plus souvent du domaine public, numérisés et disponibles en ligne ● Développées principalement par les bibliothèques ● Volumétries très variables ● Qualité très variable – Qualité du contenu – Qualité de la présentation Les bibliothèques numériques

Projet Gutenberg ● Projet bénévole lancé en 1971 ● ouvrages ● Vérification manuelle g

Gallica ● Lancé par la BnF en 1997 ● 1 million de documents – livres – fascicules de périodiques ● Mode texte et image ● Documents sous droits – Depuis 2007 – livres /

Wikisource ● Projet frère de Wikipedia, lancé en 2003 ● Ouvrages du domaine public (plusieurs dizaines de milliers) ● Partenariat avec la BnF ● Désaccord avec Gallimard (informations)informations

Google Books ● Lancé en décembre 2004 ● 15 millions d'ouvrages numérisés – 1,5 millions du domaine public – 2 millions en partenariat avec les éditeurs ● Un accueil mitigé chez les professionnels – € de dommages et intérêts à La Martinière (déc. 2009) – ~ 20 bibliothèques partenaires Le téléchargement dans Google Books

Europeana ● Lancé en novembre 2008 ● 15 millions de documents disponibles ● Agrège les contenus de institutions

Des initiatives locales : BNSA ● Initiative de la région ● documents ● 15 millions de documents disponibles

CC-BY-NC-SA // Kathelinejeanpierre.ca // FlickrFlickr Quantitatif : avantage Google Plus, plus vite et moins cher que tout le monde Qualitatif : avantage Google Presque aussi bien que tout le monde Accès : avantage Google Plus rapide, plus efficace, plus « pratique », plus central Source : Olivier ErtzscheidOlivier Ertzscheid Un avis sur la numérisation de masse

Objectifs CC-BY-SA // Multimotyl // Wikimedia CommonsWikimedia Commons

Diffuser ● Document aisément reproductible ● Palliatif intéressant pour les ouvrages difficilement communicables ● Ne nécessite pas de matériel spécifique (≠ microfiches) ● Non exclusif

Valoriser ● Mise en avant sur un site Internet ● Diffusion élargie – Moissonnage par des bibliothèques d'envergure – intégration dans des projets externes aux bibliothèques – Flickr Commons Flickr Commons – Wikimedia Commons Wikimedia Commons

Préserver ● Limite les manipulations des originaux ● Pérennité des supports numériques

Facteurs CC-BY // Cat & Nat // FlickrFlickr

Type de document ● Forme de l'objet – Texte ou graphique – Imprimé ou manuscrit – Couleur / Noir et blanc ● Contenu – Texte – Formulaire – Niveau de structuration

Format du document ● Taille (A4, A3, format spécifique...) ● Couleur ● Papier ● Pagination – Automatisation – Choix du format de sortie (multipage ?)

Volume ● Méthode et coût – Automatisation, sous-traitance ● OCR et recherche plein texte (plutôt qu'indexation ?) ● Gestion des transferts vers le prestataire ● Ressources disponibles en interne ● Stockage des documents numériques

Homogénéité du fonds ● Formats différents – Méthode de scannage à adapter ? – Qualité de l'OCR sur un corpus hétérogène ? – Coût ● Documents de nature différente – Pertinence du traitement dans un seul projet ?

État des documents ● Choix du scanner et de la méthode ● Traitement sur place – Création d'un atelier – Main d'œuvre dédiée

Coût ● 15 à 75 centimes par page (très variable) ● 60 à 75 % du coût en main d'œuvre ● Ne pas négliger les coûts induits en local – Sélection des documents – Préparation des trains de numérisation – Contrôle qualité

Questions légales CC-BY // Lnanimatt // FlickrFlickr

24 « Les opérations de numérisation de documents ne confèrent à la bibliothèque aucun droit de propriété littéraire et artistique sur les œuvres ainsi reproduites. »

25 Le droit moral ● Droit de divulgation ● Droit de paternité ● Droit au respect de l'œuvre ● Droit au repentir CC-BY // Midgefrazel // FlickrFlickr

26 Les droits patrimoniaux ● Droits de reproduction ● Droits de représentation CC-BY-NC-SA // France.Diplomatie // FlickrFlickr

27 L'auteur jouit, sa vie durant, du droit exclusif d'exploiter son œuvre sous quelque forme que ce soit et d'en tirer un profit pécuniaire. Au décès de l'auteur, ce droit persiste au bénéfice de ses ayants droit pendant l'année civile en cours et les soixante- dix années qui suivent. Art. L du code de la propriété intellectuelle

28 Creative Commons BY Attribution NC Non Commercial ND No Derivative SA Share Alike CC-BY-SA // Arnij // FlickrFlickr

CC-BY // Dolarz // FlickrFlickr Questions techniques

Modes de numérisation Idéal : une combinaison des deux numérisations

OCR ● Reconnaissance optique de caractères ● Taux de reconnaissance > 99% pour des textes propres ● Plus compliqué sur du document ancien ou manuscrit

ICR ● Reconnaissance intelligente de caractères ● Mécanisme d'apprentissage ● Plus adapté aux manuscrits Technique

L'expérience reCAPTCHA SourceOCRreCAPTCHA

Résolution ● Se mesure en point par pouce – 1 pouce = 2,54 cm – 1 pouce = 1 inch ● Résolutions standards (BnF, 2008) : – Fichiers de conservation : 300 dpi – Fichiers de diffusion : 150 dpi – Fichier de visualisation : 72 dpi

Couleurs ● Noir & Blanc ● Niveau de gris ● Couleurs ● Échantillonage (bits par pixel) – 1 bit → 2 couleurs (noir et blanc) – 2 bits → 4 couleurs ou niveaux de gris – 8 bits → 256 couleurs ou niveaux de gris – 24 bits → 16 millions de couleurs (vraies couleurs) Technique

Métadonnées EXIF ● Exchangeable Image File ● Dernière version en 2002 (2.2) ● Standard de fait ● Produite par un appareil photo ou ajoutées a posteriori ● Décrit : – Résolution, dimension, orientation de l'image – Date et heure de la prise de vue – Informations sur l'appareil (fabricant, type, réglages) – Coordonnées géographiques CC-BY-SA // YellowShark // Wikimedia CommonsWikimedia Commons Technique

Métadonnées IPTC-IIM ● International Press and Telecommunications Council Information Interchange Model ● Utilisé dès 1994 par Adobe ● Métadonnées descriptives : – Titre – Auteur – Agence –... Technique

XMP ● eXtensible Metadata Platform ● Créé par Adobe en 2001 ● Basé sur XML / Dublin Core, IPTC-IIM et EXIF ● Encapsulable dans des fichiers JPG, TIFF, DNG, PDF

Du matériel spécifique

OAI - PMH ● Format d'échange basé sur XML ● Fourniture des données en Dublin Core ● Protocole très simple – Informations sur un serveur Informations sur un serveur – Liste des enregistrements Liste des enregistrements ● Nécessite d'avoir des urls pérennes

Mise en ligne

42 Une étape obligatoire ● Pour répondre à nos décideurs / financeurs ● Pour répondre à nos usagers ● Pour rencontrer un nouveau public CC-BY-SA // Roulex_45 // Wikimedia CommonsWikimedia Commons

43 Priorités ● Ouverture ● Interopérabilité ● Accessibilité Libre de droits // Rundvald // Wikimedia CommonsWikimedia Commons

Dissémination des contenus (via OAI-PMH)

CC-BY // SophieA // FlickrFlickr Choix des outils ● Libre / Propriétaire ● Local / Hébergé ● Full-web ou pas

Consultation des documents

Mise en ligne BM Toulouse Sur son site ● Logiciel libre : Greenstone (unesco) ● Application web ● Classement par collections Sur Flickr ● Projet The Commons ● Dissémination du contenu ● 920 images

BM Lille ● Logiciel libre : SDX ● Application web

Mise en ligne BM Fréjus ● Hébergement chez Arkhenum ● Numérisation des archives d'un journal local ● Numérisation PDF / Texte

Mise en ligne Université Rennes 2 ● Logiciel libre : Omeka ● Application web ● Plugins variés : ● Serveur OAI ● Géolocalisation ● Visualisation

Valorisation des contenus

Étapes du projet

La numérisation ● Définir les objectifs de la numérisation ● Sélectionner le fonds à traiter – Fonds préexistant ou sélection d'un sous- corpus – Importance de l'homogénéité de l'ensemble – S'assurer des contraintes législatives ● Répartir les rôles

● Définir les questions techniques – Résolution – Format – OCR – Métadonnées – Support de livraison ● Définir une règle de nommage ● Contrôler la qualité des documents produits ● Archiver les documents La numérisation

La diffusion ● Choisir ce qui doit être diffusé ● Choisir la manière de diffuser – Via un outil interne – Via un site web externe ● Si on diffuse via un outil interne, s'assurer de : – Son ouverture – Son interopérable – Son accessibilité

CC-BY-NC-ND // Spencer.Lattimer // FlickrFlickr première page, CC-BY // Joshua Keller // FlickrFlickr