La valorisation de l’information scientifique Colloque IFAN, 27 novembre 2007
PLAN Présentation du programme PERSEE Analyse du contexte Principes fondateurs Choix des outils Anticipation de nouveaux besoins Chiffres clés
Présentation du programme PERSEE, un programme de retro-numerisation de revues scientifiques en Sciences humaines et sociales (SHS) Objectifs : Préserver et valoriser un riche patrimoine scientifique Participer au rayonnement de la recherche en langue française Permettre une exploitation enrichie de ces revues en terme de recherche et de consultation
Analyse du contexte Une forte avance anglo-saxonne fondée sur : une offre pluridisciplinaire de grands éditeurs le dynamisme des presses universitaires l’existence de grands organismes à but non lucratif Des modèles nouveaux : archives ouvertes et revues alternatives Contraste avec la France : un retard à exploiter avantageusement
Analyse du contexte Le problème juridique Les données du problème : envisager une large diffusion d’information protégée par le droit d’auteur, voire par le droit de la propriété (cas des images) Un cadre juridique strict, une jurisprudence contradictoire
Présentation du programme Principes fondateurs Accès libre et gratuit à l’information Respect du droit d’auteur Choix de technologies ouvertes et standardisées Un outil conçu avec et pour la communauté scientifique
Le choix des outils Choix du développement en interne d’une chaîne de fabrication : De la numérisation à l’archivage pérenne au CINES Choix de l’open source: Pour assurer la pérennité et l’évolutivité informatiques du programme Pour permettre une redistribution de la chaîne développée sur fonds public
Chaîne de Fabrication Légende Chargé de documentation Rédaction revue Equipe Persée Export XML Sauvegarde au CinesPublication Portail Persée Gestion des ayants droit (recherche, localisation, envoi des demandes d’autorisation, alimentation des bases de données) Massicotage Numérisation (NB, niveau gris) Traitements (ROC, extractions illustrations) Alimentation BdD images et texte Préparation matérielle et Description physique Documentation de la revue Validation éditoriale Fourniture d’une collection
« Traductions » documentaires et informatique des besoins Respect de l’identité visuelle de la revue mode image Recherche sur le texte intégral mode texte Le numéro n’est pas une unité de sens scientifique choix de l’article comme unité documentaire de base D’autres éléments éditoriaux de la revue sont à exploiter à des degrés divers choix de la structuration documentaire des articles
« Traductions » documentaires et informatique des besoins Nécessité de bénéficier de services associés (distinction essentielle entre un site et un portail) Mise en ligne compatible avec l’offre scientifique française et internationale liens avec les autres outils bibliographiques ou de recherche et interopérabilité avec les autres portails de revues
Un programme évolutif pour suivre l’avancée des technologies un programme de numérisation adossé à un programme de recherche et de développement Pour anticiper de nouveaux services Pour poursuivre le développement d’outils de production et de diffusion Anticipation de nouveaux besoins
La refonte du portail de diffusion pour (re)- placer l’usager au cœur du programme et lui fournir des outils lui permettant : Une meilleure exploitation des documents disponibles sur le portail De travailler (annoter, organiser, associer etc;) sur PERSEE De partager ce travail avec des utilisateurs « amis » ou avec l’ensemble des utilisateurs du portail
Chiffres clés articles en ligne en mode image et en mode texte ( en attente de diffusion) 40 revues en ligne, 30 revues en production pages /an (numérisation, structuration,export, diffusion et archivage pérenne) 4000 articles en ligne / mois 12 téraoctets de données déjà produites 2, 5 millions de consultations / mois requêtes OAI / jour
Conclusion Une démarche générique, applicable à tout projet de numérisation Une expérimentation juridique qui permet de poser des problèmes de fonds Un exemple d’une utilisation « optimisée » de choix documentaires normalisés Des outils développés à des fins de mutualisation, bientôt disponibles sur sourceforge.
Conclusion Merci de votre attention