Castor une plateforme libre de bibliothèque numérique pour la littérature grise Septembre 2005
Plan Introduction 1 - Documentation numérique Nathalie Fontaine Céline Bourasseau 2 – Réalisation Stéphane Bouchet 3 – Démonstration Stéphane Bouchet 4 – Discussion
Introduction Cédric Dumas
Bibliothèque numérique Base de donnée de documents numériques(textes,vidéo..) Répondre à des besoins des instituts d’enseignement et de recherche Accès à un centre de documentation multimédia Plate-forme expérimentale recherche Synthèse
Synthèse CPER – 2 axes Axe 1 – Plate-forme Axe 2 – Recherche Création d’une plate-forme support Création d’un fonds avec indexation Traitement des problèmes juridiques Axe 2 – Recherche IHM - interfaces de navigation Informatique embarquée Architecture logicielle - composants Synthèse
Synthèse CPER – axe dominant Besoin sur l’axe 1 (plate-forme) "Les services de documentation de l’enseignement supérieur doivent aujourd’hui choisir entre deux options : devenir exclusivement des lieux d’aiguillage vers des réservoirs de ressources payants dont la maîtrise leur échappe, ou parallèlement contribuer à la construction des bibliothèques numériques d’accès placées sous leur contrôle”. (Une ambition universitaire légitime, février 2003, Université de Lyon 2) "Beaucoup d’universitaires ressentent le besoin de rappropriation collective de l’information produite dans leurs laboratoires et concluent à la nécessité de se doter d’un entrepôt numérique pour archiver et diffuser leurs productions. La bibliothèque intervient ici pour assurer non seulement la qualité et la normalisation de l’archivage mais également le prolongement de la démarche à l’échelle d’un réseau national et international. Son rôle de fournisseur d’information se trouve ainsi enrichi." (Grisemine, une bibliothèque numérique de littérature grise, Marie-France Claerebout, Jean-Bernard Marino, GL5, dec 2003) Synthèse
Rapports internes (technique, recherche) Les documents… livres articles Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) Synthèse cours TD correction Rapports de DEA mini projets Rapports de stage
Rapports internes (technique, recherche) Les documents… livres articles Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) Synthèse cours TD correction Rapports de DEA mini projets Rapports de stage
Rapports internes (technique, recherche) Les documents… livres articles Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) Synthèse cours TD correction Rapports de DEA mini projets Rapports de stage
Rapports internes (technique, recherche) Les documents… livres articles Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) Synthèse cours TD correction Rapports de DEA mini projets Rapports de stage
Rapports internes (technique, recherche) Les documents… Compte-rendu de TP articles livres Compte-rendu de TP Compte-rendu de TP Projet de Recherche TP Synthèse Rapports internes (technique, recherche) cours TD correction Rapports de DEA mini projets Rapports de stage
Planning : réalisations Veille CDC Etudes utilisateurs documentalistes personnel & étudiants Bilan Financier Analyse Architecture Réalisation Test Recherche Fonds Droits Politique Documentaire 1 2 3 4 5 6 Juin 2001 2001 2002 2003 2004
Documentation numérique Nathalie Fontaine Peggy Bardon Céline Bourasseau Alice Ziemski L’étude des besoins Le fonds documentaire L’étude des droits 1/4
Présentation Etude des Besoins Une étude des pratiques documentaires Une évaluation des besoins et des attentes Les personnels de recherche et d’enseignement 78 personnes rencontrées : 46,7% du total Les élèves 63 élèves de 4ème année rencontrés : 48,8 % du total de la promotion Etude des Besoins
Bilan Etude des Besoins La place centrale du document dans les activités de recherche comme d’enseignement L’omniprésence du document numérique : gain de temps (accès rapide à l’information, évaluation immédiate de la pertinence des résultats, limitation des déplacements) facilité d’accès à l’information facilité de recherche dans le texte Des difficultés dans la recherche d’information système D Etude des Besoins
Les attentes Etude des Besoins Disposer de plus de ressources sous format numérique de l’information scientifique en texte intégral aisément accessible rapidement accessible disponible dans des outils ciblés pour plus de fiabilité éviter de perdre son temps à trier la masse de résultats inégaux fournis par les moteurs généralistes Avoir une meilleure appréciation de la teneur d’un document avant sa visualisation Etude des Besoins
Les besoins Etude des Besoins Valoriser des ressources encore trop peu couvertes par les circuits classiques de recherche d’information : documents pédagogiques, rapports de stages, autres travaux d’élèves, rapports de recherche, mémoires de DEA, de Master, thèses Assurer la conservation et l’accès aux documents sur le long terme Limiter les pertes d’informations dans le temps Faciliter et rationaliser l’accès à l’information Etude des Besoins
Les types de documents Le fonds documentaire Les documents liés aux activités d’enseignement Produits par les enseignants Support de Cours Composants pédagogiques de manière générale Produits par les élèves Rapports de projets Rapports de stages Les documents liés aux activités de recherche Articles Rapports Thèses, HDR Mémoires de DEA, de Master Recherche Le fonds documentaire
La constitution du fonds Production des enseignants Production des étudiants Production des chercheurs LCMS (facultatif) Le fonds documentaire BN Intranet Internet
La constitution du fonds A terme, un processus d’auto-alimentation Enseignants-chercheur : soumission par l’auteur catalogage-validation par les gestionnaires du système Élèves : CDC soumission par l’élève validation/notation du tuteur catalogage-validation par les gestionnaires du système Le fonds documentaire
La mise en œuvre du fonds Chaque document est décrit par un ensemble de méta-données Le choix du Dublin Core étendu Des informations fournies par l’auteur, complétées par les gestionnaires du système Des concepts originaux : avis de lecteurs, référencement dans plusieurs collections, relations avec d’autres documents, gestion des droits d’accès, etc. Le fonds documentaire
La conversion XML Le fonds documentaire Retro-conversion (XEROX) Formats standards Conversion XML Schéma minimal Copie du document source Elément Occurrence Nombre d'occurrence Titre de document Optionnel Zéro ou Un Titre de section Paragraphe obligatoire Un ou plusieurs Graphique Identifié Zéro ou plusieurs Table Section Liste Pavé bibliographique Le fonds documentaire
Etude des droits de diffusion et de reproduction Veille sur le traitement des aspects juridiques Consultation d’un avocat à Nantes spécialisé dans la propriété intellectuelle Etude des droits
Etude des droits de diffusion et de reproduction Identification des documents nécessitant un contrat de cession des droits d ’auteur => distinction œuvre collective / œuvre simple, composite, de collaboration Rédaction de contrats en cours Etude des droits
Réalisation de la Plate-forme Stéphane Bouchet Olivier Grouhan Xerox (Marc Tizzano, Rickarg Aberg, Aurélia Walravens et Vanessa Bergère) Méthodologie mise en œuvre Architecture technique Propriétés et avantages de la plate-forme Presentation de l’equipe et des roles de chacuns 2/4
Cycle en Y Méthodologie Branche fonctionnelle Modéliser les processus métier Réaliser les modèles Branche technique Choix des outils Architecture Conception Point de fusion entre la branche fonctionnelle la branche technique Produit un prototype utilisable Méthodologie
Itératif et incrémental Succession de mini projets (Itératif) Chacun de ces mini projets produit une partie du logiciel (Incrémental) Méthodologie
Bibliothèque Numérique Schéma conceptuel BD Documents XML Meta-données étendues Indexation du contenu Soumission de documents Accès aux (recherche / consultation) LDAP Logiciel Documentaire Conversion multi-formats Serveur Vidéo Bibliothèque Numérique Gestion du système (documentalistes) Extérieur Gestion de ses documents (personnels et partagés) Gestion de collections (personnelles et partagées) + Validation suivant le type de document Infos personnalisées (profil, étudiant ou personnel services dédiés) Meta Moteur Gestion de Versions Avis LCMS
Architecture technique - Schéma SGBD Système de fichiers Serveur d’application Conteneur WEB JSP Façade JDO XSLT Administration Gestion du système Validation des documents Utilisateurs Visualisation des documents Recherche de documents Soumission de documents POJO* Moteur de recherche Web Services *Plain Old Java Object EJB Session Implémentation
Architecture technique - Outils J2EE / JDK1.4 Struts (projet Apache) Tomcat Kodo Oracle XALAN/FOP Lucene Architecture
Architecture technique - Outils Convention de codage Junit CVS Maven : Rapport de style Rapport de couverture de code Rapport de mesure de complexité (Metrics) Architecture
Propriétés et avantages de la plate-forme Architecture logicielle ouverte à base de composants Open Source : Maîtrise en local Libre modification/adaptation aux besoins des utilisateurs Utilisation de XML comme format de conservation des documents Propriétés Maitrise locale permet de ne pas être lie a un contrat de maintenance tierce. Adaptation efficace selon les besoins exprimes. Dans le cadre d’une re-distribution, l’adapatation eventuelle est a la charge de l’etablissement final, ou de l’EMN. L’utilisation de XML permet la conservation perenne grace au format, une mise en forme independante du contenu, une lisibilite du contenu
Propriétés et avantages de la plate-forme Intégration avec des outils déjà existants : annuaire LDAP plate-forme e-learning logiciel documentaire etc. Ouverture du système vers l’extérieur Propriétés Tout outil doit savoir communiquer avec l’existant et s’y integrer. GED : dans le cadre de l’ahat d’un nouveau GED, l’equipe BN apporte son expertise et ses exigences. Ouverture des services : grace a la technologie des services Webs par exemple, il est possible d’interroger la BN depuis n’importe ou. Tests et viabilite eprouvee avec l’option GSI de l’annee 2003-2004
Bilan Perspectives plate-forme Architecture évoluée, open-source, technologies de l’état de l’art Orientée institut formation/recherche Littérature Grise / Diffusion Libre des résultats scientifiques Collaboration avec Xerox Ramifications recherche Perspectives
Perspectives Perspectives Maintenir/développer la plate-forme Stabiliser Valoriser / mutualiser Besoin des organismes d’enseignement et de recherche Littérature grise Gérer / archiver et indexer / diffuser Perspectives
Bibliothèque Numérique Plateforme Open source Conception centrée utilisateur Architecture à composants Utilisation des normes (XML, Dublin core) Utilisation d’outils d’indexation tous documents Fonds (littérature grise, documents mutimédias) Traitement des problèmes juridiques (droits d’auteur..) Synthèse