Castor une plateforme libre de bibliothèque numérique pour la littérature grise La littérature grise regroupe l’ensemble des publications qui échappent aux circuits classiques (commerciaux) d’édition et de diffusion, et qui sont en marge des dispositifs de contrôle bibliographiques (pas de numéro ISSN, ISBN). Il s’agit des thèses mais aussi de tous les rapports d’étudiants, d’une grande partie des articles scientifiques, mais également toute la production des élèves et des enseignants. Le projet Castor a pour objectif principal de fournir un outil de pérennisation (stockage) et de diffusion (recherche) de ces documents. Il est financé entre 2001 et 2005 par la DRRT Pays de la Loire et la région Pays de la Loire, avec: une collaboration avec le centre de documentation de l’IRISA (depuis 2001) une collaboration avec XEROX sur les technologies XML (depuis 2003) une collaboration avec l’université de Nantes (depuis mai 2005) une collaboration avec la société Kosmos (depuis juin 2005) Septembre 2005
Bibliothèque numérique Répondre à des besoins des instituts d’enseignement et de recherche Capitaliser Diffuser Plateforme développée à l’EMN Mené avec les documentalistes Étude sur les pratiques documentaires Financement CPER - Assurer la conservation et l’accès aux documents sur le long terme - Limiter les pertes d’informations dans le temps - Faciliter et rationaliser l’accès à l’information - Valoriser des ressources encore trop peu couvertes par les circuits classiques de recherche d’information : documents pédagogiques, rapports de stages, autres travaux d’élèves, rapports de recherche, mémoires de DEA, de Master, thèses
Principales Étapes Étude depuis juin 2001 Développement depuis septembre 2002 Mise en logiciel libre le 1er janvier 2004 de la version 1.0 Mise en production le 1er mars 2004 à l’EMN Rapports de projets et de stages à partir de septembre 2005 plate-forme Castor : Architecture évoluée, open-source, technologies de l’état de l’art Orientée institut formation/recherche Littérature Grise / Diffusion Libre des résultats scientifiques Collaboration avec Xerox Ramifications recherche
Besoins "Les services de documentation de l’enseignement supérieur doivent aujourd’hui choisir entre deux options : devenir exclusivement des lieux d’aiguillage vers des réservoirs de ressources payants dont la maîtrise leur échappe, ou parallèlement contribuer à la construction des bibliothèques numériques d’accès placées sous leur contrôle”. (Une ambition universitaire légitime, février 2003, Université de Lyon 2) "Beaucoup d’universitaires ressentent le besoin de rappropriation collective de l’information produite dans leurs laboratoires et concluent à la nécessité de se doter d’un entrepôt numérique pour archiver et diffuser leurs productions. La bibliothèque intervient ici pour assurer non seulement la qualité et la normalisation de l’archivage mais également le prolongement de la démarche à l’échelle d’un réseau national et international. Son rôle de fournisseur d’information se trouve ainsi enrichi." (Grisemine, une bibliothèque numérique de littérature grise, Marie-France Claerebout, Jean-Bernard Marino, GL5, dec 2003) Un besoin en matière de bibliothèque numérique pour les instituts de formation/recherche : littérature grise mutualisation et partage des ressources outil support pour : un portail l’enseignement (local et à distance) la recherche tous les outils intranet manipulant des documents numériques
Étude des Besoins (1) La place centrale du document dans les activités de recherche comme d’enseignement L’omniprésence du document numérique : gain de temps (accès rapide à l’information, évaluation immédiate de la pertinence des résultats, limitation des déplacements) facilité d’accès à l’information facilité de recherche dans le texte Des difficultés dans la recherche d’information système D Étude menée sur 78 personnels enseignants chercheurs et doctorants, et 68 élèves de 4ème année. Deux étapes : une étude de la compréhension des pratiques documentaires une évaluation des attentes et des besoins
Étude des Besoins (2) Etude des Besoins Disposer de plus de ressources sous format numérique de l’information scientifique en texte intégral aisément accessible rapidement accessible disponible dans des outils ciblés pour plus de fiabilité éviter de perdre son temps à trier la masse de résultats inégaux fournis par les moteurs généralistes Avoir une meilleure appréciation de la teneur d’un document avant sa visualisation Etude des Besoins A terme, un processus d’auto alimentation et d’auto évaluation des contenus : Enseignants-chercheurs : soumission par l’auteur, catalogage/validation par les gestionnaires du système Élèves ingénieurs : soumission par l’élève, validation du tuteur, catalogage/validation par les gestionnaires du système Dépôt d’avis sur les documents possible par tous Chaque document est décrit par des informations fournies par l’auteur, complétées par les gestionnaires du système. Des concepts originaux viennent améliorer la vie du document : avis de lecteurs, référencement dans plusieurs collections, relations avec d’autres documents, gestion des droits d’accès, etc.
Rapports internes (technique, recherche) Les documents… livres articles Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) cours TD correction Rapports de DEA mini projets Les types de documents : Les documents liés aux activités d’enseignement Produits par les enseignants Support de Cours Composants pédagogiques de manière générale Produits par les élèves Rapports de projets Rapports de stages Les documents liés aux activités de recherche Articles Rapports Thèses, HDR Mémoires de DEA, de Master Recherche Les documents produits par les services administratifs les supports de communication les notes administratives les rapports internes le rapport d’activité Rapports de stage
Rapports internes (technique, recherche) Les documents… livres articles Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) cours TD correction Rapports de DEA mini projets Rapports de stage
Rapports internes (technique, recherche) Les documents… livres articles Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) cours TD correction Rapports de DEA mini projets Rapports de stage
Rapports internes (technique, recherche) Les documents… livres articles Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) cours TD correction Rapports de DEA mini projets Rapports de stage
Rapports internes (technique, recherche) Les documents… Compte-rendu de TP articles livres Compte-rendu de TP Compte-rendu de TP Projet de Recherche TP Rapports internes (technique, recherche) cours TD correction Rapports de DEA mini projets Rapports de stage
Les documents…
Les documents… Visibilité GED Intranet Liens Pédagogique Bibliothèque Numérique Castor Référencement externe Site Internet (Web) Capitaliser la production : des chercheurs (publications, thèses, …) des enseignants (support de cours, …) des étudiants (rapports, …) des directions (rapport d’activité, bilans, synthèses, …) des services administratifs (communication, règlements, …) Portails documentaires (OAI) Meta Moteurs Externes
Visibilité La conservation des thèses La prise en compte du patrimoine documentaire des instituts La publication libre des résultats scientifiques (Budapest Open Access Initiative ) L’enjeu des centres de ressources autour de la connaissance
Techniquement Documents transformés en XML Méta données XML en Dublin Core Gestion des droits sur le document (licence et droit d’accès) Utilisation à travers un client léger (tout navigateur web) Simple et ergonomique État de l’art des technologies du Web Plate forme : Open source Conception centrée utilisateur Architecture à composants Utilisation des normes (XML, Dublin core) Utilisation d’outils d’indexation tous documents Fonds (littérature grise, documents mutimédias) Traitement des problèmes juridiques (droits d’auteur..)
Avantages Pédagogiques Scientifiques Institutionnels Reconnaissance Travaux des anciens et des nouveaux Scientifiques Continuité des projets Cohérence et qualité de l’information Gestion électronique des thèses Institutionnels Visibilité externe Diffusion des résultats scientifiques
Phase de diffusion Plateforme stabilisée Réalisation de la version 1.1 Version 1.0.2 le 30 mai Réalisation de la version 1.1 Université de Nantes Xerox
Bibliothèque Numérique Schéma conceptuel BD Documents XML Meta-données étendues Indexation du contenu Soumission de documents Accès aux (recherche / consultation) LDAP Logiciel Documentaire Conversion multi-formats Serveur Vidéo Bibliothèque Numérique Gestion du système (documentalistes) Extérieur Gestion de ses documents (personnels et partagés) Gestion de collections (personnelles et partagées) + Validation suivant le type de document Infos personnalisées (profil, étudiant ou personnel services dédiés) Meta Moteur Gestion de Versions Avis LCMS
Architecture technique - Schéma SGBD Système de fichiers Serveur d’application Conteneur WEB JSP Façade JDO XSLT Administration Gestion du système Validation des documents Utilisateurs Visualisation des documents Recherche de documents Soumission de documents POJO* Moteur de recherche Web Services *Plain Old Java Object EJB Session Implémentation
Architecture technique - Outils J2EE / JDK1.4 Struts (projet Apache) Tomcat Kodo Oracle XALAN/FOP Lucene Architecture
Architecture technique - Outils Convention de codage Junit CVS Maven : Rapport de style Rapport de couverture de code Rapport de mesure de complexité (Metrics) Architecture
Propriétés et avantages de la plate-forme Architecture logicielle ouverte à base de composants Open Source : Maîtrise en local Libre modification/adaptation aux besoins des utilisateurs Utilisation de XML comme format de conservation des documents Propriétés La maîtrise locale permet de ne pas être lié a un contrat de maintenance tierce. Elle permet une adaptation efficace selon les besoins exprimés. Dans le cadre d’une re-distribution, l’adaptation peut être faite par l’établissement final ou par l’EMN. L’utilisation de XML permet la conservation pérenne, une mise en forme indépendante du contenu et une lisibilité du contenu garantie dans le temps.
Propriétés et avantages de la plate-forme Intégration avec des outils déjà existants : annuaire LDAP plate-forme e-learning logiciel documentaire etc. Ouverture du système vers l’extérieur Propriétés Tout outil doit savoir communiquer avec l’existant et s’y intégrer. Par exemple avec les outils de GED utilisés dans les CDIs. Ouverture des services Grâce à la technologie des services Webs par exemple, il est possible d’interroger la BN depuis n’importe ou.