Juin Le CCSD construit HAL, une archive ouverte internationale et multi disciplinaire
Juin L’impact du Web sur l’édition scientifique Visibilité et accessibilité L’impact d’une publication est accru de manière substantielle si celle-ci est accessible librement sur le Web « On line or invisible » ? S. Lawrence, NEC Research Institute Dans les domaines de mathématiques (Odlyzko A., 2001), astrophysique (Kurtz MJ, 2003), physique, avec un échantillonnage de 14 millions d’articles de la BdD ISI sur 10 ans, le taux de citation est 2.5 à 5 fois supérieur pour les articles en libre accès (S. Harnad, 2004) Depuis fin novembre 2004, on peut consulter qui indexe les articles en ligne et traite toutes leurs références
Juin L’impact du Web sur l’édition scientifique Pérennité Différentes études sur les liens figurant en notes de bas de page et références des publications révèlent une inquiétante «dégénérescence» avec le temps : 3,8% des liens cités dans les articles de 3 journaux scientifiques (Nature, Science et The New England Journal of Medecine) sont inaccessibles 3 mois après leur publication; ce taux monte à 10% après 15 mois, 13% après 27 mois … 40% des liens référencés par les articles de deux journaux informatiques sont inaccessibles 4 ans après la publication « Je pense à l’incendie de la bibliothèque d’Alexandrie » Robert Delavalle, physicien à l’université du Colorado
Juin Un mouvement mondial en faveur du libre accès Au-delà des accords de Budapest (2002), Bethesda et Berlin (2003) 25 prix Nobel soutiennent le Libre Accès (lettre ouverte au congrès, septembre 2004) En France L’Académie des Sciences, l’INRIA, l’INSERM, le CA de l’ANR, le CNRS (lettre du DG prévue pour juillet 2006), recommandent le dépôt en archives ouvertes Signature imminente de l’accord inter-établissements : CEMAGREF, CIRAD, CNRS, CPU, INRA, INRIA, INSERM, Institut PASTEUR, IRD, Conférence des Grandes Ecoles
Juin Phrases clés, mots clés Libre accès aux résultats de la recherche Réappropriation de la communication scientifique par les scientifiques Revendication « humaniste » : le libre accès à la connaissance, gratuité, accessibilité Revendication pragmatique : les budgets documentaires des organismes n’arrivent plus à suivre les tarifs des éditeurs Emergence de nouveaux «modèles économiques» de l’édition scientifique Découplage des différentes fonctions du processus traditionnel de publication : évaluation – archivage – diffusion – enregistrement – labellisation … Communication scientifique directe (CSD) Un circuit court et rapide entre les chercheurs pour faire connaître leur résultats (et prendre date pour leur recherche) Auto archivage Les chercheurs déposent eux-mêmes leurs articles sur des bases ouvertes Interopérabilité On met en œuvre des moyens pour « favoriser » l’interconnexion des bases d’articles scientifiques Archivage à long terme
Juin HAL, la mission du CCSD Une initiative pour des archives scientifiques multidisciplinaires Une approche internationale : Ne construire ni une archive nationale, ni une archive institutionnelle mais s’intégrer dans le mouvement « open archives » Une approche essentiellement « chercheur » Des archives alimentées directement par les chercheurs avec, comme vocation première, la réalisation d’un outil scientifique offrant l’accès au texte intégral du document Un outil institutionnel « indirect » grâce à la collecte de méta données suffisantes (association auteur -> laboratoires -> institutions) Résolution des problèmes d’archivage à long terme
Juin ArXiv, un modèle en physique et mathématiques depuis plus de 10 ans Initiative de Paul Ginsparg à Los Alamos (xxx) manuscrits déposés par mois manuscrits déposés à ce jour consultations journalières Des sites miroirs dans le monde entier Australie, Brésil, Chine, Allemagne, Inde, Israël Italie, Japon, Russie, Afrique du Sud, France Corée du Sud, Espagne, Taiwan, Angleterre,…
Juin HAL, les raisons d’une centralisation Garantir l’accessibilité au texte intégral Préserver un niveau scientifique homogène et de qualité Offrir une meilleure visibilité à l’international Fournir des URL pérennes Permettre l’indexation global du texte intégral contenu dans la base Horodater les dépôts Interconnecter avec les bases mondiales de référence Enrichir automatiquement les référentiels institutionnels Limiter la saisie des références Centraliser les alertes du lecteur Gérer l’archivage à long terme Et … limiter l’effort à une seule unité spécialisée
Juin Politique des éditeurs Les éditeurs, sont de plus en plus nombreux à revoir leur politique de publication et les contrats de transfert de droits d’exploitation associés. Depuis mai 2004 : Elsevier « An author may post his version of the final paper on his personal web site and on his institution’s web site (including his institutional repository). Each posting should include the article’s citation and link to the journal homepage (or the article DOI). The author does not need our permission to do this, but any other posting (e.g to a repository elsewhere) would require our permission. By his version we are referring to his word or tex file, not a pdf or HTML download from science direct, but the author can update his version to reflect changes made during the refereeing and editing process. » K. Hunter senior vice president strategy Elsevier, may 2004
Juin L’archive ouverte HAL Développée entièrement par le CCSD Partenariat avec l’INRIA Technologies « libres » LAMP (Linux, Apache, MySQL, PHP) Environnement sécurisé (hébergé par le Centre de Calcul de l’IN2P3)
Juin HAL Usages Pré publications, Post publications, notices bibliographiques :o(( Typologie des notices bibliographiques Publications dans des revues à comité de lecture Conférences invitées dans des congrès Proceedings à comité de lecture Publications dans des revues sans comité Communications à des congrès, symposium Séminaires, workshops Chapitres dans les ouvrages Livres et ouvrages Brevets Thèses
Juin HAL, usages Scénario Le chercheur dépose sa pré publication dans l’archive Des retours rapides de sa communauté scientifique vont peut être initier de sa part le dépôt d’une nouvelle version C’est « presque » avec l’assentiment de sa communauté qu’il dépose sa « pré publication » chez un éditeur L’article est publié, le chercheur met à jour les références bibliographique dans la base, l’article devient une post publication Le chercheur souhaite faire de nouvelles mise à jour de cet article ? Il en dépose une nouvelle version ! Le cycle de vie d’un article va donc au-delà de sa publication dans une revue : e-publication ? Les archives ouvertes bouleversent la publication : post publications et pré publications deviennent des notions obsolètes !
Juin Déposer dans HAL Modalités de dépôt Identification simplifiée Compte auto validé (possibilité d’authentification institutionnelle) Contributeurs : auteurs, documentalistes, éditeurs scientifiques, etc. Niveau scientifique requis « Tout article qui, soumis à une revue à comité de lecture, serait envoyé à un rapporteur » Vérification avant mise en ligne Vérification technique Validation scientifique sommaire par domaine ou par portail de dépôt Format des documents libre Format visualisable obligatoire (PDF, PS) Fichiers sources recommandés Dépôt sans retrait Possibilité de déposer des nouvelles versions L’ensemble des versions est accessible par l’internaute
Juin Interopérabilité, interconnexions, imports/exports OAI-PMH multi formats dont OAI_DC (Dublin core non qualifié) REDIF pour le moissonnage par RePeC (économistes) RSS Connexions arXiv dans les domaines de physique et mathématiques (biologie), uniquement de HAL vers arXiv Pubmed (HAL-INSERM) Depuis février 2006 facilité d’import de la notice depuis Pubmed Transfert vers Pubmed Central en cours d’étude Imports Fichiers XML, méta données et texte intégral (Web services courant 2006) Exports Listes selon critères de recherches dans tous les formats informatiques usuels « Home page » chercheur Exports institutionnels (Crac, Labintel, etc.) Web services
Juin Structure de HAL
Juin Portails de dépôts Texte intégral Notice bibliographique Notice bibliographique HALINRIA HAL-SHS AUTRES UNIV INRA PubMed Central (2006 ) PubMed Central (2006 ) ArXiv Méta données communesMéta données disciplinairesMéta données institutionnelles haLhaL EXPORTS IMPORTS XML, WS TEL génériqu e disciplinaire typologique institutionnel OAI-PMH REDIF RSS Etc.
Juin Environnements de dépôts HALIN2P3 HAL-SHS AUTRES UNIV INRIA haLhaL EXPORTS IMPORTS XML, WS TEL génériqu e disciplinaire typologique institutionnel OAI-PMH REDIF RSS Etc. Collections personnalisables, extractions, tampons
Juin référentiel laboratoires référentiel titres de revues référentiel classification scientifique ws Accessibilité des référentiels
Juin Quoi de neuf dans HAL ?
Juin Intégrations Différentes archives étaient indépendantes de HAL et sur d’anciennes plates-formes e-Print Depuis septembre 2005, nous avons intégré dans HAL TEL le serveur de Thèses en Lignes Archivesic Archive de l’Institut Jean Nicod
Juin Quelques nouveaux portails de dépôt HAL-INSERM PRUNEL (École Normale Supérieure de Lyon (sciences)) HAL-EMSE (École des Mines de St Etienne) HAL-UJM (Université Jean Monnet St Etienne) Telearn Etc. Prochainement L’Institut Pasteur Le Muséum d’histoire naturelle HAL-STIC Etc. Et des dizaines de collections (tampons)…
Juin Méta portail Principe Regrouper les portails d’une fédération d’établissements ou de laboratoires dans un portail unique Proposer une navigation élémentaire Lorsque l’on s’échappe dans un des portails, on trouve un onglet de retour vers le méta portail En projet pour Le PUL (Pôle Universitaire Lyonnais) Agropolis L’Institut fédératif des neurosciences Etc.
Juin Méta données disciplinaires HAL générique recueille des métas données identiques pour toutes les disciplines scientifiques Certains portails exploitent des méta données ou des fonctionnalités institutionnelles et disciplinaires ! Exemple HAL-INSERM permet de télécharger les méta données d’une notice via le « pubmed_id » HAL générique réintégrera toutes méta données ou fonctionnalités disciplinaires qui seraient nécessaires Toutes les notices d’une même discipline devraient être ainsi homogènes quel que soit le portail utilisé pour le dépôt Ceci permettra l’ouverture du dépôt pour tous les domaines scientifiques depuis le HAL générique (SHS)
Juin Normalisation La typologie des documents sera normalisée sur l’ensemble de la plate-forme La typologie sera adaptée à celle du ministère utilisée pour les contrats quadriennaux
Juin Facilités « auteurs » connus de HAL « mes statistiques » page « chercheur » (SHS) recherche en texte intégral (septembre) à l’étude, une nouvelle ergonomie pour la page «auteur labo»
Juin Fonctionnalité nouvelle Embargo Possibilité de cacher le texte intégral d’un dépôt pour répondre au délai d’embargo d’un éditeur (de 15 jours à 2 ans) Le document devient automatiquement public passé ce délai Document non public Cet état peut être modifié par un rôle de type « documentaliste » Les rôles spécifiques ne peuvent aller que vers la mise en ligne et ne peuvent pas faire passer un document en ligne vers un mode « non public » Peut répondre à une politique de type portail INSERM (actuellement) Dépôts par le chercheur dans un mode forcé « non public » Passage en ligne par un « valideur »
Juin Services WEB Utilisation du protocole SOAP (Simple Object Application Protocol) Échange de données au format XML Encapsulation du texte intégral en base64 pour son transfert Fournir des méthodes pour qu’une application informatique extérieure puisse utiliser HAL Lecture des référentiels (laboratoires, thématiques, listes des journaux, etc.) Nécessaire pour préparer l’envoi d’un document Dépôt d’un document Modification des méta données d’un document, ajout des références, etc. Dépôt d’une nouvelle version Recherche et lecture dans la base En adhérant au schéma de données de HAL, il devient possible de connecter son propre système documentaire de créer sa propre interface de dépôt
Juin Services Web, premiers projets Développé par EVER-EZIDA pour le compte de la MISHA Le logiciel FLORA permettra de déposer sur HAL sur demande de l’utilisateur, le dépôt d’un article « pertinent » pour HAL sera automatiquement effectué Disponibilité prévue septembre 2006 Intégration de HAL dans les ENT des universités grenobloises Dépôt, recherche, etc.
Juin Supports utilisateurs Mise en place d’un outil pour l’assistance aux utilisateurs Fondé sur XOOP/XHELP Dépôts via une interface Web (ou par mail) Garantir une réponse à l’utilisateur Personnels du CCSD d’astreinte Tracabilité des incidents Base de connaissances
Juin Statistiques de dépôt
Juin Répartition par domaines scientifiques des dépôts avec texte intégral
Juin Nombre de dépôts en texte intégral sur l’ensemble de l’archive
Juin Ensemble des dépôts, texte intégral et notices sur l’ensemble de l’archive
Juin Sur une plate-forme unique …URL’S HAL Etc.
Juin Questions ?
Juin Services Web (2) Dévelopé par EVER-EZIDA pour le compte de la MISHA Le logiciel FLORA permettra de déposer sur HAL Sur demande de l’utilisateur, le dépôt d’un article « pertinent » pour HAL sera automatiquement effectué Disponibilité prévue septembre 2006
Juin Dépôt Simplification 4 étapes 1. Méta données 2. Auteurs, association laboratoires, établissements 3. [téléchargement du document] 4. Récapitulation contrôle, dépôt Retour en arrière possible 2 auteursmétadonnéesrécapitulationfichiers
Juin Dépôt Choix des étapes L’ordre des étapes peut être paramétré au niveau d’une interface particulière Par exemple, on peut décider de commencer par le téléchargement du fichier, afin d’en extraire automatiquement … …La liste d’auteurs …Le résumé …Les références bibliographiques …Etc. Ces possibles automatismes dépendent fortement du niveau de structuration du document source, (donc de la discipline ?) Extraction automatique Extraction automatique auteursfichiers récapitulationméta données