La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Juin 2006 1 Le CCSD construit HAL, une archive ouverte internationale et multi disciplinaire

Présentations similaires


Présentation au sujet: "Juin 2006 1 Le CCSD construit HAL, une archive ouverte internationale et multi disciplinaire"— Transcription de la présentation:

1 Juin 2006 1 Le CCSD construit HAL, une archive ouverte internationale et multi disciplinaire daniel.charnay@ccsd.cnrs.fr

2 Juin 2006 2 L’impact du Web sur l’édition scientifique  Visibilité et accessibilité  L’impact d’une publication est accru de manière substantielle si celle-ci est accessible librement sur le Web « On line or invisible » ? S. Lawrence, NEC Research Institute  Dans les domaines de mathématiques (Odlyzko A., 2001), astrophysique (Kurtz MJ, 2003), physique, avec un échantillonnage de 14 millions d’articles de la BdD ISI sur 10 ans, le taux de citation est 2.5 à 5 fois supérieur pour les articles en libre accès (S. Harnad, 2004)  Depuis fin novembre 2004, on peut consulter http://scholar.google.com qui indexe les articles en ligne et traite toutes leurs références

3 Juin 2006 3 L’impact du Web sur l’édition scientifique  Pérennité  Différentes études sur les liens figurant en notes de bas de page et références des publications révèlent une inquiétante «dégénérescence» avec le temps : 3,8% des liens cités dans les articles de 3 journaux scientifiques (Nature, Science et The New England Journal of Medecine) sont inaccessibles 3 mois après leur publication; ce taux monte à 10% après 15 mois, 13% après 27 mois … 40% des liens référencés par les articles de deux journaux informatiques sont inaccessibles 4 ans après la publication « Je pense à l’incendie de la bibliothèque d’Alexandrie » Robert Delavalle, physicien à l’université du Colorado

4 Juin 2006 4 Un mouvement mondial en faveur du libre accès  Au-delà des accords de Budapest (2002), Bethesda et Berlin (2003)  25 prix Nobel soutiennent le Libre Accès (lettre ouverte au congrès, septembre 2004)  En France  L’Académie des Sciences, l’INRIA, l’INSERM, le CA de l’ANR, le CNRS (lettre du DG prévue pour juillet 2006), recommandent le dépôt en archives ouvertes  Signature imminente de l’accord inter-établissements : CEMAGREF, CIRAD, CNRS, CPU, INRA, INRIA, INSERM, Institut PASTEUR, IRD, Conférence des Grandes Ecoles

5 Juin 2006 5 Phrases clés, mots clés  Libre accès aux résultats de la recherche  Réappropriation de la communication scientifique par les scientifiques  Revendication « humaniste » : le libre accès à la connaissance, gratuité, accessibilité  Revendication pragmatique : les budgets documentaires des organismes n’arrivent plus à suivre les tarifs des éditeurs  Emergence de nouveaux «modèles économiques» de l’édition scientifique  Découplage des différentes fonctions du processus traditionnel de publication : évaluation – archivage – diffusion – enregistrement – labellisation …  Communication scientifique directe (CSD)  Un circuit court et rapide entre les chercheurs pour faire connaître leur résultats (et prendre date pour leur recherche)  Auto archivage  Les chercheurs déposent eux-mêmes leurs articles sur des bases ouvertes  Interopérabilité  On met en œuvre des moyens pour « favoriser » l’interconnexion des bases d’articles scientifiques  Archivage à long terme

6 Juin 2006 6 HAL, la mission du CCSD  Une initiative pour des archives scientifiques multidisciplinaires  Une approche internationale :  Ne construire ni une archive nationale, ni une archive institutionnelle mais s’intégrer dans le mouvement « open archives »  Une approche essentiellement « chercheur »  Des archives alimentées directement par les chercheurs avec, comme vocation première, la réalisation d’un outil scientifique offrant l’accès au texte intégral du document  Un outil institutionnel « indirect » grâce à la collecte de méta données suffisantes (association auteur -> laboratoires -> institutions)  Résolution des problèmes d’archivage à long terme

7 Juin 2006 7 ArXiv, un modèle en physique et mathématiques depuis plus de 10 ans  Initiative de Paul Ginsparg à Los Alamos (xxx)  4 000 manuscrits déposés par mois  500 000 manuscrits déposés à ce jour  300 000 consultations journalières  Des sites miroirs dans le monde entier Australie, Brésil, Chine, Allemagne, Inde, Israël Italie, Japon, Russie, Afrique du Sud, France Corée du Sud, Espagne, Taiwan, Angleterre,…

8 Juin 2006 8 HAL, les raisons d’une centralisation  Garantir l’accessibilité au texte intégral  Préserver un niveau scientifique homogène et de qualité  Offrir une meilleure visibilité à l’international  Fournir des URL pérennes  Permettre l’indexation global du texte intégral contenu dans la base  Horodater les dépôts  Interconnecter avec les bases mondiales de référence  Enrichir automatiquement les référentiels institutionnels  Limiter la saisie des références  Centraliser les alertes du lecteur  Gérer l’archivage à long terme  Et … limiter l’effort à une seule unité spécialisée

9 Juin 2006 9 Politique des éditeurs  Les éditeurs, sont de plus en plus nombreux à revoir leur politique de publication et les contrats de transfert de droits d’exploitation associés.  Depuis mai 2004 : Elsevier « An author may post his version of the final paper on his personal web site and on his institution’s web site (including his institutional repository). Each posting should include the article’s citation and link to the journal homepage (or the article DOI). The author does not need our permission to do this, but any other posting (e.g to a repository elsewhere) would require our permission. By his version we are referring to his word or tex file, not a pdf or HTML download from science direct, but the author can update his version to reflect changes made during the refereeing and editing process. » K. Hunter senior vice president strategy Elsevier, may 2004

10 Juin 2006 10 L’archive ouverte HAL  Développée entièrement par le CCSD  Partenariat avec l’INRIA  Technologies « libres »  LAMP (Linux, Apache, MySQL, PHP)  Environnement sécurisé (hébergé par le Centre de Calcul de l’IN2P3)

11 Juin 2006 11 HAL  Usages  Pré publications, Post publications, notices bibliographiques :o((  Typologie des notices bibliographiques Publications dans des revues à comité de lecture Conférences invitées dans des congrès Proceedings à comité de lecture Publications dans des revues sans comité Communications à des congrès, symposium Séminaires, workshops Chapitres dans les ouvrages Livres et ouvrages Brevets Thèses

12 Juin 2006 12 HAL, usages  Scénario Le chercheur dépose sa pré publication dans l’archive Des retours rapides de sa communauté scientifique vont peut être initier de sa part le dépôt d’une nouvelle version C’est « presque » avec l’assentiment de sa communauté qu’il dépose sa « pré publication » chez un éditeur L’article est publié, le chercheur met à jour les références bibliographique dans la base, l’article devient une post publication Le chercheur souhaite faire de nouvelles mise à jour de cet article ? Il en dépose une nouvelle version !  Le cycle de vie d’un article va donc au-delà de sa publication dans une revue : e-publication ? Les archives ouvertes bouleversent la publication : post publications et pré publications deviennent des notions obsolètes !

13 Juin 2006 13 Déposer dans HAL  Modalités de dépôt  Identification simplifiée Compte auto validé (possibilité d’authentification institutionnelle) Contributeurs : auteurs, documentalistes, éditeurs scientifiques, etc.  Niveau scientifique requis « Tout article qui, soumis à une revue à comité de lecture, serait envoyé à un rapporteur » Vérification avant mise en ligne  Vérification technique  Validation scientifique sommaire par domaine ou par portail de dépôt  Format des documents libre Format visualisable obligatoire (PDF, PS) Fichiers sources recommandés  Dépôt sans retrait Possibilité de déposer des nouvelles versions L’ensemble des versions est accessible par l’internaute

14 Juin 2006 14 Interopérabilité, interconnexions, imports/exports  OAI-PMH  multi formats dont OAI_DC (Dublin core non qualifié)  REDIF  pour le moissonnage par RePeC (économistes)  RSS  Connexions  arXiv dans les domaines de physique et mathématiques (biologie), uniquement de HAL vers arXiv  Pubmed (HAL-INSERM) Depuis février 2006 facilité d’import de la notice depuis Pubmed Transfert vers Pubmed Central en cours d’étude  Imports  Fichiers XML, méta données et texte intégral (Web services courant 2006)  Exports  Listes selon critères de recherches dans tous les formats informatiques usuels  « Home page » chercheur  Exports institutionnels (Crac, Labintel, etc.)  Web services

15 Juin 2006 15 Structure de HAL

16 Juin 2006 16 Portails de dépôts Texte intégral Notice bibliographique Notice bibliographique HALINRIA HAL-SHS AUTRES UNIV INRA PubMed Central (2006 ) PubMed Central (2006 ) ArXiv Méta données communesMéta données disciplinairesMéta données institutionnelles haLhaL EXPORTS IMPORTS XML, WS TEL génériqu e disciplinaire typologique institutionnel OAI-PMH REDIF RSS Etc.

17 Juin 2006 17 Environnements de dépôts HALIN2P3 HAL-SHS AUTRES UNIV INRIA haLhaL EXPORTS IMPORTS XML, WS TEL génériqu e disciplinaire typologique institutionnel OAI-PMH REDIF RSS Etc. Collections personnalisables, extractions, tampons

18 Juin 2006 18 référentiel laboratoires référentiel titres de revues référentiel classification scientifique ws Accessibilité des référentiels

19 Juin 2006 19 Quoi de neuf dans HAL ?

20 Juin 2006 20 Intégrations  Différentes archives étaient indépendantes de HAL et sur d’anciennes plates-formes e-Print  Depuis septembre 2005, nous avons intégré dans HAL  TEL le serveur de Thèses en Lignes  Archivesic  Archive de l’Institut Jean Nicod

21 Juin 2006 21 Quelques nouveaux portails de dépôt  HAL-INSERM  PRUNEL (École Normale Supérieure de Lyon (sciences))  HAL-EMSE (École des Mines de St Etienne)  HAL-UJM (Université Jean Monnet St Etienne)  Telearn  Etc.  Prochainement  L’Institut Pasteur  Le Muséum d’histoire naturelle  HAL-STIC  Etc.  Et des dizaines de collections (tampons)…

22 Juin 2006 22 Méta portail  Principe  Regrouper les portails d’une fédération d’établissements ou de laboratoires dans un portail unique  Proposer une navigation élémentaire Lorsque l’on s’échappe dans un des portails, on trouve un onglet de retour vers le méta portail  En projet pour Le PUL (Pôle Universitaire Lyonnais) Agropolis L’Institut fédératif des neurosciences Etc.

23 Juin 2006 23 Méta données disciplinaires  HAL générique recueille des métas données identiques pour toutes les disciplines scientifiques  Certains portails exploitent des méta données ou des fonctionnalités institutionnelles et disciplinaires !  Exemple HAL-INSERM permet de télécharger les méta données d’une notice via le « pubmed_id »  HAL générique réintégrera toutes méta données ou fonctionnalités disciplinaires qui seraient nécessaires  Toutes les notices d’une même discipline devraient être ainsi homogènes quel que soit le portail utilisé pour le dépôt  Ceci permettra l’ouverture du dépôt pour tous les domaines scientifiques depuis le HAL générique (SHS)

24 Juin 2006 24 Normalisation  La typologie des documents sera normalisée sur l’ensemble de la plate-forme  La typologie sera adaptée à celle du ministère utilisée pour les contrats quadriennaux

25 Juin 2006 25 Facilités  « auteurs » connus de HAL  « mes statistiques »  page « chercheur » (SHS)  recherche en texte intégral (septembre)  à l’étude, une nouvelle ergonomie pour la page «auteur labo»

26 Juin 2006 26 Fonctionnalité nouvelle  Embargo  Possibilité de cacher le texte intégral d’un dépôt pour répondre au délai d’embargo d’un éditeur (de 15 jours à 2 ans) Le document devient automatiquement public passé ce délai  Document non public Cet état peut être modifié par un rôle de type « documentaliste »  Les rôles spécifiques ne peuvent aller que vers la mise en ligne et ne peuvent pas faire passer un document en ligne vers un mode « non public » Peut répondre à une politique de type portail INSERM (actuellement)  Dépôts par le chercheur dans un mode forcé « non public »  Passage en ligne par un « valideur »

27 Juin 2006 27 Services WEB  Utilisation du protocole SOAP (Simple Object Application Protocol)  Échange de données au format XML  Encapsulation du texte intégral en base64 pour son transfert  Fournir des méthodes pour qu’une application informatique extérieure puisse utiliser HAL  Lecture des référentiels (laboratoires, thématiques, listes des journaux, etc.) Nécessaire pour préparer l’envoi d’un document  Dépôt d’un document  Modification des méta données d’un document, ajout des références, etc.  Dépôt d’une nouvelle version  Recherche et lecture dans la base  En adhérant au schéma de données de HAL, il devient possible  de connecter son propre système documentaire  de créer sa propre interface de dépôt

28 Juin 2006 28 Services Web, premiers projets  Développé par EVER-EZIDA pour le compte de la MISHA  Le logiciel FLORA permettra de déposer sur HAL sur demande de l’utilisateur, le dépôt d’un article « pertinent » pour HAL sera automatiquement effectué  Disponibilité prévue septembre 2006  Intégration de HAL dans les ENT des universités grenobloises  Dépôt, recherche, etc.

29 Juin 2006 29 Supports utilisateurs  Mise en place d’un outil pour l’assistance aux utilisateurs  Fondé sur XOOP/XHELP  Dépôts via une interface Web (ou par mail) http://support.ccsd.cnrs.fr  Garantir une réponse à l’utilisateur  Personnels du CCSD d’astreinte  Tracabilité des incidents  Base de connaissances

30 Juin 2006 30 Statistiques de dépôt

31 Juin 2006 31 Répartition par domaines scientifiques des dépôts avec texte intégral

32 Juin 2006 32 Nombre de dépôts en texte intégral sur l’ensemble de l’archive

33 Juin 2006 33 Ensemble des dépôts, texte intégral et notices sur l’ensemble de l’archive

34 Juin 2006 34 Sur une plate-forme unique …URL’S  HAL  http://hal.ccsd.cnrs.fr  http://tel.ccsd.cnrs.fr  http://halshs.ccsd.cnrs.fr  http://hal.in2p3.fr  http://archive-edutice.ccsd.cnrs.fr  http://hal.inria.fr/  http://hal-inserm.ccsd.cnrs.fr/  http://artxiker.ccsd.cnrs.fr/  http://etol.ccsd.cnrs.fr  http://cel.ccsd.cnrs.fr  http://nicod.in2p3.fr/  http://asic.ccsd.cnrs.fr/  http://hal-ens-lyon.ccsd.cnrs.fr/  Etc.

35 Juin 2006 35 Questions ? http://ccsd.cnrs.fr Daniel.Charnay@in2p3.fr

36 Juin 2006 36 Services Web (2)  Dévelopé par EVER-EZIDA pour le compte de la MISHA  Le logiciel FLORA permettra de déposer sur HAL Sur demande de l’utilisateur, le dépôt d’un article « pertinent » pour HAL sera automatiquement effectué  Disponibilité prévue septembre 2006

37 Juin 2006 37 Dépôt  Simplification  4 étapes 1. Méta données 2. Auteurs, association laboratoires, établissements 3. [téléchargement du document] 4. Récapitulation contrôle, dépôt Retour en arrière possible 2 auteursmétadonnéesrécapitulationfichiers

38 Juin 2006 38 Dépôt  Choix des étapes  L’ordre des étapes peut être paramétré au niveau d’une interface particulière Par exemple, on peut décider de commencer par le téléchargement du fichier, afin d’en extraire automatiquement …  …La liste d’auteurs  …Le résumé  …Les références bibliographiques  …Etc. Ces possibles automatismes dépendent fortement du niveau de structuration du document source, (donc de la discipline ?) Extraction automatique Extraction automatique auteursfichiers récapitulationméta données


Télécharger ppt "Juin 2006 1 Le CCSD construit HAL, une archive ouverte internationale et multi disciplinaire"

Présentations similaires


Annonces Google