Gabriel Gallezot Urfist paca-c Les Archives Ouvertes Gabriel Gallezot Urfist paca-c
Plan Contexte Scientifique Points d'achoppements Définition Aspects Juridiques Quelques chiffres, Exemples et Outils de Recherche Retour sur la diffusion de la production scientifique Démonstration :HAL
Contexte Scientifique
… Usage de l’information Accès aux documents Rechercher: IR/épistémè Base Bibliographiques Banques de données Revues, ouvrages Colloques Site web, page perso, blog Liste de discussion Editeurs, agrégateurs Archives Ouvertes Bibliothèques Usage de l’information Rechercher: IR/épistémè … Accès aux documents Types de documents Formats de documents
Evaluation pour la publication… Evaluation qualitative : a priori, le peer reviewing, … Auto-évaluation Collègues de labo (évaluation) Direction de N° (guest editor) ou d’ouvrage (sélection/évaluation) Comité de rédaction (sélection) Comité scientifique (évaluation) Editeur (évaluation/correction) Lecteur (évaluation)
… Publication pour l’évaluation Evaluation quantitative : a posteriori, la bibliométrie Garfield et le Science Citation Index (SCI) de l’Institute for Scientific Information (ISI) STM/SHS : JCR et JCR-SS. OST (bases de l’INIST et WoS) Classement de Shanghai (WoS) Instances institutionnelles (CNU, Université, ministère, …) Et … d’autres formes d’évaluation (enquête SHS/CNRS, faculty of 1000, Citeseer, Citebase, schoolar… IRRA (RAE)
Communication scientifique modèle 70’ Source : Julie M. Hurd JASIST 51(14), 2000
Points d'achoppements
… Qu’est-ce que ne va pas … Qu’est-ce que ne va pas ? Une anomalie Post-Gutenbergienne … la « parabole » d’Harnad : détecter les acteurs, les supports et le mode de communication/accès 1. Un jeune chercheur ayant tout juste obtenu son doctorat annonce fièrement à sa mère qu´il vient de publier son premier article. Elle lui demande combien il a été payé. Il grimace, répond : « Rien » et se lance alors dans une explication longue et compliquée... 2.Un chercheur de la même université repère cet article. Il se rend à la bibliothèque pour l´obtenir. On lui répond : « Nous ne sommes pas abonnés à cette revue, trop chère pour nous (notre budget d´abonnements, de droits, de prêt et de reproduction est déjà largement dépensé). » 3. Un étudiant, dans la même université, voit le même article cité sur le Web. Il clique sur la citation. Le site de l´éditeur demande un mot de passe : « Accès refusé : seules les institutions autorisées et ayant souscrit un abonnement ont accès à la revue. » 4. L´étudiant perd patience, s´ennuie et clique sur Napster pour mettre la main sur la version MP3 de son CD favori et se consoler ainsi de ses malheurs.
suite 5. Des années plus tard, la titularisation [recrutement universitaire] du docteur du point 1 est envisagée. Ses publications sont bonnes, mais pas assez citées ; leur « impact sur la recherche » n´est pas suffisant. Titularisation refusée. 6. Le même scénario se répète lorsqu´il essaie d´obtenir des crédits de recherche [institutions , organismes de financement]. Ses résultats scientifiques n´ont pas eu un impact suffisant. Trop peu de chercheurs les ont lus, s´en sont inspirés et les ont cités. Financement refusé. 7. Il essaie alors d´écrire un livre. Les éditeurs refusent de le publier : « On n´en vendrait pas assez d´exemplaires car il y a trop peu d´universités ayant suffisamment d´argent pour en payer le prix (leurs budgets d´achat sont limités par le coût annuel, sans cesse croissant, de leurs abonnements, droits et prêts). 8. Il essaie de mettre ses articles sur le Web, en accès libre, afin d´augmenter leur impact [visibilité]. Son éditeur menace de le poursuivre, ainsi que son fournisseur d´accès, pour violation du copyright. 9. Il demande à son éditeur : « Qui le copyright est-il censé protéger ? » Son éditeur lui répond : « Vous ! » Qu´est-ce qui ne va pas dans cette histoire ? Crise de l'édition scientfique Origine de l’Open Access
Pourquoi des AO ? - 1 (crise de l’édition scientifique) Diktat du "publish or perish" Loi du facteur d'impact (et ses biais) Abandon du droit d'auteur à l'éditeur Concentration des éditeurs spécialisés Augmentation des prix des abonnements (conséquences indirectes pour les chercheurs) Temps entre les résultats et leur publication Restrictions sur ce qui peut ête publié et comment cela peut être diffusé (modèle papier)
Coût de la documentation http://www. arl
Pourquoi des AO ? - 2 (mouvement de l’Open Access) Accessibilité : libre accès aux textes scientifiques (archives ou revues) Partager les textes entre pairs Augmenter la visibilité des textes Retour au public d’un financement public Support de la mémoire scientifique Proposer des nveaux modes de circulation et de percolation des savoirs (modèles socio-cognitifs) … effet sur la recherche et la création de connaissances ?
Définition
AO késako ? Une archive : un réservoir ou entrepôt d'informations, de documents. Ouverte : accès libre et gratuit attendu. Mais « Open » concerne en particulier l'architecture technique. Respect du protocole OAI-PMH Un exemple ? > http://archivesic.ccsd.cnrs.fr/
Définition stricte et… Un réservoir d'articles (prépublication ou postpublication) auto-archivés, en accès libre, sans barrière économique et juridique, intégrant le protocole d'interopérabilité OAI-PMH.
… observations L’article et plus généralement le texte n’est pas le seul type de document possible (dia suivante) L’auto-archivage peut s’entendre au niveau d’une institution Archive payante et gratuite (ex :Repec)
Les documents concernés Articles scientifiques Documents numérisés Thèses et HDR Rapports et études Cours Données primaires et adjuvants à la recherche Ouvrage Notice bibliographique Documents « multimédia » (audio, vidéo, …)
Typologie des Archives Ouvertes Archives Institutionnelles, les projets relevant d’universités, de grandes écoles, d’organismes de recherche, d’associations professionnelles. Les archives disciplinaires concernent les réalisations de communautés scientifiques regroupées ou non en domaines de recherche assez larges. Archive thématique est l’expression consacrée aux dépôts qui se focalisent sur un sujet ou un type de document singulier. Le moissonneur s’apparentera à une méta-archive, une collation de notices au protocole OAI-PMH qui renvoie, pour la consultation du texte intégral, à l’archive d’origine.
Un peu de vocabulaire (jargon ?) Preprint (prépublication) : la première version d’un texte que le chercheur soumet à un comité de lecture ou à ses pairs. Postprint (postpublication) : le texte évalué par le comité de lecture et prêt pour la publication Auto-archivage : dépôt d’un document électronique, que vous avez rédigé, dans un « réservoir » public
4 points historiques 1991 : Création des Archives arXiv.org par P. Ginsparg (pré-publications) 1999 : Le Santa Fe Meeting , OAi (Open Archive initiative). Début du protocole d’interopérabilité OAI-PMH 2001 : Création et lancement du logiciel EPrints.org à l'Université de Southampton (UK). 2002 : La Budapest Open Access Initiative (BOAI). La BOAI est à la fois une déclaration de principe, de stratégie et de soutien financier. La suite de l’histoire sur : Open Access New http://www.earlham.edu/~peters/fos/fosblog.html l’Inist : http://www.inist.fr/openaccess/ Hèlene bosc : http://www.tours.inra.fr/prc/internet/documentation/communication_scientifique/comsci.htm (arrêt en 2006) Wiki-AO : http://urfist-apps.unice.fr/wiki_AO/index.php/Accueil
En france : un accord national Automne 2005 : mise au point d’un protocole d’accord national EPST / CPU pour “une approche coordonnée, au niveau national, pour l'archivage ouvert de la production scientifique » Signature effective juillet 2006 « permettre à la fois aux chercheurs de communiquer directement leurs travaux à l’ensemble de la communauté internationale vers des archives ouvertes, aux institutions de recherche (universités, EPST et grandes écoles) de rassembler, d'afficher, de valoriser, de promouvoir et de pérenniser leur production scientifique et, de façon générale, à la recherche française d'améliorer sa visibilité au sein de la communauté scientifique internationale » Plate-forme de référence: HAL (CCSD) Articulation central / local ; Archives Institutionnelles virtuelles Enjeux: "If it succeeds, it will be an enormous coup for France, and a terrific direction-setter for the rest of the world..." (Stevan Harnad)
Aspects Juridiques
“Shakespeare” et les droits de diffusion Liste ROMEO/SHERPA (UK) sur la politique éditoriale (copyright) de plus de 170 éditeurs http://www.sherpa.ac.uk/romeo.php Elle recense les possibilités de mise sur le web (donc d’auto-archiver) des articles scientifiques par éditeurs. Les revues blanches : celles dont les éditeurs n'ont pas de politique formelle autorisant l'auto-archivage les revues jaunes : autorisent l'auto-archivage des pré-publications (avant les révisions par le comité de lecture) les revues bleues : autorisent l'auto-archivage des post-publications (version finale après révision) les revues vertes : autorisent l'auto-archivage des pré- ET des postpublications Liste JULIET/SHERPA (UK) politiques des “financeurs » : http://www.sherpa.ac.uk/juliet/index.php
Les Creative Commons http://fr.creativecommons.org/ Les licences Creative Commons permettent d’autoriser à l’avance le public à effectuer certaines utilisations de documents selon les conditions exprimées par l’auteur , http://creativecommons.org/license/ Des travaux en cours sur le Science Commons http://sciencecommons.org/ En France c’est le Centre d'Etudes et de Recherches de Science Administrative (CERSA, Université P2 et CNRS) qui est l'institution affiliée pour la traduction et l'adaptation des contrats Creative Commons, http://fr.creativecommons.org/
Quelques chiffres, Exemples et Outils de Recherche
Recensement des archives ouvertes (Nov 2008) Dans le monde: ROAR : Registry of Open Access Repositories : 1201 archives (http://roar.eprints.org/ ) OAIster : 1034 (http://www.oaister.org/ ) OpenDOAR : 1271 (http://www.opendoar.org/ ) (“OAIsation” de BdD) En France Selon OpenDOAR : 40 et selon ROAR 44 Eléments quantitatifs (ROAR) : de 19 en décembre 2004 , 39 en Oct 2007, 42 en mars 2008, …
Des exemples : ArXiv X, P. GINSPARG: http://xxx.lanl.gov, http://fr.arXiv.org Cogprints, E. HARNAD: http://cogprints.org ResearchIndex, Steve Lawrence et C. Lee Giles de NEC Research Institute , http://citeseer.ist.psu.edu/ EconPapers (Economics working papers) http://econpapers.repec.org , un service de RePEc http://repec.org/ Pastel : les thèses des élèves des grandes écoles d'ingénieurs de Paris. http://pastel.paristech.org/ Open video Project : http://www.open-video.org/ @rchiveSIC http://archivesic.ccsd.cnrs.fr/ et HAL : http://hal.ccsd.cnrs.fr/ et http://halshs.ccsd.cnrs.fr/
Des outils de recherche dédiés OAISTER http://www.oaister.org/ OpenDOAR : http://www.opendoar.org Scientificcommons http://www.scientificcommons.org/ Et puis aussi Google scholar : http://scholar.google.com Scirus : http://www.scirus.com
Retour sur la diffusion de la production scientifique
Production scientifique et Compartimentation des savoirs Spécialisation de la R Évaluation de la R => accroissement de la Pub. Sc. (données, textes, revues, etc) Il faut : Mieux connecter Mieux partager Ouvrir le spectre documentaire KDD D’après Swanson (1986)
Retour sur la communication scientifique
Reprend les éléments de communication ... … les transforme ou en propose d'autres Enregistrement public des connaissances Société savante Coût de revient min Echanges personnels, communautaires, publiques Diffusion mondiale multilatérale publique En ref à 1963 1660 1665 Effet des non déposants ? Possibilité d'évaluation des institutions cf IRRA de RAE Priorité à l'article => intérêt Sc. du contenu Dépot de pré-print et post-print Dépot des adjuvants de la recherche Recherche sur des champs et full text Mémoire scientifique publique arXiv OAI-PMH Eprint.org BOAI Protocole … 1970 1989
(Re)penser la diffusion des connaissances Pour une appropriation profonde du « numérique » Cf. une appropriation de l’imprimerie, impression à compte d’auteur, 1er revue, … (re)penser le cycle de l’info la communication scientifique l’évaluation de la recherche
eScience un exemple : La recherche « in silico » Dialectique entre la technique , la production de savoir et sa diffusion Appropriation des technologies, pratiques informationnelles nouvelles ou renouvelées (diffusion et accès) Gain de productivité ? (bouclage rapide du cycle) Gain de créativité ? (tertiarisation documentaire)
Communication scientifique modèle 2020 Source : Julie M. Hurd JASIST 51(14), 2000
Le scholar web Impact factor vs. “web” factor Référencement établi vs. visibilité usage/accès aux BdD commerciales vs. usage/accès généralisé/libre Evaluation maîtrisée par une méthode et une entreprise vs. une multitude d’évaluations, méthodes, projets, ... Publier autrement Déjà à l’œuvre : CiteBase, Citeseer Scholar google, F1000… De l’Open Peer Review au Peer commentary : de la levée de l’anonymat des pairs aux commentaires de la communautés (avant, après, à la place) Science 2.0 Que reproche-t-on au Peer-reviewing ? les experts sont anonymes ce qui favorise leur désengagement : ils s'y mettent au dernier moment, ils ne respectent pas forcément la "checklist" d'évaluation (quand elle existe) les femmes acceptent trois fois plus de manuscrits que les hommes et/mais les femmes sont nettement minoritaires dans les comités d'évaluation les pairs en question sont souvent moins "experts" sur le sujet que l'auteur de l'article des logiques de carrière, institutionnelles et personnelles sont souvent présentes, les auteurs "seniors" ayant ainsi parfois tendance à sous-évaluer le travail de jeunes équipes ou auteurs au profit d'autres seniors (et je ne vous parle même pas des mesquineries et autres animosités personnelles qui - comme dans tout groupe humain - se font évidemment jour, tant il est vrai que "l'anonymat" des articles évalués n'empêche souvent en rien d'identifier leur auteur.) le processus d'évaluation est long, très long (entre 6 mois et 2 ans, parfois plus) il est également coûteux (frais d'édition, de secrétariat, etc ...) il ne joue pas son rôle de filtre (la plupart des articles refusés finissent par être publiés par d'autres revues, et pas nécessairement moins "prestigieuses") il est inefficace qualitativement (on a ainsi montré que les "experts" étaient le plus souvent incapables de repérer les erreurs volontairement introduites dans des articles bidonnés pour les besoins du test)
D’autres Métriques Citebase, 1999, rapport téléchargements/citations Citeseer, Associations des refs, commentaires et votes F1000, 2002, « groupes qualités » IRRA (2005, Institutional Repositories and Research Assessment), RAE Software for Institutional Repositories Google scholar 2004 Facteur H (Hirsch, 2005) : point de rencontre en le nbr de publi et le nbr de fois où elles sont citées Facteur Y (Bollen, 2006), Journal status, Weighted pagerank, author rank : mesures de « réseaux » , de poids, de centralité …
Ce qui se met en place dans nos institutions (Univ et EPST) Système d’Information (SI) local (global ?) imposé par la LOLF (indicateurs d’activités) Ex. sur Unice : CRI/DRED système SIRIUS (ou GRAAL dans d’autre univ) Ex. sur l’INRA : ProdInra Connexions des entrepôts d’informations nationaux et locaux (AO institutionelles notamment) Pour l’univ : ses propres indicateurs Toutes les refs peuvent êtres prises en considération Interopérabilité des SI : constitution de BdD disciplinaires en France, Connectivité avec d’autres BdD (HAL, …)
ISI, OST, SI local, CCSD, schoolar google, … Un nouveau modèle de la publication Scientifique entraînera de nouveaux modes d’évaluation de la recherche ( y compris selon le principe de citation), actuellement pas beaucoup d’anticipation (d’autre lieux de publication, d’autre lieux de citations, etc...) CCSD, moissonneurs Plateforme revues Inextenso citebase F1000 … ISI, OST, BdD fr, commerciales ISI, OST, SI local, CCSD, schoolar google, … Plateforme blogs Scientifiques Trackback Publication archives ouvertes institunionnelles et disciplinaires, revues en lignes Digital Library … Web 2.0 blog, social bookmarking, Social Search, … Ref biblio ? bases biblio par citation par Hit par note, avis Et par …. Xmetrie
En guise de conclusion
Quelques enjeux des AO Politique de la recherche : diffusion des connaissances, bien public, accès public, évaluation de la recherche, visibilité institutionnelle, etc. Qualité (curation, interopérabilité, granularité, …) Juridique (négociations avec éditeurs, Science commons, …) Insertion “locale” : ENT dans les Universités, ou autres systèmes locaux … Vers des « archithèques » : gérer le patrimoine informationnel numérique de la communauté qu'elle sert et qui lui fournit ses moyens. http://blogues.ebsi.umontreal.ca/jms/index.php/2006/09/04/70-reves-d-architheque Accessibilité (relation auteur/lecteur, hébergements) d’autres visibilités (couverture et calculatoire) d’autres formes d’évaluation (liens, hits, moteurs, CiteSeer, Opcite…IRRA) d’autres productions scientifiques (Cf supra)
Aux chercheurs Quand vous publiez… Publiez où vous souhaitez (revues) Auto-archivez dans les archives ouvertes Observez attentivement les droits que vous cédez aux éditeurs Augmentez la visibilité de vos travaux Partagez vos connaissances (processualité de l’écriture ?) Et soutenez le mouvement...
De la nécessité d’être « Open Access » ? Augmentation du prix des revues et « Big Deal » Online or Invisible ? : (Steve Lawrence, Nature, N° 6837, p.521, 2001) http://citeseer.ist.psu.edu/online-nature01/ Articles mis en ligne librement : entre 2,5 à 5,5 fois plus cités que les autres Liens éphémères Appréhender l’effet sur la création de connaissances (cycle de L’IST).
… et Pourtant l’auto-archivage plafonne à 15-20 % de la production (Stevan Harnad) Une grande majorité de chercheurs approuvent l’OA et sont prêts à accepter un mandat impératif (études britanniques et allemandes) La plupart des grands éditeurs scientifiques permettent l’autoarchivage Mouvement mondial : The European Commission, the European Research Advisory Board (EURAB) and the European Research Councils have each recently recommended adopting the policy of providing Open Access to research results. (Very similar recommendations are also being made by governmental research organisations in the United States, Canada, Australia, and Asia.) DRIVER Project : http://www.driver-repository.eu/ DRIVER is a multi-phase effort whose vision and primary objective is to establish a cohesive, pan-European infrastructure of Digital Repositories, offering sophisticated functionality ervices to both researchers and the general public.
Vos questions Les liens du support : http://delicious.com/Gallezot_Urfist/AO-cours Vos questions
Démonstration : HAL - s’inscrire - déposer - son environnement (espace de dépôt, stat, … - chercher et s’abonner - exporter des références et en fonction du déroulement du stage : - créer sa page web perso - tamponner