Valorisation des données de la recherche : l’offre de services de l’Inist-CNRS - OPIDoR - DoRANum Données de recherche : statistiques, résultats d’experiences, mesures, observations sur le terrain, résultats d’enquetes, enregistrements d’entretiens, images … sous format numérique.
Open data - Open access - Open Research Data Révision Directive PSI Charte du G8 Pour l’ouverture des données publiques 2013 Open data Loi Valter 2015 Directive INSPIRE 2007 Open research data Directive PSI Réutilisation des documents publics 2003 2016 Loi pour une République numérique Loi Cada Accès aux documents administratifs 1978 2013 Pilote H2020 2004 Déclaration de l’OCDE 2003 Déclaration de Berlin 2002 Initiative de Budapest open access Open access 1996 Principes de Bermudes
H2020 - ANR H2020, Pilote ORD 2013 – 2016, une 1ère étape À compter de janvier 2017, extension à toutes les thématiques scientifiques DMP obligatoire et dépôt de données en libre accès ou pas « Aussi ouvert que possible, aussi fermé que nécessaire » ANR Annonce : ANR tour 2018 Calendrier : projets déposés en 2019, libre choix modèle du DMP Mise en place : projets 2019 Dans le cadre du programme H2020, une action pilote « libre accès aux données de la recherche » a été mise en place . Le pilote ORD a pour objectif d’améliorer l’accès et la réutilisation des DR générées par les projets H2020. Ouverture par défaut sauf restrictions (commercialisation, propriété industrielle, sécurité….) Principe « Aussi ouvert que possible, aussi fermé que nécessaire » Dans un premier temps (2014-2016) ce pilote concernait une sélection de domaines. A partir de janvier 2017, extension à tous les domaines H2020. Un PGD est requis pour les participants au pilote. Les porteurs de projets ne participant pas au pilote (désengagés pour des raisons définies « opt out ») sont également encouragés à soumettre un PGD.
Plan national pour la science ouverte Annonce du 4 juillet 2018 (Lille) par Frédérique Vidal, ministre de l'Enseignement Supérieur, de la Recherche et de l'Innovation. : Accès ouvert et obligatoire pour les publications et les données issues de recherches financées sur projets ; Création d’un CoSo, suite de BSN Trois axes, neuf mesures http://m.enseignementsup-recherche.gouv.fr/cid132529/le-plan-national-pour-la-science-ouverte-les-resultats-de-la-recherche-scientifique-ouverts-a-tous-sans-entrave-sans-delai-sans-paiement.html
Plan national pour la science ouverte Généraliser l’accès ouvert aux publications 1 - Rendre obligatoire la publication en accès ouvert des articles et livres issus de recherches financées par appel d’offres sur fonds publics. 2 - Créer un fond pour la science ouverte. 3 - Soutenir l’archive ouverte nationale HAL et simplifier le dépôt par les chercheurs qui publient en accès ouvert sur d’autres plateformes dans le monde. Structurer et ouvrir les données de la recherche 4 - Rendre obligatoire la diffusion ouverte des données de recherche issues de programmes financés par appels à projets sur fonds publics. 5 - Créer la fonction d’administrateur des données et le réseau associé au sein des établissements. 6 - Créer les conditions et promouvoir l’adoption d’une politique de données ouvertes associées aux articles publiés par les chercheurs. S’inscrire dans une dynamique durable, européenne et internationale 7 - Développer les compétences en matière de science ouverte notamment au sein des écoles doctorales. 8 - Engager les opérateurs de la recherche à se doter d’une politique de science ouverte. 9 - Contribuer activement à la structuration européenne au sein du European Open Science Cloud et par la participation à GO FAIR. ANR et DMP : 2019 et après, la position de l’ANR :
4 Paradigmes -1er paradigme : La science expérimentale, l’observation : Euclide, Archimède, Aristote, Hypocrate, Pythagore… -2ème paradigme : La science théorique : Newton (E. du Châtelet), théorie sur la dilatation des corps… -3ème paradigme : la science computationnelle (50’). Construction de modèles mathématiques/traitements automatisés/simulation de phénomènes complexes. -4ème paradigme : la science des données ; Big-Data, données partagées. Jim Gray (1944-2007) Ext. de Jim Gray (1944-2007)
Les nouvelles pratiques de la science Evolution des pratiques : la science du 21° siècle est plus … Numérique Collaborative Interdisciplinaire Réactive Citoyenne / Vers les citoyens Partagée Accroissement de la production scientifique / Du nombre de chercheurs Open Science eScience Science 2,0 Open Research CF Anf paris 2017 F André vidéo
Big data, il est question De volumes : ex sciences sociales vs astronomie vs médecine vs… D’accessibilité des données : diffusion, confidentialité… Des données partagées => « FAIR principles » « Long tail of Data »
Cycle de vie des données Le cycle de vie des données de recherche (Research data lifecycle) décrit le processus d'utilisation des données de leur création à la publication et à leur réutilisation ultérieure. Plusieurs modes de représentation, des constantes : -Création ou collecte des données (creating data) -Traitement des données (processing data) -Analyse des données (analysing data) -Conservation des données (preserving data) -Accès aux données (giving access to data / data discovery) -Réutilisation des données (reusing data) … Que l’on retrouve dans les principes FAIR (Faciles à trouver, Accessibles, Interopérables, ré-utilisables) … Et une idée force : description du processus d’utilisation des données depuis leur création jusqu’à la publication des données et leur réutilisation ultérieure. -> Retrouver, réutiliser, citer les données… Concevoir, planifier et financer Stocker, sauvegarder et conserver les données Actualiser
FAIR FAIR : Seulement un slogan ? Un principe et un ensemble de règles de bonnes pratiques qui permettent un usage raisonné, une bonne réutilisation, une exploitation des données Un objectif vers lequel tendre Les données doivent être : Findable/Facile à trouver, par l’utilisation d’identifiant global unique et pérenne, des métadonnées riches et le signalement dans un catalogue Accessibles, grâce aux identifiants, à des protocoles de communication ouverts Interopérables : par l’application de standards pour les formats de représentation des données et métadonnées, l’utilisation de vocabulaires et ontologies Re-usable/Réutilisables : grâce à une description riche, accompagnée si nécessaire d’informations sur la provenance, l’utilisation de standards et de licences Actualiser Ajout derniere def
FAIR To be Findable: F1. (meta)data are assigned a globally unique and eternally persistent identifier. F2. data are described with rich metadata. F3. (meta)data are registered or indexed in a searchable resource. F4. metadata specify the data identifier. To be Accessible: A1 (meta)data are retrievable by their identifier using a standardized communications protocol. A1.1 the protocol is open, free, and universally implementable. A1.2 the protocol allows for an authentication and authorization procedure, where necessary. A2 metadata are accessible, even when the data are no longer available. To be Interoperable: I1. (meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation. I2. (meta)data use vocabularies that follow FAIR principles. I3. (meta)data include qualified references to other (meta)data. To be Re-usable: R1. meta(data) have a plurality of accurate and relevant attributes. R1.1. (meta)data are released with a clear and accessible data usage license. R1.2. (meta)data are associated with their provenance. R1.3. (meta)data meet domain-relevant community standards. https://www.force11.org/group/fairgroup/fairprinciples Force : Futur of research communication and e-scolarschip créé en 2011
FAIR “Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud » ; Barend Mons, Cameron Neylon, Jan Velterop, Michel Dumontier, Luiz Olavo Bonino da Silva Santos, Mark D. Wilkinson. Information Services & Use 37 (2017) 49–56 49 ; DOI 10.3233/ISU-170824 IOS Press
Culture du partage des données Mes données, les tiennes … et moi ! Des pratiques professionnelles Des initiatives : Knowledge Exchange, LIBER, DCC, RDA, RDA France Des pratiques de communautés : astrophysique, génomique Des politiques d’organismes : INRA, IRSTEA Des politiques d’infrastructures Des politiques de financeurs : H2020, ANR
L’Open Science à l’échelle européenne, un exemple L’appel d’Amsterdam 2016 : Quitter une situation de blocage Changer les processus d’évaluation Modifier les règles de PI Faciliter le TDM Changer les modèles économiques de diffusion de la science Promouvoir les politiques de science ouverte Adopter et adapter les principes de libre accès Stimuler les pratiques de recherche et d’innovation basée sur les données Développer des infrastructures de recherche Principes de partage Principes de mutualisation Impliquer les acteurs de la recherche Les chercheurs, les personnels d’accompagnement Former, encore et toujours « Amsterdam call for action on open science »
RDA Research Data alliance : Création 2013 Australian Gouv + CE + NSF + NIST (Usa) 6000 membres / 120 Pays Plus de 80 groupes de travail Bottom Up sur les aspects de partage de données scientifiques & technologiques http://rd-alliance.org RDA France : lancement 5/12/2018
Portail OPIDoR https://opidor.fr Portail d’accès à des outils et services qui facilitent la gestion et la valorisation des données de la recherche Service mis en place et hébergé par l’Inist - CNRS Mis à disposition de la communauté de l’Enseignement Supérieur et de la Recherche Evolutif Ouverture octobre 2017 https://opidor.fr Actualiser
Portail OPIDoR Actualiser
Portail OPIDoR Planifier : DMP OPIDoR accompagne les chercheurs et leurs partenaires dans l’élaboration d’un plan de gestion de données, élément clé d’une bonne gestion. Repérer : Cat OPIDoR un catalogue permettant d’identifier les services dédiés aux données de la recherche. Identifier : Un service d’attribution d’identifiants pérennes DOI (Digital Object Identifier) aux objets issus de la recherche est proposé par l’Inist-CNRS, membre du consortium Datacite 3 services D’autres à suivre à mesure de leur ouverture Actualiser
DMP OPIDoR DMP pour une Optimisation du Partage et de l’Interopérabilité des Données de la Recherche DMP Un document évolutif décrivant la collecte, le traitement, la documentation, le stockage, l’archivage et le partage des données pendant et après un projet de recherche Un élément clé à mettre en oeuvre dès le début d’un projet de recherche Outil collaboratif d’aide à la rédaction en ligne de DMP Interface utilisateur Création, partage et export de DMP Interface administrateur (accès restreint) Ajout de modèles et de recommandations de DMP, d’exemples ou de réponses par défaut
DMP OPIDoR L’outil - est à la disposition de la communauté de l’ESR (ouverture 2016). - est hébergé et géré par l’Inist-CNRS. - est basé sur le code source DMP Roadmap [partenariat DCC (UK) + UC3 (USA) + Inist] - est adapté à la communauté scientifique française (modèles) -Intuitif et collaboratif qui permet aux chercheurs et à ses partenaires d’anticiper la gestion des données produites et/ou réutilisées et de rédiger facilement un DMP. -Pédagogique, il permet aux services d’accompagnement à la gestion des données de la recherche de guider les chercheurs par l’apport de conseils et d’exemples. -Personnalisable, il participe à la mise en oeuvre des politiques de données des institutions ou communautés disciplinaires. Actualiser Ajout derniere def
DMP OPIDoR > Autour de cet outil, l'équipe Valorisation des données de la recherche propose un accompagnement personnalisé pour : --l'élaboration de modèles de plans de gestion et la rédaction de plans de gestion ; --l’application des principes FAIR aux métadonnées et données ; --l’aide au dépôt des données dans des entrepôts. > Des modèles de DMPs adaptés peuvent être ajoutés (interface administrateur) Actualiser Ajout derniere def
DMP OPIDoR https://dmp.opidor.fr/ Les bonnes raisons d’utiliser DMP OPIDoR : -Libre et ouvert à la communauté ESR -Appui pour répondre aux exigences de H2020 & ANR -Serveur localisé en France -Sécurité, intégrité et confidentialité des DMP garanties -Adaptation aux besoins de la communauté scientifique française -Outil open source développé par une communauté internationale -Evolutif https://opidor-preprod.inist.fr/plans narberd159! https://dmp.opidor.fr/
DMP DMP : outil scientifique de bonne pratique, outil d’aide au pilotage de projet, d’anticipation DMP : un workflow de compétences Chercheur : processus de production et domaine scientifique IST : métadonnées, entrepôts, archivage Informatique : sécurité des données Juridique : PI des données Ingénieur-projet : agreement, éligibilité des coûts *Extrait de : « Le data management plan : une initiative à l’épreuve du réel ; Séminaire « Données scientifiques » : Outils et services pour la gestion et l’ouverture des données scientifiques : retours d’expérience ; BSN10 et EPRIST, 16 février 2017. Nathalie REYMONET, Université Paris Diderot, Direction d’appui à la recherche, en collaboration avec Magalie MOYSAN, Bureau des Archives de Paris Diderot et Aurore CARTIER, Université Paris Descartes, SCD »
DMP
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR
DMP OPIDoR Des questions à propos de DMP OPIDoR ? Vous pouvez contacter l’équipe projet à : info-opidor@inist.fr
Cat OPIDoR
Cat OPIDoR Catalogue de services dédiés aux données de la recherche Cartographie des services français pour accompagner la communauté scientifique dans les processus de production, de gestion et de valorisation des données de recherche Collaboratif : Wiki sémantique (Mediawiki) 168 services référencés, 193 structures d’appartenance (20/09/18) Intimement lié à DMP – OPIDoR : aide précieuse pour trouver des réponses aux questions posées lors de la rédaction d’un DMP (entrepôt, métadonnées, archivage, etc…) A l’initiative et piloté par BSN10 en partenariat avec l’Unistra Ouverture septembre 2017 : https://cat.opidor.fr Actualiser les services et les structures
Cat OPIDoR Un outil collaboratif, ouvert à tous, alimenté et actualisé par ses utilisateurs
Cat OPIDoR Moteur de recherche Type de service Phase du cycle de vie A actualiser ? : copies d’écran / service Annuaire de données Discipline scientifique Menu https://cat.opidor.fr
Cat OPIDoR Actualiser ?
Cat OPIDoR Ressource à Aix ? MMSH ?
Cat OPIDoR Intro à doranum
Cat OPIDoR Des questions à propos de Cat OPIDoR ? Vous pouvez contacter l’équipe projet à : infocatopidor@inist.fr
Service d’attribution de DOI
Service d’attribution de DOI Datacite : consortium international à but non lucratif créé à Londres en 2009, centré sur la valorisation des données de la recherche. L’Inist est membre du consortium et agence d’attribution de DOI pour la France. DOI : Permettent une identification pérenne des produits de la recherche scientifique Facilitent la découverte des jeux de données Participent à promouvoir la Science Ouverte (Open Science) Aident à rendre les données FAIR (Findable, Accessible, Interoperable, Re-usable) Inist-Cnrs comme agence d’attribution : Relation contractuelle entre l’Inist-Cnrs et le centre de données Coûts : 180 € ht / an (+ coût /DOI si non ESR) Attribution de DOI composée de deux parties : préfixe attribué par l’agence d’attribution (Inist) suffixe attribué par le centre de données / organisme de recherche 180 ht + illimité si public vs 500 premiers gratuits si privé
Service d’attribution de DOI Quelques chiffres : 75 centres de données et organismes de recherche 24 000 DOI attribués en 2017 43 000 DOI attribués de 2013 à 2017 (Datacite : 148 millions d’objets)
Service d’attribution de DOI Evolutions bientôt accessibles depuis le portail OPIDoR (section service d’attribution de DOI) : -Mise à disposition de la communauté d’un service en ligne pour les opérations en nombre sur les DOI en particulier -création de DOI, -mise à jour des métadonnées, -vérification et mise à jour des URL. Mise en production octobre 2018 : https://doidatacite.inist.fr/doidatacite/EzDoiMenu Mise à jour ?
DOI
DOI
Service d’attribution de DOI Une équipe dédiée à l’Inist-CNRS se tient à votre disposition pour vous conseiller au plus près de vos recherches dans l’attribution de DOI à vos données Des questions à propos du service, vous pouvez contacter l’équipe projet à : datasets@inist.fr
Et l’avenir ? Entrepôts Etat des lieux de la question : Solutions actuelles : Dryad, Zenodo, Eudat Offre open source : Dataverse, Ordar, Fedora… Besoins ? Communautés spécialisées (alternative aux entrepôts généralistes) Organismes souhaitant se doter d’un entrepôt institutionnel (infrastructure, personnel / expertise) Projets de recherche multidisciplinaires (transitoire) Hébergement national plutôt qu’à l’étranger Groupe de travail analyse des possibilités techniques des solutions (aspects documentaires, aspects informatiques) des usages actuels Hypothèses (Dataverse, Ordar, Fedora) A terme : Offre diversifiée
DoRANum https://doranum.fr/
DoRANum DoRANum pour « Données de la Recherche : Apprentissage Numérique à la gestion et au partage » Offre de ressources de formation et d’auto-formation sur la gestion et le partage des données de la recherche Ressources produites dans le cadre du programme et ressources externes Proposition de plusieurs parcours et modalités d’apprentissage Objectif : mettre en place un dispositif de formation à distance d’accès coordonné, intégrant différentes ressources d’auto-formation sur la thématique de la gestion et du partage des données de la recherche. Elle proposent plusieurs parcours et modes d’apprentissage. Pourquoi ? Répondre aux attentes et usages des publics visés : chercheurs, enseignants-chercheurs, doctorants et professionnels de l’information des établissements d’enseignement supérieur et de recherche.
DoRANum
DoRANum Publics : - Enseignants-chercheurs - Chercheurs - Professionnels de l'IST - Doctorants - Informaticiens
DoRANum Thèmes (enjeux bénéfices, juridique, plan de gestion …) « En bref » Niveau : initiation aux DR, sensibilisation Public : IST, chercheurs Contenu : « fiche synthétique », « minute (vidéo très courte) », « le quiz » « L’essentiel » Niveau : avancé+ Contenu : « modules », « vidéos », « tutoriels » « Pour aller plus loin » Niveau : avancé++ Public : IST Contenu : « Modules détaillés », « conférences », « cours en ligne », « REX », « Vidéos », Glossaire, FAQ, outils et services, bibliographie/webographie
Exemple : Enjeux et bénéfices
Exemple : Enjeux et bénéfices
Exemple : Enjeux et bénéfices
Exemple : Rédiger un DMP
Exemple : Décrire ses données
Exemple : Bien nommer ses fichiers Stockage et archivage
Exemple : Comprendre l’intérêt des métadonnées
Exemple : Où et comment déposer ses données Fiche synthétique
Exemple : Publier un data paper
Moteur de recherche
https://twitter.com/DoRANum_ Twitter https://twitter.com/DoRANum_
Chaîne Youtube https://www.youtube.com/channel/UCiQKWx7D5wPJr4TG2zN7BJA
Références https://www.force11.org/group/fairgroup/fairprinciples https://www.go-fair.org/fair-principles/ The FAIR Guiding Principles for scientific data management and stewardship https://www.nature.com/articles/sdata201618 Livre blanc — Une Science ouverte dans une République numérique : http://books.openedition.org/oep/1548 CCSD, Comment diffuser mes données de recherche ? : https://www.ccsd.cnrs.fr/2016/11/comment-diffuser-mes-donnees-de-recherche-1/ Doranum http://doranum.fr/ European Commission / Research and innovation / Participant portal H2020 Online Manual http://ec.europa.eu/research/participants/docs/h2020-funding-guide/cross-cutting-issues/open-access-dissemination_en.htm Actualiser Ajout derniere def
Merci de votre attention OPIDoR : - contact-donneesrecherche@inist.fr - Pour une information par service sur le portail OPIDoR, grâce aux formulaires de contact - Bernard Sampité bernard.sampite@inist.fr DoRANum : - Paolo Laï paolo.lai@inist.fr - Yvette Lafosse yvette.lafosse@inist.fr