Portail Data Inra Formation sur la valorisation des données – Pôle Digitalist Esther Dzalé Yeumo 13/05/2017
Agenda Description du service Data Inra Dataverse en bref Exploitation du portail et rôle de l’IST Échanges
Description du service Data Inra Partage des données - Nantes – 03/03/2017
Description du service Data Inra 1/2 Objectifs Favoriser la lisibilité et la visibilité des ressources produites par l’Inra. Référencer les données scientifiques de l’INRA dans un annuaire. Fournir un accès pérenne aux données partagées au sein du portail. Fonctionnalités principales Identifier et décrire des données, et éventuellement de déposer les fichiers associés Définir les conditions d’accès (restreint ou ouvert) aux fichiers de données Rechercher des données et de télécharger éventuellement les fichiers associés Explorer des données des données géoréférencées Générer des data papers à partir d’un template générique Périmètre du service Concerne les données scientifiques, dont un des contributeurs est affilié à l’Inra, et qui ont vocation à être publiées et citées. L’accès à ces données peut être ouvert à tous ou restreint. Utilisateurs Création de datasets : toute personne ou système d’information (base de données, système de fichiers, site Web, application…) Inra qui souhaite publier des données scientifiques. Accès aux datasets publiés : toute personne ou système d’information Accès aux datasets non publiés et aux fichiers de données à accès restreint: personne et SI autorisés Fonctions accessibles via une API Gestion des anomalies Collecte des anomalies Correction des anomalies dépendant de l’installation locale Remontée des anomalies indépendantes de l’installation locale à Dataverse et suivi
Description du service Data Inra 2/2 Accès au service Interface Web accessible via le portail (version test du portail : https://data-test.jouy.inra.fr/) ; pour tout retour, merci d'adresser un mail à dataverse.admin@inra.fr Accès via une API (Interface de Programmation Applicative) Conditions d’accès au service La consultation des métadonnées et le téléchargement des fichiers ouverts sont accessibles à tous ; La création d’un jeu de données et le dépôt de fichiers sont accessibles aux personnes et aux systèmes d’information autorisés ; Une demande de répertoire Dataverse dédié peut être faite par tout agent Inra. la demande se fait directement depuis le portail, en contactant l’administrateur du répertoire Dataverse parent dans lequel l’agent souhaite créer le nouveau répertoire. Elle sera soumise à la validation de l’administrateur du répertoire parent concerné ; Chaque répertoire Dataverse doit être administré par un agent Inra (par défaut, la personne indiquée comme contact lors de la demande de création du répertoire). Engagement des utilisateurs du service Le bénéficiaire s’engage à respecter les règles de propriété intellectuelle et le cadre juridique en vigueur, et à documenter la ressource identifiée avec des métadonnées constituées à minima de : titre, auteur(s), date (année) de publication, et publisher. Gestion des anomalies Collecte des anomalies Correction des anomalies dépendant de l’installation locale Remontée des anomalies indépendantes de l’installation locale à Dataverse et suivi
Acteurs et calendrier de mise en œuvre Comité de pilotage DSI, DTN, DISC, DIST Équipe Chef de projet : Esther Dzalé Maîtrise d’œuvre: Ollivier Lévy Scrum master: Denis Gonzalez Product owners: Sylvie Cocaud, Fanny Dedet Développeurs: Michel Bamouni, Fairouz Oubenali (Softeam) Stockage et infrastructure DSI (Sébastien Cat) Principales dates 5 octobre 2016 : début du prototypage 31 juillet 2017: fin du prototypage Septembre 2017: mise en production
Dataverse en bref Partage des données - Nantes – 03/03/2017
Qu’est-ce que Dataverse? Logiciel open source gratuit, créé en 2006 par l’Institute for Quantitative Social Sciences , Harvard Library et Harvard University Information Technology Optimisé pour les formats de données quantitatives (R, Stata, SPSS, tab, Excel, etc.) mais utilisable pour tous formats de fichiers Objectifs le partage; la citation; la préservation; l’analyse; …des données de recherche Gestion des anomalies Collecte des anomalies Correction des anomalies dépendant de l’installation locale Remontée des anomalies indépendantes de l’installation locale à Dataverse et suivi
Pourquoi Dataverse? Conçu spécifiquement pour la gestion et le partage des données scientifiques Une flexibilité dans le choix des métadonnées Possibilité de décentraliser la gestion des données : chaque répertoire de datasets peut être géré par un administrateur différent Prise en compte du processus de publication scientifique : DOI + citations automatiques Gestion des versions Lien provisoire sécurisé pour les reviewers d’un article lié à un dataset non publié Gestion des anomalies Collecte des anomalies Correction des anomalies dépendant de l’installation locale Remontée des anomalies indépendantes de l’installation locale à Dataverse et suivi
Structure d’un Dataverse A Dataverse is a container for research data studies, customized and managed by its owner.
Utilisation de Dataverse : 2 options Installer une instance locale de Dataverse et créer un réseau de Dataverse Créer un répertoire Dataverse dans un réseau existant Le portail Data Inra permet aux scientifiques de l’Inra de créer des Dataverses spécifiques à des projets, des thématiques, etc. sans devoir gérer une installation de Dataverse
Qui d’autre utilise Dataverse?
Exploitation du portail et rôle de l’IST Partage des données - Nantes – 03/03/2017
Organisation des informations dans le portail 3 Dataverses de base correspondant à l’origine des données : omique, expérimental / observation / simulation, enquête / texte. Ces 3 dataverses de base seront gérés et administrés par les administrateurs du portail Par défaut, toute personne connectée avec un login/mot de passe Ldap (sauf pour certaines catégories de peps comme les missionnaires Ulysse) peut déposer des données dans ces 3 Dataverses Conditions pour la création d’un Dataverse sous un des 3 Dataverses de base Correspondre à un projet, une structure, une thématique, ou un SI qu’on veut mettre en avant; ou Nécessiter l’utilisation d’un jeu de métadonnées spécifiques (éventuellement non prévues) dans le portail (on sera quand même attentif à ce que les utilisateurs ne s’éloignent pas des standards) Le demandeur administre le nouveau Dataverse et en gère le contenu Encourager fortement la fourniture d’un PGD lors de la création d’un nouveau Dataverse Gestion des anomalies Collecte des anomalies Correction des anomalies dépendant de l’installation locale Remontée des anomalies indépendantes de l’installation locale à Dataverse et suivi
Quel rôle de l’IST dans la phase d’exploitation? Service DOI Toutes les demandes individuelles se feront via le portail Data Inra fin de la déclaration manuelle des DOI auprès de DataCite Gestion des demandes d’accès à l’API DOI : vérifier que les prérequis sont remplis, attribuer un login/mot de passe, déterminer le Dataverse qui va accueillir les métadonnées Exploitation de la plateforme L’administration fonctionnelle du portail sera assurée par le pôle Digitalist Création de Dataverses en dessous des 3 sous Dataverses racine Administration des Dataverses racine : gestion des accès, qualité des métadonnées, ajustement des configurations via l’interface Web d’administration, etc. Prise en compte de nouvelles métadonnées Production des notes de mise à jour et des communications aux Utilisateurs Gestion des anomalies Support aux utilisateurs Utilisation de l’API et du portail Data Inra: support premier niveau Formation à l’utilisation du portail Évolutions fonctionnelles Rôle de product owner Gestion des anomalies Collecte des anomalies Correction des anomalies dépendant de l’installation locale Remontée des anomalies indépendantes de l’installation locale à Dataverse et suivi
Échanges Séminaire données du centre Inra de Nancy - Pôle Digitalist – 12/12/2016