Services pour identifier et valoriser : enregistrement et exposition des métadonnées via DataCite Mohamed S. YAHIA Services pour identifier et valoriser.

Slides:



Advertisements
Présentations similaires
Diffusion des résultats de la recherche européenne
Advertisements

Mai Le projet européen DRIVER Une infrastructure pour la recherche européenne
Documentation numérique sur l’Internet
Projet BICTEL/e Présentation au Conseil Académique Du 16 juin 2003.
OpenAIRE et OpenAIREplus
Recommandations et procédure d’attribution de DOI
Microsoft et les Standards
Déposer ses publications dans HAL pour valoriser la recherche au CHEC. Enjeux, méthodologies, services.
Enjeux, méthodologies, services.
Drowning in Big Data days? 25/11/2014Open Scientific Data Day at Orsay.
Information Scientifique et Technique à l’IN2P3 LAL Orsay 25 janvier 2006 Dominique Jarroux-Déclais Responsable IST IN2P3.
FORUM REGIONAL DE NORMALISATION DE L'UIT POUR L'AFRIQUE (Dakar, Sénégal, mars 2015) Outils et méthodes pour tester la qualité de services (QoS) de.
La valorisation de l’information scientifique Colloque IFAN, 27 novembre 2007.
Learning Management System Système de Gestion d’apprentissage Ahmed ALMAKARI- Université Ibn Zohr-Agadir- Maroc.
Présentation site: CNLAPS - Assemblée Générale du 23/05/2014.
Outils bibliographiques Philippe Carrère, UAG 2013.
RÉNOVATION BTS Comptabilité et Gestion 2015 Atelier situations professionnelles & PGI Cas Jupiter Média Chantal Bricard Jean-Marie Duplan.
Espace collaboratif du CODEV Blog, WIKI, Forum: c’est quoi?  Blog - Publication périodique et régulière d’articles La vocation d’un Blog est d'être un.
1 Comment préparer un plan Document No. 2.1 Gestion des activités conjointes de lutte contre la tuberculose et le VIH: cours de formation pour responsables.
JI Les systèmes d’autorisation et d’authentification dans AMI Fabian Lambert.
Baccalauréat Professionnel Accueil – Relation clients et usagers L’exploitation du référentiel Objectif Exploiter la richesse du référentiel et du GAP.
 Pour assurer l'égalité des chances, l'Education Nationale doit dispenser à chaque futur citoyen la formation aux utilisations des Technologies de l‘Information.
Question de gestion 13 : Le document peut-il être vecteur de coopération ? Le document : - Dématérialisation des documents - Partage, mutualisation, sécurisation.
Création d’un site WEB 1 – Un site WEB c’est quoi ? 2 – Questions à se poser avant la construction d’un site WEB 3 – Principes de fonctionnement d’un site.
Cours de Mme Dominique Meganck - ICC - IFC MICROSOFT ACCESS Un système de gestion de bases de données...
Roger Boll, avril 2006 Equipe de Biologie des Populations en Interaction Institut National de la Recherche Agronomique UMR 1112 : Réponses des Organismes.
: le tutoriel d’autoformation à la recherche documentaire en Santé Je gère ma bibliographie  Je collecte les informations bibliographiques
Les lundis numériques de l’INHA Réseaux sociaux académiques et nouvelles métriques de la recherche 14/03/ A. Bouchard (URFIST de Paris)
[ 1/14 ]Namur, 22 mai 2007 Présentation du projet V3 (Versatile Vocational training Vehicle) Présentation du projet Versatile Vocational Training Vehicle.
Vos cours LouvainX sur edX C’est parti !. Un cours MOOC « a MOOC is a course offered and available to any and all interested third parties at no cost.
Mediator 9 - Un outil de développement multimédia 3AC Techno/Informatique.
Gabriel Dumouchel, doctorant Université de Montréal Atelier Jouvence 2011 Atelier Jouvence 2011.
SFA - 44 rue Pasquier PARIS - ORGANISER DES MANIFESTATIONS SCIENTIFIQUES A LA SFA En amont consulter l’annexe 2 du Règlement intérieur.
Le commerce de bois, flux nationaux et internationaux FIG St Dié, 08/10/2010 Jean-Marc Roda – Affiliation principale : CIRAD Autres affiliations.
SCOPUS : Sauvegarder et créer des alertes Qu’est-ce que Scopus ?  Base de données bibliographiques multidisciplinaire éditée par Elsevier.  Répertorie.
Efficacité Commerciale Grille de compétences cible.
Séminaire de clôture Jumelage Emploi Appui au renforcement du Système de Management de la Qualité (SMQ) BILAN DU PROJET Béhija Mensi Ce projet est financé.
Développement d’application avec base de données Semaine 8 : WPF avec Entité Framework Automne 2015.
INSTITUT UNIVERSITAIRE DE TECHNOLOGIE -B.P.2235 – Avenue Aristide Briand – Montluçon Cedex Tél – Fax –
CATÉGORIE AU CHOIX (1 maximum)  Meilleur Epicier fin Commerce de détail VOTRE SOCIÉTÉ Raison sociale : Secteur d’activité : CA: Effectif : PERSONNE EN.
Un outil de communication : la liste de diffusion Mis à jour en juillet 2008 Anne Maincent-Bourdalé CRDoc IUT Paul Sabatier.
Comment faire un site Web ITC-ILO, 19 Avril 2010.
GED: Gestion Electronique des Documents Réunion des correspondants communication IN2P3 24 novembre 2011 François Vazeille (LPC Clermont-Ferrand)  Point.
Migration Plan adressage EPLE Migration Plan d'adressage EPLE.
Introduction à la Sociologie Présentation des séances de Travaux Pratiques UNamur, Année académique
Formation « Administrateur ATRIUM ». 1.Un accompagnement technique par la Région Formation des « administrateurs » Support technique Evolution des fonctions.
Quelle(s) méthodologie(s) pour le suivi des collectifs d’enseignants ? Hussein Sabra et Isabelle Quentin Séminaire avec les collectifs d'enseignants concepteurs.
StratusLab is co-funded by the European Community’s Seventh Framework Programme (Capacities) Grant Agreement INFSO-RI La technologie « cloud » M.
> 1 Pôle INSIDE GIGE mars Un pôle d’innovation regroupant le BRGM et l’Onema Formalisé en 2014, pour répondre aux enjeux du système d’information.
D’un atelier à l’autre…. Les problématiques identifiées et les domaines d’actions proposés lors de l’atelier du 5 novembre 2013 ont permis la construction.
©Armelle Thomas - mars Diigo, le gestionnaire de bookmarks en ligne de nouvelle génération ADBS RA Grenoble Les jeudi de l’Internet pratique - Mars.
EQUIPE PROJET TAO Paris-Saclay 28 novembre 2014 Plateforme I/O CDS de Paris-Saclay
SOLUTION ONLINE DE GESTION POUR LES SPECIALISTES DU TOURISME SUR MESURE
Formation Ouverte et A Distance Bureau des expertises techniques, des projets d'infrastructures et de la sécurité des systèmes d'information Parcours de.
Introduction Utilisation accrue de la technologie sans fil: des inquiétudes sur l’exposition aux radiations électromagnétiques. Montage et mise en œuvre.
Solution proposée, assemblée et testée par le Service Informatique de la Faculté des Lettres et des Sciences Humaines. Université Mohammed V. Rabat. PLATE.
1 ULB – Cellule PRAC-TICE Intervention dans le cours (16 mars 2010) Etude du rapport au savoir des étudiants de l’enseignement supérieur Quel accompagnement.
Perrine Royole-Degieux Com LHC-IN2P3 –23 novembre 2011 à Paris (APC) Perrine Royole-Degieux Com lhc nationale : bilans et nouveautés.
Jean-Guy DIDIER, Réviseur d’entreprises, Expert-Comptable, Membre du Conseil de l’IEC. 1 Institut des Experts-Comptables et des Conseils Fiscaux.
FORMATIONENT/SVT Saint Orens Vendredi 15 novembre 2013.
MEN-DGESCO Bureau des usages et des services numériques/ENT Espaces Numériques de Travail – Panorama 30 novembre 2010 Réunion des IANTE EPS.
Chapitre 9 Gestion des maîtres d'opérations
Equipe Projets Grille Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 28 mai 2004.
Université Ferhat Abbas –Sétif 1 Centre des Systèmes et Réseaux d’Information Et de Communication, de Télé-enseignement et D’Enseignement à Distance Rapport.
Bibliothèque Centrale de l’École Polytechnique PSC X2014 Mai-Juin 2015 Module 2 Comment interroger et exploiter les bases de données (BDD) et moteurs de.
Stratégie vers la communauté de recherche en informatique V. Breton.
Pôle national de compétences FOAD Formation Ouverte et A Distance Formation tuteurs relais SCONET Aide au démarrage des formations académiques 16 juin.
Groupe de veille Couperin le 07/04/11 Projet collaboratif de rétro-numérisation de périodiques scientifiques allemands créé en 1997 avec le soutien de.
09/03/09 - Page 1 Département Office Département des constructions et des technologies de l'information Département de l'instruction publique SIGEF Présentation.
Les données structurées et leur traitement
Transcription de la présentation:

Services pour identifier et valoriser : enregistrement et exposition des métadonnées via DataCite Mohamed S. YAHIA Services pour identifier et valoriser : enregistrement et exposition des métadonnées via DataCite Mohamed S. YAHIA Inist Journée Open Scientific Data Orsay 25/11/2014 Journée Open Scientific Data Orsay 25/11/2014

Gestion des Données de Recherche Vers une science ouverte (e-science et 4 eme paradigme?)  Explosion des données scientifiques numérique (déluge de données ou big data)  Hétérogènes, complexes, dispersées  Préoccupation de la communauté scientifique :  Accès à ces données et leur valorisation  Environs 90 % des données de recherche stockées sur infrastructures locales (disque dur, CD,…)

Vers une science ouverte (e-science et 4 eme paradigme?)  Accès aux publications et aux données scientifiques pour:  Exploiter les résultats de recherche antérieurs  Encourager la collaboration et éviter la duplication des travaux de recherche  Accélérer l’innovation dans la R&D  Favoriser la participation des citoyens et de la société civile  Valider les résultats scientifique

4 Incitations & Recommandations Commission Européenne Programme cadre H2020 recommande d’utiliser un système d’identifiants standard pour les données de recherche * Lancement d’un projet pilote de Libre accès aux DR issues de la recherche financée sur fonds publics dans le cadre du programme H2020 Infrastructures de recherche Mise en place d’IR européennes en faveur du partage des données, DARIAH, OpenAIREplus, Eudat Editeurs - Encouragent les auteurs à déposer les jeux de données sous forme de «supplementary materials» ou dans des entrepôts de données (cf re3data, Databib) - Nouveaux types de revues comme les data journals *Guidelines on Data management in Horizon 2020

Données de Recherche ? Enregistrements factuels - Chiffres - Textes - Images - Sons, Vidéos Captées ou générées par : - Détecteurs et capteurs ( sous-mer, marins, terrestres, atmosphériques, spatiaux…) - Instruments laboratoires (diagrammes de diffraction, spectres, séquençage génomes..) - Résultats des simulations (grands centres de calcul,…) Utilisation : - S ources principales (matières 1 ère ) pour la recherche scientifique - Nécessaires à la validation des résultats de recherche - e-Science Enregistrements factuels - Chiffres - Textes - Images - Sons, Vidéos Captées ou générées par : - Détecteurs et capteurs ( sous-mer, marins, terrestres, atmosphériques, spatiaux…) - Instruments laboratoires (diagrammes de diffraction, spectres, séquençage génomes..) - Résultats des simulations (grands centres de calcul,…) Utilisation : - S ources principales (matières 1 ère ) pour la recherche scientifique - Nécessaires à la validation des résultats de recherche - e-Science Tip of the iceberg Données de Recherche et le Big Data : A la différence d’autres données et informations dans le champ du big data (données collectées par le biais de : requêtes de moteurs de recherche, réseaux sociaux, téléphonie, cartes bancaires,….) les données de recherches sont conçues, collectées ou crées volontairement. Données de Recherche et le Big Data : A la différence d’autres données et informations dans le champ du big data (données collectées par le biais de : requêtes de moteurs de recherche, réseaux sociaux, téléphonie, cartes bancaires,….) les données de recherches sont conçues, collectées ou crées volontairement.

Valorisation des Données de Recherche Pérennisation Découverte Accessibilité Citabilité Réutilisation Teneur des données et des métadonnées en information Moment de publication Les détails spécifiques relatifs aux problèmes contenants des items individuels ou les dates spécifiques des collectes sont perdus assez rapidement Les détails généraux concernant la collecte des données sont perdus avec le temps Retraites ou conversions de carrière : accès difficile ou impossible au ‘stockage mental ’ Des incidents peuvent détruire données et documentations Mort du chercheur : perte des données restantes Temp s Dégradation normale irréversible de l’information (entropie de l’information) Dégradation normale irréversible de l’information (entropie de l’information)

Teneur en information des données et des métadonnées Les données curées sont déposées dans un entrepôt de données Les données synthétisée permettent une nouvelle publication Publication d’un article utilisant des données Les données sont annotées par de nouveaux utilisateurs Temps Gestion active des données Valorisation des Données de Recherche

Identifier pour valoriser Identifier pour valoriser

Trouver des documents sur le web

Identifiant pérenne - Chaine de caractères - URL - nombres de série - noms - addresses -…. - Personne/Institution - Objet - images - textes - datasets - fichiers - …. Identifiants pérennes Gestion : Association permanente

Types d’identifiants  Identifiants auteurs Idref, DAI, ORCID, ISNI…  Identifiants objets ARK, DOI, HANDLE, ISBN, ISSN….

Système DOI  The system was announced at the Frankfurt Book Fair 1997  Développé et Géré par IDF

The International DOI ® Foundation (IDF)  Création : 1997  BUT : Développer et gérer le système DOI  IDF est partenaire technique du CNRI  Le système DOI est basé sur l’infrastructure du Handle System  Il est déployé par une fédération d’Agences d’Enregistrement  Le système DOI est certifié ISO standard (2012) :  Spécification de syntaxe  Schéma métadonnées extensible  Garantie persistance

Agences Enregistrement de DOIs Airiti, Inc.CrossRef China National Knowledge Infrastructure (CNKI) DataCite EIDR (Entertainment Identifier Registry) ISTIC (The Institute of Scientific and Technical Information of China) JaLC (Japan Link Center) mEDRA (Multilingual European DOI Registration Agency) OP (Publications Office of the European Union)

DataCite des DOIs Pour identifier et valoriser vos données DataCite des DOIs Pour identifier et valoriser vos données

DOIs pour les Données ? Publications  Jeux de Données Autres jeux de Données  Facilite l’accès aux Données de Recherche sur le web  Encourage l’acceptabilité des Données de Recherche comme contributions légitimes et citables aux progrès de la science  Fait partie des bonnes pratiques d’archivage des données, permettant la validation des résultats, le contrôle des données et leur réutilisation future

DataCite  Memorandum of Understanding, Paris, fevrier 2009  Crée officiellement le 1 ier décembre 2009 à Londres  Consortium global porté par des institutions locales  Dédié à l‘amélioration de l‘infrastructure académique autour des jeux de données et autres informations non- textuelles  Destiné à travailler avec des centres de données et des institutions qui maintiennent des données  Fournit les standars, workflows et bonnes pratiques

Infrastructure technique de DataCite l‘Agence d’Enregistrement DataCite : – Supporte l'infrastructure de résolution – Maintient une base de métadonnées consultable et moissonable – Gère les identifiants sur le long terme – Etablit et partage les bonnes pratiques Les Editeurs (centres de données, établissement de recherche, créateur de données) sont responsable de : – Assurance Qualité – Stockage et accéssibilité du contenu – Création des identifiants – Création et mise à jour des métadonnées Centre données Metadata Store (MDS) Serveurs Handle Registre Handle global Système Handle Résolution DOI (ex. via dx.doi.org) Création DOI, Stockage métadonnées

Infrastructure sociale de DataCite  Groupes de travail:  Business Practices  Criteria for Data Centers  Identifier Syntax  Metadata  Services  Special Datasets  Technical Infrastructure

Implications dans des groupes / organismes  European Persistant Identifier Consortium (EPIC)  CODATA/ICSTI Working Group on Data Citation  Datacitation synthesis Group  Research Data Alliance  re3data.org and Databib Projets européens  OpenAIREplus project  ODIN project (ORCID and DataCite Interoperability Network) Implications dans des groupes / organismes  European Persistant Identifier Consortium (EPIC)  CODATA/ICSTI Working Group on Data Citation  Datacitation synthesis Group  Research Data Alliance  re3data.org and Databib Projets européens  OpenAIREplus project  ODIN project (ORCID and DataCite Interoperability Network)

 DataCite Metadata Store (MDS) plateforme de création de DOIs et enregistrement des métadonnées associées  DataCite OAI Provider Exposition des métadonnées de DataCite pour moissonnage en OAI-PMH  DataCite Metadata Search Recherche des métadonnées associées aux jeux de données enregistrées dans DataCite. Résolution de DOIs Services DataCite Résolution directe par navigateurs : ajouter les plug-in Firefox : http ://addons.mozilla.org/fr/firefox/addon/10820 Internet Explorer : ://addons.mozilla.org/fr/firefox/addon/10820http://handle.net/resolver/index.html Résolution directe par navigateurs : ajouter les plug-in Firefox : http ://addons.mozilla.org/fr/firefox/addon/10820 Internet Explorer : ://addons.mozilla.org/fr/firefox/addon/10820http://handle.net/resolver/index.html

Services DataCite  DOI Citation Formatter En collaboration avec CrossRef – Création de différents formats de citation pour les DOIs de DataCite et CrossRef  DataCite Test Environment Plateforme de création provisoire de DOIs et de test de tous les services DataCite  DataCite Statistics Statistiques enregistrement et résolution DOI  Content Negotiation Permet de quérir les métadonnées stockées dans MDS dans divers formats (mime)

Ressources DataCite  DataCite Metadata Schema Champs des métadonnées (obligatoires, recommandées ou optionnelles) à renseignés – Plusieurs exemples sont fournis.  DataCite Business Models Principles  List of repositories of research data

 2014 :  22 membres dans 16 pays  9 membre associés  environs 4 millions de DOIs Membres DataCite  Technische Informationsbibliothek (TIB), Germany  Canada Institute for Scientific and Technical Information (CISTI)  California Digital Library, USA  Purdue University, USA  Office of Scientific and Technical Information (OSTI), USA  The British Library  Technical Information Center of Denmark (DTU)  Library of TU Delft, The Netherlands  ZBMed, Germany  ZBW, Germany  GESIS, Germany  Library of ETH Zürich, Switzerland  Institut de l’Information Scientifique et Technique (INIST-CNRS), France  Swedish National Data Service (SND)  Australian National Data Service (ANDS)  Conferenza dei Rettori delle Università Italiane (CRUI)  Hungarian Academy of Science  National Research Council of Thailand (NRCT)  University of Tartu (UT)  European Organisation for Nuclear Research (CERN)  Japan Link Center (JaLC)  South African Environmental Observation Network (SAEON) Affiliated members:  Microsoft Research  Interuniversity Consortium for Political and Social Research (ICPSR), USA  Institute of Electrical and Electronics Engineers (IEEE), USA  Korea Institute of Science and Technology Information (KISTI)  Beijing Genomics Institute (BGI)  Harvard University Library, USA  World Data System (WDS-ICSU)  Digital Curation Center, UK  Göttingen University – Max-Planck Society (GWDG) 24

INIST agence française d’attribution de DOI Assistance pour l’enregistrement des DOI dans DataCite Fourniture des préfixes DOI Assistance sur l’ API mise à disposition Assistance dans la constitution des fichiers de métadonnées Sensibilisation aux services DataCite Inist

Workflow d’attribution de DOI par la cellule Inist-DataCite Workflow d’attribution de DOI par la cellule Inist-DataCite 26 Création DOI Assistance technique Prospection Promotion Information Communication 1 er contact Echanges réponses aux questions Création compte, attribution préfixe Contrat Information spécifique Métadonnées Reformatage vers xml DataCite Paramétrage API, services DataCite Création fichier métadonnées

27 Informations nécessaires pour créer un DOI Informations nécessaires pour créer un DOI  DOI (format. ) /datacenter.123xy  URL Landing page (page vers laquelle le DOI sera résolu)  Métadonnées en format xml DataCite (au moins les 5 propriétés obligatoires du schéma DataCite) Préfixe Suffixe

11 DataCite Metadata Schema ( (version 3.1)

Exemples propriétés 29 Creator

30 Exemples propriétés Contributor

31 Exemples propriétés ResourceType

32 Exemples propriétés RelatedIdentifier

33 Identifiant de la publication Identifiant du jeu de données Jeu de données Exemple: lien entre un jeu de données et l’article par le DOI Exemple: lien entre un jeu de données et l’article par le DOI The dataset: Storz, D et al. (2009): Planktic foraminiferal flux and faunal composition of sediment trap L1_K276 in the northeastern Atlantic. Is supplement to the article: Storz, David; Schulz, Hartmut; Waniek, Joanna J; Schulz- Bull, Detle Kucera, Michal (2009): Seasonal and interannual variability of the planktic foraminiferal flux in the vicinity of the Azores Current. Deep-Sea Research Part I-Oceanographic Research Papers, 56(1), , The dataset: Storz, D et al. (2009): Planktic foraminiferal flux and faunal composition of sediment trap L1_K276 in the northeastern Atlantic. Is supplement to the article: Storz, David; Schulz, Hartmut; Waniek, Joanna J; Schulz- Bull, Detle Kucera, Michal (2009): Seasonal and interannual variability of the planktic foraminiferal flux in the vicinity of the Azores Current. Deep-Sea Research Part I-Oceanographic Research Papers, 56(1), , Les éléments de citations recommandés par DataCite Creator (PublicationYear): Title. Publisher. Identifier Creator(PublicationYear):Title. Version. Publisher. ResourceType. Identifier Les éléments de citations recommandés par DataCite Creator (PublicationYear): Title. Publisher. Identifier Creator(PublicationYear):Title. Version. Publisher. ResourceType. Identifier

Merci de votre attention Merci de votre attention Questions ?