Michael IT Engineer GBIF France Buenos Aires (Argentina) 28 September 2011 Formation sur la publication des données de biodiversité.

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

La Gestion de la Configuration
Échanger connaissances et techniques sur les routes et le transport routier 1 The PIARC Website.
Cours MIAGE « Urbanisation des Systèmes dInformation » Henry Boccon-Gibod 1 Urbanisation de Système d'Information L'approche Togaf © 2008 The Open Group.
Documentation numérique sur l’Internet
Rappel sur les bases de données et le vocabulaire
Introduction to Information Systems
Online Resources from Oxford University Press Ressources en Ligne DOxford University Press.
Février-Avril 2006 Licence Pro BDAN 1 4. Partager les métadonnées 2 méthodes pour partager: Le serveur Z39.50 Le serveur.
Chap 4 Les bases de données et le modèle relationnel
Outils et ressources pour évaluer et améliorer laptitude des données à être utilisées Basé sur la présentation de Nicolas Noé – pour.
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
Le Centre sur la biodiversité
Module DataLift MagicCSV
Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.
Jour 2 : La mobilisation des données sur la biodiversité.
Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.
Jour 3 : La numérisation des données sur la biodiversité.
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Le cœur du projet : objectifs Lélaboration dune base de corpus (principalement oraux) regroupant des données de langues de différentes natures –Une approche.
GISIN Tutorials 16 Nov 2010NAISN-GISIN Training Concepts du Modèle de Données GISIN Activer l´Échange de Données des Espèces Envahissantes Catherine Jarnevich,
Site du Réseau GISIN Activer l´Échange de Données des Espèces Envahissantes Jim Graham, Annie Simpson, Catherine Jarnevich, Greg Newman.
Université M’Hamed Bougara de Boumerdes
JDBC L'API JDBC est utilisée pour utilisée pour intéragir avec une base de données.
Design Patterns en programmation par objets. Plan  Design patterns –De quoi s’agit-il? –Pourquoi faut-il les utiliser?  Design patterns essentiels 
Comment enregistrer des jeux de données dans le GBIF Michael Akbaraly IT engineer GBIF France Buenos Aires (Argentine) 28 Septembre.
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment publier des métadonnées.
1 Spécifications RIMES Workshop Octobre 2005
GB18 training sessions, Buenos Aires, Argentine Outils et ressources pour évaluer et améliorer l’aptitude des données à être utilisées Nicolas Noé
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment le DwC-A a changé.
Anne Sophie Archambeau GBIF France Buenos Aires (Argentina) 28 September 2011 Training course on biodiversity data publishing and.
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Example Pratique de Planification.
Ressources Electroniques d’Oxford University Press.
Recherche biomédicale, niveaux de soins et développement Etude comparative précisant les différents champs de responsabilité C. BERT.
Ressources Electroniques d’Oxford University Press.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
SYSTEMES d’INFORMATION séance 1 : Introduction et définitions
Annual Best Practices Sessions / Ateliers annuels sur les pratiques exemplaires PERFORMANCE MONITORING, REPORTING AND EVALUATION: WHAT’S THE POINT OF.
La notion de « package » pour un cours en ligne Illustration avec la spécification Content Packaging (IMS-CP) Université Bordeaux 3 Cours MASTER 2 MULTIMEDIA.
Annual Best Practices Sessions / Ateliers annuels sur les pratiques exemplaires PERFORMANCE MONITORING, REPORTING AND EVALUATION: WHAT’S THE POINT OF.
Cours sur le DOI COULET Alban GREMONT Baptiste GIDO2A Le 13/12/2007.
Presenter ( ) Role Organization Buenos Aires (Argentina) 28 September 2011 Training course on biodiversity data publishing and fitness-for-use in the.
Principes et définitions
06/04/06 LES BASES DE DONNEES INTRODUCTION CogniTIC – Bruxelles Formation - Cepegra.
et Point nodal GBIF France
Publier ses métadonnées dans ECOSCOPE
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
GBIF : Global Biodiversity Information Facility Formation GBIF France dans le cadre d'ECOSCOPE dans le cadre - Paris, 15 – 16 septembre 2015 Marie-Elise.
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Genèse de BasExp Patrice Pruvost MNHN, 28 janvier 2015 expeditions.mnhn.fr.
Formation GBIF France – Ecoscope, 16/09/2015 Data paper GBIF France
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Stratégies et Plans d’Action.
KE EMu, le chef de file des logiciels de gérance de collections.
OAI-PMH & LOM OAI Repository interoperability using LOM metadata format Interopérabilité des bases de ressources utilisant OAI-PMH et LOM Steve Giraud.
1 Master Data Management au SANDRE. GPA 17/10/ Une philosophie de diffusion des référentiels 3 grands blocs dans les systèmes d’information environnementaux:
GBIF NODES Committee Meeting Copenhague, Danemark 4 octobre 2009 L’outil de publication intégrée du GBIF (‘GBIF Integrated Publishing Toolkit’ ) Alberto.
SCOR DATACAP Project Présentation club utilisateur 03/02/
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 Extensions de l’IPT Alberto GONZÁLEZ-TALAVÁN Responsable de Programme pour les Formations.
1 Master Data Management au SANDRE. ADD 27/11/ Une philosophie de diffusion des référentiels 3 grands blocs dans les systèmes d’information environnementaux:
Animal School: RaisingSmallSouls.com Carol Ann Tomlinson – Critical.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 IPT: Interface utilisateur et outils de contrôle de la qualité des données Alberto GONZÁLEZ-TALAVÁN.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
GB22 TRAINING EVENT FOR NODES – 4 OCTOBER 2015 Séance 02: Le paysage de la publication de données en 2015 Laura Russell.
Le réseau GBIF et le point nodal GBIF France
Twitter Formation sur la qualité, la publication et l’utilisation de données sur la biodiversité Université Gamal Abdel Nasser.
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées , édition 2011 Comment le DwC-A a changé.
Transcription de la présentation:

Michael IT Engineer GBIF France Buenos Aires (Argentina) 28 September 2011 Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Introduction aux nouvelles méthodes de publication du GBIF

Processus de publication des données

Terminologie Fournisseur de données (Data Publisher, Provider) Jeu de données, Ressource (Data Resource, data set) Type de ressource (Metadonnées, Occurrences, Taxons) Enregistrements (Data record) Champs, concept, colonne (Data record element, term, field, column, property, attribute, concept (e.g., BasisOfRecord, scientificName) Valeurs ( Data value ) Standards, Vocabulaires

Fournisseurs de données Institutions avec plusieurs départements, chacun ayant plusieurs ressources. Institutions, groupes, ou individus ayant plusieurs ressources Institutions or individus ayant une seule ressource

Types de ressources Données primaires (Specimens & Observations, Données écologiques) La donnée source est l’Occurrence de l’organisme Catalogues taxonomiques et Checklists. La donnée source est le Taxon Métadonnées – décrivant les jeux de données d’Occurrences et de Taxons.

Enregistrements Ressource de type Taxon Ressource de type Occurrence

Champs Taxon resource type Occurrence resource type

Valeurs Taxon resource type Occurrence resource type

Standards d’échange Données primaires Données taxonomiques Darwin Core 172 concepts Ratifié en 2009 Fichiers texte Extensible Métadonnées Ecological Metadata Language (EML) Description riche des jeux de données GBIF Profile

Processus de publication des données

L’exemple de Tapir TAPIR permet la récolte de 200 enregistrements par requête Pour un jeu de données de enregistrements il faut: échanges de données / 500MB transfert de données - 9 heures de processus - Seulement 32MB seront utiles au réseau GBIF - Qui peuvent être compressés en une archive de 3MB

Processus de publication des données

Pour un jeu de données de enregistrements: 1 seul transfert de données / 3MB de données tranférées au total Processus de quelques secondes L’exemple DarwinCore-Archive Darwin Core Archive

L’exemple DarwinCore-Archive Darwin Core Archive Comparé à Tapir/DiGIR/BioCASE: 1300 transferts de données / 500MB de données tranférées au total Processus de 9 heures Pour un jeu de données de enregistrements: 1 seul transfert de données / 3MB de données tranférées au total Processus de quelques secondes

Format simple (Fichiers texte) Stockage efficace (compressé) Récolte efficace (un seul fichier) Simple d’accès (pas besoin de logiciel spécifique) Extensible Darwin Core Archive: Avantages Format preféré pour la publication des données sur le réseau GBIF

Exploration des données

Le registre GBIF

Le portail GBIF

GBIF Online Resource Centre ( Documentation sur la publication des données

IPT v2 User Manual providertoolkit/wiki/IPT2ManualNotes Publishing Using Dropbox Réferences

Presenter ( ) Role Organization Buenos Aires (Argentina) 28 September 2011 Training course on biodiversity data publishing and fitness-for-use in the GBIF Network, 2011 edition Introduction to the new ways of data publishing