Gbif@gbif.fr Twitter : @gbiffrance Formation sur la qualité, la publication et l’utilisation de données sur la biodiversité Université Gamal Abdel Nasser.

Slides:



Advertisements
Présentations similaires
Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.
Advertisements

Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.
Comment enregistrer des jeux de données dans le GBIF Michael Akbaraly IT engineer GBIF France Buenos Aires (Argentine) 28 Septembre.
GB18 training sessions, Buenos Aires, Argentine Outils et ressources pour évaluer et améliorer l’aptitude des données à être utilisées Nicolas Noé
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment le DwC-A a changé.
Anne Sophie Archambeau GBIF France Buenos Aires (Argentina) 28 September 2011 Training course on biodiversity data publishing and.
Michael IT Engineer GBIF France Buenos Aires (Argentina) 28 September 2011 Formation sur la publication des données de biodiversité.
Presenter ( ) Role Organization Buenos Aires (Argentina) 28 September 2011 Training course on biodiversity data publishing and fitness-for-use in the.
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
GBIF NODES Committee Meeting Copenhague, Danemark 4 octobre 2009 L’outil de publication intégrée du GBIF (‘GBIF Integrated Publishing Toolkit’ ) Alberto.
Bibliothèque Centrale de l’École Polytechnique Session pratique Recherches documentaires en sciences dures PSC 2011 septembre/octobre 2011 Denis Roura,
FAIRE SA BIBLIOGRAPHIE DE THESE AVEC ZOTERO Traitements de texte pris en compte: Word et LibreOffice.
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
GB22 TRAINING EVENT FOR NODES – 5 OCTOBER 2015 Séance 07: Démonstration de la publication des données d’échantillonnage Danny Vélez.
Les systèmes d'information 1- Une pratique quotidienne 2- Les données 3- Approche conceptuelle 4- Notion de serveur 5- Conception d'un système d'information.
Gestion des PJ Service National d'Enregistrement Dossier Unique.
ESUP-ECM. Copyright 2008 © EsupDay /07/2009 Ce travail est mis à disposition sous une licence Creative Commons Vous êtes libres De reproduire, distribuer.
Microbloguer En classe Par Éric Noël Cette présentation est placée sous licence Creative Common Paternité.
Méthodes d’utilisabilité pour les nuls Alain Désilets National Research Council of Canada.
@rchiveSIC Archive Ouverte en Sciences de l’Information et de la Communication Gabriel.
Les services de canal U dans l'ENT. Copyright 2008 © EsupDay /07/2009 Ce travail est mis à disposition sous une licence Creative Commons Vous êtes.
Fondé en 2001 (1996/2001) Réseau international pour la biodiversité But: Rendre les données scientifiques et les informations relatives à la biodiversité.
1 Case Study 1: UNIX and LINUX Chapter History of unix 10.2 Overview of unix 10.3 Processes in unix 10.4 Memory management in unix 10.5 Input/output.
IP Multicast Text available on
Subject: CMS(Content Management System) Université Alioune DIOP de Bambey UFR Sciences Appliquées et Technologies de l’Information et de la Communication.
Plateforme ODR Toulouse, 12 Juin 2017 GARCIA Benoît INRA, US ODR
INTERNET #1 Qu’est-ce qu’internet ? Qu’est-ce qu’un site internet ?
Téléchargement de fichiers
Présentation de Maxent
GBIF : Global Biodiversity Information Facility
Leçon de Programmation Intermédiaire
Rechercher des articles et des sites web
Mise en place d’un système de partage de fichiers
Le réseau GBIF et le point nodal GBIF France
Plateforme CountrySTAT Aperçu global des métadonnées dans la nouvelle plateforme CountrySTAT FORMATION DES POINTS FOCAUX SUR LE SYSTEME CountrySTAT.
Phishing : Techniques et sensibilisation
Bases de données multimédia
Politique de dépôt et de services dans ProdInra
OBIS/Ocean Teacher Global Academy (OTGA) - (RTC-SN)
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées , édition 2011 Comment le DwC-A a changé.
Dans ma maison il y a… In my house there is…
Installation et Configuration Internet Information Server (IIS 5)
Work: ISA8895 Implementation Section: Interoperability Chapter: B2O
One of the most touristic destination in Great Britain
fonctionnalités iiS iis
Technologies de l’intelligence d’affaires
Création des métadonnées
Session 03: Démonstration pratique: comment préparer et mapper différents types de données Nicolas Noé GB22 Training event for nodes – 4 October 2015.
Fonctionnement de la grille
Démarrage avec iNaturalist
Exercices: Système d’Information
Utiliser des images trouvées sur le web
P&ID SYMBOLS. P&IDs Piping and Instrumentation Diagrams or simply P&IDs are the “schematics” used in the field of instrumentation and control (Automation)
Les protocoles de la couche application Chapitre 7.
Plateforme CountrySTAT Aperçu global des métadonnées dans la nouvelle plateforme CountrySTAT FORMATION DES POINTS FOCAUX SUR LE SYSTEME CountrySTAT.
Qu’est-ce que tu as dans ta trousse?
Bienvenue Au monde des Pronoms.
Information available in a capture history
Littérature scientifique
Révision de vocabulaire
TD Multimédia : cours 1 Année Groupe C TD multimédia.
Un cloud de production et de stockage
1-1 Introduction to ArcGIS Introductions Who are you? Any GIS background? What do you want to get out of the class?
Lundi 3 décembre Français I
C021TV-I1-S4.
Le Passé Composé (Perfect Tense)
Les couleurs.
Les promesses des plateformes d’échanges de données
ScienceDirect Guide d’utilisation de la base de données : ScienceDirect Pr R. EL OUAHBI.
Implémentation de FTP Rappel sur FTP Relation entre un site Web et FTP
Transcription de la présentation:

gbif@gbif.fr Twitter : @gbiffrance Formation sur la qualité, la publication et l’utilisation de données sur la biodiversité Université Gamal Abdel Nasser (UGAN), Conakry 15 – 18 novembre 2016 Comment publier des données d’occurrence et enregistrer des jeux de données au GBIF gbif@gbif.fr Twitter : @gbiffrance

Publication “La publication a pour but de rendre un jeu de données de biodiversité accessible publiquement et découvrables, dans un format standardisé via un point d’accès, typiquement un adresse (URL).”

Publication Publication Show how a dataset appears at GBIF Also show numbers of what’s already published at GBIF

Type de jeu de donnée: occurrences Texte numérisé ou données multimédia détaillant des faits sur l’occurrence d’un organisme: le quoi, où, quand, comment et par qui de l’occurrence et de son enregistrement. Say we describe an individual Say it’s the most common type

Type de jeu de données: checklist / liste d’espèces “Un catalogue, ou une liste de taxons.” Éventuellement aussi: noms vernaculaires, citations, ... Classent généralement l’information par taxonomie, géographie et statut ou en combinant les trois. Here, the entity we’re describing is a taxonomic concept, not an individual Example: a dataset that catalogues the Red Listed molluscs of Seychelles has distinct elements of taxonomy (the phylum Mollusca), geography (the island nation of Seychelles) and theme (species deemed imperiled by IUCN experts)

Type de jeu de données: données d’échantillonnage Parfois, les ensembles de données fournissent de plus amples détails, mettant en évidence non seulement l’enregistrement d’une espèce à un endroit et une date donnée, mais également la possibilité d’évaluer la composition des communautés de groupes taxonomiques plus larges ou même l’abondance des espèces en plusieurs moments et lieux. Ces ensembles de données proviennent généralement des protocoles standards développés pour mesurer et suivre la biodiversité comme les transects, les comptages d’oiseaux ou les prélèvements d’eau de mer ou d’eau douce. En indiquant, lors d’un échantillonnage, les méthodes, événements et l’abondance relative des espèces enregistrées, ces ensembles de données améliorent les comparaisons pouvant être faîtes avec des données collectées en utilisant les mêmes protocoles à différents endroits et moments - dans certains cas, cela permet aux chercheurs d’en déduire l’absence d’espèces particulières sur des sites spécifiques Say it’s the most recent data types. Sometimes a bit more complex

Type de jeu de données: métadonnées uniquement “Données sur les données” Toujours obligatoires Cruciales pour l’adéquation à l’usage

Licences Toutes les données GBIF ont maintenant une licence claire Choix possibles: Domaine public: CC0 Creative Commons Attribution: CC-BY Creative Commons Attribution Non Commercial: CC-BY-NC Explain the history, it was a bit of a mess before Standardized, international, tested licenses are important There was a long process at GBIF

Standards d’échange Ecological Metadata Language (EML) Métadonnées • Description riche des jeux de données • GBIF Profile Données primaires Données taxonomiques Darwin Core • 180 concepts • Ratifié en 2009 (TDWG) • Fichiers texte • Extensible Ou ABCD (TDWG) • >1200 concepts • Utilisé par Biocase et Tapir

Termes Darwin Core pour les données d’échantillonnage 7 termes essentiels pour le mapping des données d’échantillonnage : eventID parentEventID (nouveau) samplingProtocol sampleSize (nouveau) sampleSizeUnit (nouveau) organismQuantity (nouveau) organismQuantityType (nouveau)

Termes Darwin Core Darwin Core = standard de données  interopérabilité Termes obligatoires (* dans le fichier modèle) : institutionCode (ex : MNHN) : nom ou acronyme de l’institution ayant la garde de l’occurrence catalogNumber (ex : PPG-CF-00001) : identifiant (si possible unique) de chaque occurrence dans le jeu de données ou la collection collectionCode (ex : Entomologie) : nom ou acronyme du jeu de données ou de la collection dont l’occurrence provient scientificName (ex: Canis lupus) : nom scientifique complet avec paternité et date (si connus) basisOfRecord (ex : observation, specimen, fossil…) : nature spécifique de l’enregistrement

Termes importants : taxonomie, géographie (surtout latitude et longitude), conditions de prélèvement ou d’observation, contexte géologique, date, habitat, médias associés… Possibilité d’ajouter des extensions (vocabulaire plus spécifique) : Taxonomie détaillée Ajout de noms vernaculaires Images … Pour plus d’informations (définition et traduction des termes Darwin Core) : http://terms.tdwg.org/wiki/Darwin_Core

Processus de publication des données

Darwin Core, Simple Darwin Core et Darwin Core Archive Darwin Core: une liste de termes Talk about mandatory fields

Darwin Core, Simple Darwin Core et Darwin Core Archive Simple Darwin Core: Darwin Core exprimé sous forme de structure tabulaire simple

Darwin Core, Simple Darwin Core et Darwin Core Archive Extensions Darwin Core Archive: un format plus avancé, qui permet l’usage d’extensions.

Darwin Core Archive Contenu de l'archive Une archive correspond à un jeu de données Fichiers formatés par le standard Darwin Core Données d’occurrences ou taxonomiques Métadonnées sous format EML C'est le schméExplain the 3 components of an archive: Core data file + optionnal extensions files Metafile Descriptor file 17

Darwin Core Archive: Anatomie Les archives ont toujours un fichier de métadonnées EML C'est le schméExplain the 3 components of an archive: Core data file + optionnal extensions files Metafile Descriptor file 18

Darwin Core Archive: Anatomie Les archives ont toujours un fichier de données principal (Core Data File) C'est le schméExplain the 3 components of an archive: Core data file + optionnal extensions files Metafile Descriptor file 19

Darwin Core Archive Le dossier est zippé Fichiers de données (txt) Ceci est une archive DarwinCore Fichiers de données (txt) Fichier de correspondance des colonnes (meta.xml) Fichier de métadonnées (eml.xml) 20

Darwin Core Archive : avantages Format simple (Fichiers texte) Stockage efficace (compressé) Récolte efficace (un seul fichier) Simple d’accès (pas besoin de logiciel spécifique) Extensible Simpler data transfer:  what takes 500MB of data transfer in Tapir takes 3MB data transfer in DwC-A.  Extensible format: more flexible way to map data  Format le plus souvent utilisé pour la publication des données sur le réseau GBIF

Méthode de publication: IPT Logiciel serveur, nécessite une connexion stable Un IPT peut héberger plusieurs datasets, pour plusieurs institutions, et toujours donner crédit/attribution Modes test et production Multilingue Explain we’ll not cover installation Explain install needs a sysadmin, and a stable always on server Explain it can be hosted by anyone, and still give credit to you (give examples: node for a country, mentoring project, …)

Pour installer l’IPT Version 2.3.2 Serveur Tomcat Disponible sur www.gbif.org et Google Code

Etape 1: Accédez à l’IPT et connectez-vous !

Etape 2: Création d’une nouvelle ressource

Etape 3: Familiarisez-vous avec la page de configuration de la resource

Mapping : correspondance des champs

Mapping : suite

Etape 4: Rédigez les métadonnées

Métadonnées obligatoires

Métadonnées géographiques

Etape 5: Publiez, rendez visible et enregistrez le jeu de données

Gestion de la ressource Rendre visible à tous Ajouter un gestionnaire

Publier le jeu de données

Publication de la ressource

Enregistrement de la ressource (moissonnage par GBIF international)

(Integrated Publishing Toolkit) Présentation de l’IPT (Integrated Publishing Toolkit)

Références IPT v2 User Manual http://code.google.com/p/gbif-providertoolkit/wiki/IPT2ManualNotes Occurrence Data Publishing Tutorial http://code.google.com/p/gbif-providertoolkit/wiki/TutorialOccurrenceResource

Contacts Equipe GBIF France : gbif@gbif.fr Questions sur les outils GBIF : dev@gbif.fr connexion@gbif.fr Site web: http://www.gbif.fr Twitter : @gbiffrance