Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parMarine Hoffmann Modifié depuis plus de 9 années
1
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment le DwC-A a changé la manière de publier les données de biodiversité Michael Akbaraly(akbaraly@gbif.fr) IT Engineer GBIF France Buenos Aires (Argentina) 28 September 2011
2
Rappel : Standards d'échange ABCD (TDWG Standard) > 1200 concepts XML Utilisé par BioCase, Tapir Darwin Core (pre-standard v. 1.2, 47 versions) 48 concepts, specimens XML Utilisé par DiGIR Darwin Core (pre-standard v. 1.4) 46 concepts (plus extensions), specimens XML Utilisé par Tapir Darwin Core (TDWG Standard) 172 concepts (156 dans Simple Darwin Core), données de biodiversité CSV, XML, RDF, JSON, … Utilisé par Tapir, Darwin Core Archive ou fichier texte
3
Darwin Core Archive Données PrimairesDonnées TaxonomiquesMétadonnées http://www.quelquepart.org/data.zip
4
Darwin Core Archive Contenu de l'archive Une archive correspond à un jeu de données Fichiers formatés par le standard Darwin Core Données d’occurrences ou taxonomiques Métadonnées sous format EML
5
Format simple (fichiers texte) Processus de récolte efficace (fichier unique) Stockage efficace (archive compressée) Facilité d'accès (ne nécessite pas de logiciel spécifique) Extensible (fichiers liées dans une archive unique) Darwin Core Archive: Avantages Format d'échange préferé pour la publication des données sur le réseau GBIF
6
Darwin Core Archive: Anatomie Les archives ont toujours un fichier de métadonnées EML
7
Ecological Metadata Language (EML) Titre et Description Citation and Attribution Contacts et Auteurs Couverture Géographique Méthode d'échantillonage Bibliographie Et plus... Décrit les jeux de données – même ceux qui ne sont pas publiés
8
Darwin Core Archive: Anatomie Les archives ont toujours un fichier de données principal (Core Data File)
9
Types de fichier de données principal (Core data file) Données taxonomiques – une espèce par ligne Données d'occurrences – une par ligne OU
10
Darwin Core Archive: Anatomie Les archives ont toujours un fichier de données principal (Core Data File)
11
Le fichier principal a une colonne “ID_Principal” unique pour chaque enregistrement du fichier Darwin Core Archive: Anatomie
12
Les colonnes sont mises en correspondance avec les concepts DarwinCore Darwin Core Archive: Anatomie
13
Les colonnes ne correspondant pas à un concept DarwinCore peuvent être rajoutées, mais seront ignorées “Wingspan” n'est pas un concept Darwin Core Darwin Core Archive: Anatomie
14
1) Renommer les colonnes dans le fichier Il y a deux manières de mettre en correspondance les colonnes avec les concepts DarwinCore Darwin Core Archive: Anatomie
15
2) Faire la correspondance des champs dans le fichier meta.xml Il y a deux manières de mettre en correspondance les colonnes avec les concepts DarwinCore Darwin Core Archive: Anatomie
16
meta.xml décrit les colonnes du fichier de données principal (species.txt) Plus d'informations sur le meta.xml plus tard... Darwin Core Archive: Anatomie
17
Les archives peuvent inclure des extensions Species.txt Common_names.txt Les extensions permettent de relier plusieurs enregistrements à un enregistrement principal Les extensions sont reliées au fichier principal par l'ID_Principal Darwin Core Archive: Anatomie
18
GBIF héberge les définitions des extensions http://rs.gbif.org/extension/
19
Plusieurs extensions peuvent être reliées au fichier principal Darwin Core Archive: Anatomie
20
Tous les fichiers sont stockées dans un seul dossier Darwin Core Archive: Anatomie
21
Le dossier est zippé Ceci est une archive DarwinCore Fichiers de données Fichier de correspondance des colonnes (meta.xml) Fichier de métadonnées (eml.xml) Darwin Core Archive: Anatomie
22
http://www.organisation.org /my_data.zip Les archives sur un serveur web peuvent être accessible par une URL. Partagez cette URL pour publier vos données! Darwin Core Archive: Publication
23
Darwin Core Archive: Options de Publication
24
GBIF Spreadsheet Templates
25
Integrated Publishing Toolkit
26
Data Hosting Centers
27
Darwin Core Mapping Assistant Metafile http://tools.gbif.org/dwca-assistant/
28
Darwin Core Mapping Assistant
29
GBIF Darwin Core Archive Spreadsheet Templates: Les données sont déja sous forme de tableur Création d'une simple archive IPT: Créer/gérer plusieurs archives venant de plusieurs jeux de données Gérer les archives provenant de plusieurs organisations Édition des métadonnées sous le GBIF Metadata Profile Création manuelle: Automatisation de la creation des archives Customisation Centre d'hébergement: Économie d'échelle Infrastructure et assistance Un peu de tout ça... Darwin Core Archive: Options de publication
30
GB18 Training Session - Jour 1 Comment le DwC-A a changé la manière de publier les données de biodiversité Michael Akbaraly / Anne-Sophie Archambeau / Nicolas Noé GBIF France - BeBIF Global Biodiversity Information Facility (GBIF) 28/09/11
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.