GB22 TRAINING EVENT FOR NODES – 4 OCTOBER 2015 Séance 02: Le paysage de la publication de données en 2015 Laura Russell.

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

Présentation générale de SPIP Fonctionnalités principales dun CMS La séparation entre contenu et présentation Susciter linteractivité en interne et en.
Training Slide Headline Goes Here and Second Line Goes Here Access to Information: Bolivia Main Headline Goes Here Modèles dAccès à lInformation pour la.
Journée «SpiderWomen» organisée par AMAZONE 16 octobre 2008 Christophe Dupriez Lapport potentiel d'un Wiki aux projets dune organisation.
Documentation numérique sur l’Internet
Educasources Paris, le 30 janvier 2007 Paris, le 30 janvier 2007.
Les Web Services.
Présentation du projet de plateforme web. Une plateforme web pour le pôle flore / habitats un outil de construction et danimation du pôle le socle structurant.
La Recherche en Ligne.
Etude des Technologies du Web services
Vice-rectorat de Mayotte
Introduction to Information Systems
Projet portail unique Direction de linformation cartographique.
3 avril 2007IFAP - Débat thématique "Conservation numérique"1 Conservation des publications électroniques et du dépôt légal Catherine Lupovici Département.
Le Centre sur la biodiversité
Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.
Jour 2 : La mobilisation des données sur la biodiversité.
Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.
Jour 3 : La numérisation des données sur la biodiversité.
Séance 13.1 Agent de changement (modèle de Dave Ulrich, 1997)
Console MMC de Windows 2000 Présenté par Suzanne Savoie Cours 4.
Module 2 : Préparation de l'analyse des performances du serveur
La veille numérique : un outil pour s'informer intelligemment &
Compétences des enseignants
Comment enregistrer des jeux de données dans le GBIF Michael Akbaraly IT engineer GBIF France Buenos Aires (Argentine) 28 Septembre.
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment le DwC-A a changé.
Formation nationale CHM, 2012, Antananarivo, Madagascar
Anne Sophie Archambeau GBIF France Buenos Aires (Argentina) 28 September 2011 Training course on biodiversity data publishing and.
Les permis d’accès Frédéric Dorais Stage en inventaire des permissions accordées dans les corridors routiers.
DECLARATION de l’OIT, Turin, 12 Novembre 2003
Atelier Régional de Formation « Pour une gestion des projets orientée vers l’impact » Construire sur les expériences des projets Madagascar 10 Octobre.
SYSTEMES d’INFORMATION séance 1 : Introduction et définitions
Formation nationale CHM, 2013, Abidjan, Côte d’Ivoire Le Centre d’échange d’information de la Convention sur la diversité biologique Par: Han de Koeijer.
Module d’apprentissage en ligne : Planifier l’évaluation.
Michael IT Engineer GBIF France Buenos Aires (Argentina) 28 September 2011 Formation sur la publication des données de biodiversité.
Principes et définitions
Le Centre d’échange d’information de la Convention sur la diversité biologique Par: Han de Koeijer et Marie -Lucie Susini; Institut royal des Sciences.
Réseau interaméricain de prévention de la violence et de la criminalité Mars 2015.
Applications Internet Cours 3 21 janvier 2010 Cours 3 21 janvier 2010.
La gestion des bases de données
Les systèmes de gestion de contenu
Unité 1: La géographie.
Joanne Yeomans CERN Induction Course 2007 Service pour l’information scientifique Libre accès à la littérature et aux données scientifiques Scientific.
Secrétariat général direction de la Recherche et de l’Animation scientifique et technique Présentation de la directive européenne INSPIRE.
CONSEIL NATIONAL DE RECHERCHES CANADA PROGRAMME D’AIDE À LA RECHERCHE INDUSTRIELLE Accélérer la croissance des PME grâce à l'innovation et à la technologie.
Publier ses métadonnées dans ECOSCOPE
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Atelier Régional de renforcement des capacités en matière de collecte et d’utilisation des données sur les migrations pour le développement Système d’Information.
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Egalité et discrimination
Préparé par les Co-gestionnaires du CHM Togo Et présenté par le Cdt AGBETI.
Formation.
Présentation de Facebook
PRESENTATION DU SITE Version Contexte Objectifs du site L’univers Kids pour les élèves L’univers Teachers pour les enseignants Evolutions du site.
La promotion du mouvement Lions. Médias sociaux : Ce sont des sites Internet qui permettent aux utilisateurs de créer, de partager ou d'échanger des informations,
Contribution. Accueil Vous êtes actuellement connecté à votre espace de contribution de la médiathèque de l'Université Paris Descartes. Dans cette espace.
Etre responsable à l’ère du numérique Domaine D2.
GB22 FORMATION POUR POINTS NODAUX – 4 OCTOBRE 2015 Séance 01: Introduction à la Formation Alberto González-Talaván.
Intervention ReRIP – 26 mars 2008 – Mathilde Guiné Le Réseau Tela Botanica Un réseau d’acteurs au service de la botanique francophone Le projet "Outils-réseaux"
[GB20 Nodes Courses] [Mettre en place un Point Nodal GBIF III: Positionnement stratégique de votre Point Nodal] [Dr. Liam Lysaght] [Centre Director] Global.
GBIF NODES Committee Meeting Copenhague, Danemark 4 octobre 2009 L’outil de publication intégrée du GBIF (‘GBIF Integrated Publishing Toolkit’ ) Alberto.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 Extensions de l’IPT Alberto GONZÁLEZ-TALAVÁN Responsable de Programme pour les Formations.
Le Canada : L’étude de cas parfaite Suzanne Legault Commissaire à l’information du Canada intérimaire Groupe de discussion 2—Institution spécialisée, ombudsman.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 Customisation de l’IPT Alberto GONZÁLEZ-TALAVÁN Responsable de Programme pour les Formations.
Le nouveau rôle du Conseil des ressources humaines Du 21 au 23 septembre 2011 Colloque de 2011 du Conseil national mixte.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 IPT: Interface utilisateur et outils de contrôle de la qualité des données Alberto GONZÁLEZ-TALAVÁN.
L’ASSISTANT PGD FORMATION IDD, UNIVERSITÉ MCGILL. 29 AVRIL 2016.
Les outils collaboratifs Assane Fall Bibliothécaire / Veilleur technologique.
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées , édition 2011 Comment le DwC-A a changé.
Session 03: Démonstration pratique: comment préparer et mapper différents types de données Nicolas Noé GB22 Training event for nodes – 4 October 2015.
Transcription de la présentation:

GB22 TRAINING EVENT FOR NODES – 4 OCTOBER 2015 Séance 02: Le paysage de la publication de données en 2015 Laura Russell

INDEX Le « paysage » de la publication des données La publication des données sur la biodiversité Les types de données Les normes de données La normalisation des données et la qualité des données Les méthodes de publication des données La -promotion de la publication de données Les cas d'utilisation

LE PAYSAGE DE LA PUBLICATION DES DONNÉES DiGIR / TAPIR très utilisé pour publier des données sur la biodiversité Idée de publier à base de fichier texte simple et comprimé présenté à TDWG Le GBIF lance l’ IPT 1,0 Le GBIF réaménage l’ IPT Le GBIF lance l’ IPT 2.0 La publication des données est enseigné à la formation des nœuds Le points nodaux et les agrégateurs commencent à installer et à utiliser l’ IPT Les jeux de données de type occurrence et checklist ainsi que le nombre d’installations de l’IPT montrent une croissance continue  2011

LE PAYSAGE DE LA PUBLICATION DES DONNÉES - STATISTIQUES No. d’installations de l’IPT enregistrées avec le GBIF

LE PAYSAGE DE LA PUBLICATION DES DONNÉES - STATISTIQUES No. de jeux de données publiées avec l’IPT

LE PAYSAGE DE LA PUBLICATION DES DONNÉES EN 2015 L'engagement continue du GBIF à améliorer l'accès aux données de la biodiversité Le raffinement et l'expansion des normes et des logiciels de publication L'évolution des normes sociales La plupart des données sont encore publiées avec le « core » simple pour occurrences Les portails n’ont pas encore les fonctionnalités pour soutenir les données plus riches De nombreuses institutions ont encore besoin d’ être convaincues de publier des données sur la biodiversité

INDEX Le « paysage » de la publication des données La publication des données sur la biodiversité Les types de données Les normes de données La normalisation des données et la qualité des données Les méthodes de publication des données La -promotion de la publication de données Les cas d'utilisation

QU'EST-CE QUE DES DONNÉES DE BIODIVERSITÉ? Texte numérique ou donnée multimédia détaillant les faits sur l'instance d’occurrence d'un organisme, à savoir sur le quoi, où, quand, comment et par qui de l’occurrence et de l'enregistrement.

QU'EST CE LA PUBLICATION DE DONNÉES? La « publication » consiste à rendre des jeux de données de la biodiversité accessibles au public et découvrable, sous une forme standardisée, via un point d'accès, généralement une adresse Web (URL). IPT ∞

LES TYPES DE DONNÉES SUR LA BIODIVERSITÉ Checklistes Occurrences Metadonnées

LES TYPES DE DONNÉES SUR LA BIODIVERSITÉ – DONNÉES D’ ÉCHANTILLONNAGE Échantillonnage

LES NORMES OU “STANDARDS” ABCD Access to Biological Collection Data (2005) DwC Darwin Core (2009) AC Audubon Core Multimedia Resources Metadata Schema (2013) NCD Natural Collection Descriptions (Draft)

DARWIN CORE recordedBy: Une liste (concaténée et séparée) de noms de personnes, groupes ou organisations responsables de l'enregistrement de l'occurrence originale. Le collecteur ou observateur primaire, en particulier celui qui applique un identifiant personnel (RecordNumber), doit être cité en premier. Exemples: « José E. Crespo », « Oliver P. Pearson | Anita K. Pearson »

DARWIN CORE SIMPLE SIMPLEDWC est une spécification pour une façon particulière d'utiliser les termes Darwin Core - de partager des données sur les taxons et leurs occurrences avec une structure simple - et probablement ce que veux dire quelqu'un qui suggère de "formater vos données conformément à la Darwin Core".

LES ARCHIVES DARWIN CORE Une Archive Darwin Core (DwCA) est la représentation en texte des données formatées à Darwin Core. Une DwCA est un fichier compressé contenant un minimum de trois fichiers.

“STAR SCHEMA” OU SCHÉMA ÉTOILE Ext 2 Core Ext 1 Ext 3 meta.xml EML.xml + DwC Archive Ext 4 Ext 5

“MAPPING CORES” OU FICHIERS CENTRALES Taxon Core La catégorie d'informations relatives aux noms taxonomiques, le nom du taxon, les usages ou les concepts de taxons. Sortie en Avril 2015, cette version supprime dcterms:source and dcterms:rights, et ajoute dcterms: licence. 43 termes. Occurrence Core La catégorie d'informations relatives aux preuves d’une occurrence dans la nature, dans une collection ou dans un jeu de données (de spécimens, d’observations etc.) Sortie en July 2015, cette version supprime les terms dcterms:source, dcterms:rights, dwc:individualID, dwc:occurrenceDetails,et ajoute dcterms:license, dwc:organismQuantity, dwc:organismQuantityType, dwc:organismID, dwc:organismName, dwc:organismScope, dwc:associatedOrganisms, dwc:organismRemarks, dwc:parentEventID, dwc:sampleSizeValue, dwc:sampleSizeUnit. 169 termes. Event La catégorie des informations relatives à un événement d'échantillonnage. Sortie le 29 May termes

EXTENSIONS Darwin Core ne fournit pas de termes pour chaque type de données possible. 22 inscrits 25 en cours de développement Exemples Audubon Media Description (ou “Audubon Core”) Darwin Core Identification History (historique de l’identification) Darwin Core Measurement or Facts (measures ou faits)

EXEMPLE SCHÉMA ÉTOILE - OCCURRENCE Media Occurrence Core Geographica l Determination meta.xml EML.xml + DwC Archive Occurrence Germoplas m

EXEMPLE SCHÉMA ÉTOILE - CHECKLISTES Literature Taxon Core Description Occurrences meta.xml EML.xml + DwC Archive Checklist Vernacular Distribution Types

EXEMPLE SCHÉMA ÉTOILE - ÉCHANTILLONNAGE Event Core Occurrences Measurement/Fact meta.xml EML.xml + DwC Archive Samples Relevé

NORMALISATION DES DONNÉES Quelle est la normalisation des données? Raisons pour normaliser une base de données Formes normales

LA QUALITÉ DES DONNÉES Encodages Outils Pourquoi travailler sur l'amélioration des données? Importance de la rétroaction

MÉTHODES DE PUBLICATION DE DONNÉES la capacité technique Capacité de gestion de données Créer vos propres DwCa Publier avec des tableurs centre d'hébergement de données

MÉTHODES DE PUBLICATION DE DONNÉES

MÉTHODES DE PUBLICATION DE DONNÉES – PREMIER SONDAGE Sondage: Résultats: Quelles des méthodes suivantes avez-vous déjà utilisées pour publier des données en ligne?

MÉTHODES DE PUBLICATION DE DONNÉES - SONDAGES Cet exercice sera expliqué dans la séance 

MÉTHODES DE PUBLICATION DE DONNÉES – DEUXIÈME SONDAGE Sondage: Résultats: Quelles des méthodes suivantes utilisez-vous régulièrement à publier des données en ligne? (à savoir l'année dernière)

INDEX Le « paysage » de la publication des données La publication des données sur la biodiversité Les types de données Les normes de données La normalisation des données et la qualité des données Les méthodes de publication des données La promotion de la publication de données Les cas d'utilisation

PROMOTION DE LA PUBLICATION DE DONNÉES Sujet de discussion lors de la formation de nœuds à Berlin en Elément clé du travail quotidien de gestionnaires de points nodaux.

PROMOTION DE LA PUBLICATION DE DONNÉES Obstacles psychologiques et culturels 1.Manque de connaissance 2.Manque de compréhension 3.Manque de volonté 4.Valeur perçue des données 5.Questions de confidentialité 6.Absence d’autorisation 7.Manque de temps / planning 8.Manque de moyens 9.Manque de fonds 10.Manque d’infrastructures Obstacles institutionnels Obstacles liés aux ressources Obstacles pratiques

NIVEAUX DE RESTRICTION DE DONNÉES 1.Refus de partager. 2.Refus de partager jusqu'à ce que l'utilisation. prévue des données soit terminée. 3.Partage payant des données. 4.Partage des données avec des restrictions. 5.Partage libre des données.

PROMOTION DE LA PUBLICATION DE DONNÉES - STRATÉGIES 1.Faciliter l'accès à un soutien financier. 2.Appel à des engagements ou des mandats légaux. 3.Appel à un accès ouvert/principes moraux. 4.Montrer les avantages d'une meilleure gestion des données. 5.Montrer les avantages pour les carrières scientifiques. 6.Pression des pairs 7.Démarrer/soutenir de grands programmes de numérisation. 8.Démarrer/soutenir les efforts de rapatriement des données.

PROMOTION DE LA PUBLICATION DE DONNÉES - DISCUSSIONS Stratégies Commencez petit - seulement les méta-données Promotion du fait qu’avec une seule publication au GBIF les données seront ensuite exposées dans de multiples réseaux Fournir des IPTs hébergés pour éliminer les barrières technique Illustrer des licences avec des exemples éloquents. Promouvoir et organiser des formations sur les « data papers » Défis Ne pas voulant publier / ne pas voulant publier toutes les données Exigences/ capacities techniques pour utliser l’IPT Licences restrictives des données

INDEX Le « paysage » de la publication des données La publication des données sur la biodiversité Les types de données Les normes de données La normalisation des données et la qualité des données Les méthodes de publication des données La -promotion de la publication de données Les cas d'utilisation

CAS D’UTILISATION - INTRODUCTION Explorez quatre cas d'utilisation basés sur de pratiques de publication actuelles Littérature Données d'observation Collections d'histoire naturelle Checklistes Remplir deux exercices Définition des stratégies de publication Publier des jeux de données

CAS D’UTILISATION: DONNÉES À BASE DE LITERATURE Blue Group

CAS D’UTILISATION 2: DONNÉES D’OBSERVATIONS Green Group Red Group

CAS D’UTILISATION 3: DONNÉES DE COLLECTION D’HISTOIRE NATURELLE Yellow Group

CAS D’UTILISATION 4: CHECKLISTES TAXONOMIQUES Purple Group

GB22 TRAINING EVENT FOR NODES – 4 OCTOBER 2015 Séance 02: Le paysage de la publication de données en 2015 Laura Russell