Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

Les technologies décisionnelles et le portail
Les Web Services Schéma Directeur des Espaces numériques de Travail
CRÉER UNE APPLICATION INTERNET RELIEE A UNE BASE DE DONNEES
- Couche 7 - Couche application. Sommaire 1)Introduction 1)DNS 1)FTP et TFTP 1)HTTP 1)SNMP 1)SMTP 1)Telnet.
Julien HERON.
JXDVDTEK – Une DVDthèque en Java et XML
TER Gestionnaires de contenu en ligne
L’architecture .net et ASP.net
Le développement d’applications sous Lotus Notes
Documentation numérique sur l’Internet
version Beta Marie Calberg Ninni Louhelainen SLFN7
Présentation application GRBL France Telecom
Le Téléphone Russe Le Téléphone Russe. Le Téléphone Russe Le Téléphone Russe.
Etude des Technologies du Web services
XML-Family Web Services Description Language W.S.D.L.
Sommaire Objectif de Peakup Principes de fonctionnement
Archimède : dépôt institutionnel de la Bibliothèque de lUniversité Laval Par Rida Benjelloun Chef de la section recherche.
Lycée Louis Vincent Séance 1
Chap 4 Les bases de données et le modèle relationnel
Type de contenu. © Partouche David / 2007 version 0.1 Colonne de site Une colonne de site permet de définir un champs qui sera exploitable au sein de.
ASP.NET Par: Hugo St-Louis. C ARACTÉRISTIQUES A SP. NET Évolution, successeur plus flexible quASP (Active Server Pages). Pages web dynamiques permettant.
Services fournis par le SI et technologies associées
Notions sur le XML Réfs : manuel p 149. Introduction Le XML (eXtensible Markup Language) est un standard d'échange de données. Il fait partie comme le.
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
Jour 2 : La mobilisation des données sur la biodiversité.
Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.
Jour 3 : La numérisation des données sur la biodiversité.
Soutenance de stage de fin d’études
Module 8 : Maintenance des logiciels à l'aide des services SUS
Conception, création et animation d’une classe virtuelle
‘‘Open Data base Connectivity‘‘
Mise en oeuvre et exploitation
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
Comment enregistrer des jeux de données dans le GBIF Michael Akbaraly IT engineer GBIF France Buenos Aires (Argentine) 28 Septembre.
09/11/2006 CMS Content Management System Système de Gestion de Contenu.
Cours de programmation web
Utilisation du portail de données du GBIF. data.gbif.org Sur la page d’accueil ou n’importe quelle autre page du portail, tapez un nom scientifique ou.
Programmation Web : Introduction à XML
Le web service
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment le DwC-A a changé.
Mastère Professionnel Systèmes de Communication et Réseaux
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Formation nationale CHM, 2012, Antananarivo, Madagascar
Formation des Rédacteurs Contributeurs à la Communication Diocésaine sur Internet 30 novembre 2005 Le site Internet du Diocèse de Fréjus-Toulon:
COMPARAISON ENTRE GNUTELLA ET FREENET
Formation nationale CHM, 2013, Abidjan, Côte d’Ivoire Le Centre d’échange d’information de la Convention sur la diversité biologique Par: Han de Koeijer.
Module : Langage XML (21h)
Michael IT Engineer GBIF France Buenos Aires (Argentina) 28 September 2011 Formation sur la publication des données de biodiversité.
Presenter ( ) Role Organization Buenos Aires (Argentina) 28 September 2011 Training course on biodiversity data publishing and fitness-for-use in the.
PPE 2 : Val Lamartinien Passion
Le Centre d’échange d’information de la Convention sur la diversité biologique Par: Han de Koeijer et Marie -Lucie Susini; Institut royal des Sciences.
Les Systèmes de Gestion de Contenu (CMS) Allirand Maud Chabord Grégoire Massart Anne-Sophie 24 novembre 2006.
Introduction à MathML Par Katia Larrivée UQO Le 18 mars 2004.
Les systèmes de gestion de contenu
Introduction aux technologies des web services en Java EE
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Publier ses métadonnées dans ECOSCOPE
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Dreamweaver Séance 1.
1 Présentation de DREAMWEAVER (1) Gaël TREMEAU GI05 Printemps 2006.
Bloc 1 - UE 5 - Technologies de l’information et de la communication TIC Bachelier en immobilier T. SOUMAGNE.
GBIF NODES Committee Meeting Copenhague, Danemark 4 octobre 2009 L’outil de publication intégrée du GBIF (‘GBIF Integrated Publishing Toolkit’ ) Alberto.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 Extensions de l’IPT Alberto GONZÁLEZ-TALAVÁN Responsable de Programme pour les Formations.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 Customisation de l’IPT Alberto GONZÁLEZ-TALAVÁN Responsable de Programme pour les Formations.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 IPT: Interface utilisateur et outils de contrôle de la qualité des données Alberto GONZÁLEZ-TALAVÁN.
Révisions pour l’exam L2 Informatique Obligatoire.
GB22 TRAINING EVENT FOR NODES – 4 OCTOBER 2015 Séance 02: Le paysage de la publication de données en 2015 Laura Russell.
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées , édition 2011 Comment le DwC-A a changé.
Transcription de la présentation:

Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité

Sommaire Rappel sur le XML Présentation des standards de connexion

Sommaire Présentation de lIPT (Integrated Publishing Toolkit) Démonstration de lIPT

XML

Sommaire Présentation Avantages Utilisation du XML

Présentation XML : eXtensible Markup Language Format déchange de données Méta-Langage à balises Même principe que le HTML Information ajoutée au contenu pour marquer la structure logique

Présentation ENTÊTE et ENCODAGE BDI ELEMENT BoBO - Botanic Garden Berlin BDI Observations COMMENTAIRE BALISE OUVRANTE 2 Observation... animalia ATTRIBUT BALISE FERMANTE

Présentation Séparation du fond et de la forme Forme : présentation à partir de la structure (style) Fond : structure + données (contenu) Langage multi-support

Avantages Lisibilité : simple à comprendre Autodescriptif et extensible Structure arborescente Facilement déployable Intégrabilité

Utilisation du XML Standardise linformation indépendamment de la structure de la base de données source Principe de « wrapping » : permet une mise en correspondance des colonnes et les tables d'une base de données avec un ou plusieurs éléments d'un schéma XML donné

Utilisation du XML Au niveau du wrapper: Standards XML : ABCD et DarwinCore Logiciels : Biocase, TAPIR, DIGIR et IPT

Standards

Standards Standard : document qui fournit des règles pour des procédés et méthodes de production. Utilisé pour la conception des collections et bases de données de gestion de l'information.

Standards Standards déchange de données : Protocoles de transfert utilisés pour organiser et formater linformation pour échange. ABCD et Darwin Core : standards déchange les plus connus pour les données de collection.

Standards Pourquoi des standards? Fournir le medium, les règles et les protocoles pour échanger linformation. Permer linteroperatibilité des données avec dautres données. Homogeneise linformation en vue de son intégration à un système mondial

Darwin Core Facilite léchange dinformation à propos des occurrences géographiques des espèces et lexistence des spécimens dans les collections. Pertinent pour les collections dhistoire naturelle.

Darwin Core Schéma simple, adapté aux données sur fichiers plats. 46 éléments regroupés dans 7 catégories : Record level, taxonomic, identification, locality, collecting event, biological, reference. Liste des champs sur : CoreDraftStandard CoreDraftStandard

ABCD Projet BIOCASE Standard déchange de données sur les spécimens et les données dobservation. Plus complexe que Darwin Core (1200 élements). Site internet : (Access to Biological Collections Data)

Biocase Logiciel mettant en correspondance une source de données avec un standard choisi. Produit : Fichier XML formaté et exploitable

Démonstration

Integrated Publishing Toolkit (1.0)

Présentation générale de lIPT Introduction Fonction dans le réseau GBIF Resources Caractéristiques Fonctionnalités Une plate-forme pour faciliter la décentralisation Sommaire

Démonstration Configuration Publication de métadonnées Publication de données Web application, interfaces Sommaire

LIPT est… Une web application Java open-source : Connecter et publier 3 types de données de biodiversité : - Données primaires - Information sur les espèces - Métadonnées sur les ressources À partir dune source de données : - Base de données - Fichier plat Pour rendre ces données visibles sur le réseau distribué du GBIF

Un composant du réseau GBIF

Ressources Documentation et téléchargement Demo site Version 1.0 disponible depuis le 31/03/2009 Chef de projet : Markus Döring, Senior Software Engineer, GBIF

Caractéristiques Web application multilingue Contient un serveur de géolocalisation Gestion de rôles Base de données embarquée Supporte lutilisation de fichiers texte (.csv) Utilisation de vocabulaire pour limiter les termes Utilisation dextension pour Darwin Core Vérification de la qualité de données basique Utilisation didentifiant unique (uuid)

Utilisation des wrappeurs Scénario original Les wrappeurs exposent les bases de données aux requêtes

Utilisation des wrappeurs Scénario fréquent Une copie de base est utilisée pour la publication des données Souvent sur une machine de moins bonne qualité (perte de performance) Souvent non mise à jour (fraîcheur des données)

Récolte avec les protocoles existants Le fournisseur a un wrappeur TAPIR Ce wrappeur permet de récuperer 200 enregistrements par requete. Si la base contient 260,000 enregistrements à récuperer : 1300 request / responses 9 heures au total 500MB de transfert XML Seulement 32MB utiles à lindex Compressées en 3MB

U Une fois défini, le vocabulaire est accessible à tous les utilisateurs de lIPT Contrôle du vocabulaire

Schéma extensible

Page daccueil paramétrable (1)

Page daccueil paramétrable (2)

Gestion de rôles Les users ne peuvent quexplorer les données Les managers ne gèrent que leurs données Possibilité de partager une même instance IPT

Senregistrer au GBIF

Gestion des extensions

Gestion des vocabulaires

Créer des métadonnées

Catégories de métadonnées Basic metadata Resource originator Geographic coverage Taxonomic coverage Temporal coverage IP Rights Research project information Methods Keywords

Mapping

Chargement des données Pendant le chargement, les données sont importées de la source (fichier plat ou base de données) Des statistiques sont calculés

Vue sur les ressources disponibles

Exploration taxonomique La taxonomie provient de la source de données Un premier niveau de contrôle de qualité de données est effectué

Résumé statistique

Graphiques

Contrôle de la qualité de données

Sortie XML

Web site: Data portal: GBIF Secretariat Universitetsparken Copenhagen Denmark Phone: Contact