Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

Les technologies décisionnelles et le portail
Les Web Services Schéma Directeur des Espaces numériques de Travail
CRÉER UNE APPLICATION INTERNET RELIEE A UNE BASE DE DONNEES
- Couche 7 - Couche application. Sommaire 1)Introduction 1)DNS 1)FTP et TFTP 1)HTTP 1)SNMP 1)SMTP 1)Telnet.
Julien HERON.
JXDVDTEK – Une DVDthèque en Java et XML
INTRODUCTION INTRODUCTION ERGONOMIE Tri par cartes Formulaires Interface Installation Lanceur Documentation TECHNOLOGIES XML + XSL CSS Formulaires génériques.
TER Gestionnaires de contenu en ligne
Le développement d’applications sous Lotus Notes
Domaines nominaux XSLT
version Beta Marie Calberg Ninni Louhelainen SLFN7
XML Un format d'échange et un langage de présentation des données associé au HTML.
Le Téléphone Russe Le Téléphone Russe. Le Téléphone Russe Le Téléphone Russe.
Etude des Technologies du Web services
XML-Family Web Services Description Language W.S.D.L.
Sommaire Objectif de Peakup Principes de fonctionnement
Archimède : dépôt institutionnel de la Bibliothèque de lUniversité Laval Par Rida Benjelloun Chef de la section recherche.
Lycée Louis Vincent Séance 1
Chap 4 Les bases de données et le modèle relationnel
Administration de bases de données spatiales avec SavGIS
Type de contenu. © Partouche David / 2007 version 0.1 Colonne de site Une colonne de site permet de définir un champs qui sera exploitable au sein de.
ASP.NET Par: Hugo St-Louis. C ARACTÉRISTIQUES A SP. NET Évolution, successeur plus flexible quASP (Active Server Pages). Pages web dynamiques permettant.
Introduction à la structuration des documents: les techniques M2: Gestion des connaissances.
Services fournis par le SI et technologies associées
Notions sur le XML Réfs : manuel p 149. Introduction Le XML (eXtensible Markup Language) est un standard d'échange de données. Il fait partie comme le.
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité.
Jour 2 : La mobilisation des données sur la biodiversité.
Jour 3 : La numérisation des données sur la biodiversité.
Support des connaissances TP2 XSL-T
Les feuilles de style CSS
‘‘Open Data base Connectivity‘‘
Mise en oeuvre et exploitation
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
Comment enregistrer des jeux de données dans le GBIF Michael Akbaraly IT engineer GBIF France Buenos Aires (Argentine) 28 Septembre.
09/11/2006 CMS Content Management System Système de Gestion de Contenu.
Cours de programmation web
L’ ACCESSIBILITE « C’est mettre le Web et ses services à la disposition de tous les individus, quels que soient leur matériel ou logiciel, leur infrastructure.
Programmation Web : Introduction à XML
Le web service
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment le DwC-A a changé.
Mastère Professionnel Systèmes de Communication et Réseaux
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Formation nationale CHM, 2012, Antananarivo, Madagascar
Formation des Rédacteurs Contributeurs à la Communication Diocésaine sur Internet 30 novembre 2005 Le site Internet du Diocèse de Fréjus-Toulon:
Campus-Booster ID : **XXXXX Copyright © SUPINFO. All rights reserved Le développement Web.
COMPARAISON ENTRE GNUTELLA ET FREENET
Soutenance du mémoire de synthèse
Formation nationale CHM, 2013, Abidjan, Côte d’Ivoire Le Centre d’échange d’information de la Convention sur la diversité biologique Par: Han de Koeijer.
Module : Langage XML (21h)
Modélisation des documents: DTD et Schéma
Michael IT Engineer GBIF France Buenos Aires (Argentina) 28 September 2011 Formation sur la publication des données de biodiversité.
eXtensible Markup Language. Généralités sur le XML.
Le Centre d’échange d’information de la Convention sur la diversité biologique Par: Han de Koeijer et Marie -Lucie Susini; Institut royal des Sciences.
Les Systèmes de Gestion de Contenu (CMS) Allirand Maud Chabord Grégoire Massart Anne-Sophie 24 novembre 2006.
Introduction à MathML Par Katia Larrivée UQO Le 18 mars 2004.
Les systèmes de gestion de contenu
Introduction aux technologies des web services en Java EE
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Publier ses métadonnées dans ECOSCOPE
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
Dreamweaver Séance 1.
1 Présentation de DREAMWEAVER (1) Gaël TREMEAU GI05 Printemps 2006.
Bloc 1 - UE 5 - Technologies de l’information et de la communication TIC Bachelier en immobilier T. SOUMAGNE.
GBIF NODES Committee Meeting Copenhague, Danemark 4 octobre 2009 L’outil de publication intégrée du GBIF (‘GBIF Integrated Publishing Toolkit’ ) Alberto.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 Customisation de l’IPT Alberto GONZÁLEZ-TALAVÁN Responsable de Programme pour les Formations.
GBIF NODES Committee Meeting Copenhagen, Denmark 4 th October 2009 IPT: Interface utilisateur et outils de contrôle de la qualité des données Alberto GONZÁLEZ-TALAVÁN.
Révisions pour l’exam L2 Informatique Obligatoire.
GB22 TRAINING EVENT FOR NODES – 4 OCTOBER 2015 Séance 02: Le paysage de la publication de données en 2015 Laura Russell.
Transcription de la présentation:

Jour 4 : Publication des données sur l'Internet Création de réseaux d'information sur la biodiversité

Sommaire Rappel sur le XML Présentation des standards de connexion

Sommaire Présentation de lIPT (Integrated Publishing Toolkit) Démonstration de lIPT

XML

Sommaire Présentation Mise en page du XML Structure des documents XML Avantages Utilisation du XML

Présentation XML : eXtensible Markup Language Format universel pour représenter les données et les documents. Format déchange de données Méta-Langage à balises Même principe que le HTML Information ajoutée au contenu pour marquer la structure logique

Présentation ENTÊTE et ENCODAGE BDI ELEMENT BoBO - Botanic Garden Berlin BDI Observations COMMENTAIRE BALISE OUVRANTE 2 Observation... animalia ATTRIBUT BALISE FERMANTE

Présentation Séparation du fond et de la forme Forme : présentation à partir de la structure (style) Fond : structure + données (contenu) Langage multi-support

Mise en page du XML La représentation des données est assuré par un langage de mise en page tiers: CSS (Cascading StyleSheet) XSLT (eXtensible StyleSheet Language Transformation)

Mise en page du XML XSLT : Transforme un document XML en tout autre format textuel Principe : XML XSLT PDF HTML … RTF

Structure des documents XML DTD (Document Type Definition) : Décrit la structure des documents

Hugo Victor Charles Paris Structure des documents XML

Un document XML suivant les règles XML est un document bien formé Un document XML conforme à une DTD est un document valide

Avantages Lisibilité : simple à comprendre Autodescriptif et extensible Structure arborescente Facilement déployable Intégrabilité

Utilisation du XML Standardise linformation indépendamment de la structure de la base de données source Principe de « wrapping » : permet une mise en correspondance des colonnes et les tables d'une base de données avec un ou plusieurs éléments d'un schéma XML donné

Utilisation du XML Au niveau du wrapper: Standards XML : ABCD et DarwinCore Logiciels : Biocase, TAPIR, DIGIR et IPT

Standards

Standards Standard : document qui fournit des règles pour des procédés et méthodes de production. Utilisé pour la conception des collections et bases de données de gestion de l'information.

Standards Standards déchange de données : Protocoles de transfert utilisés pour organiser et formater linformation pour échange. ABCD et Darwin Core : standards déchange les plus connus pour les données de collection.

Standards Pourquoi des standards? Fournir le medium, les règles et les protocoles pour échanger linformation. Permer linteroperatibilité des données avec dautres données. Homogeneise linformation en vue de son intégration à un système mondial

Darwin Core Facilite léchange dinformation à propos des occurrences géographiques des espèces et lexistence des spécimens dans les collections. Pertinent pour les collections dhistoire naturelle.

Darwin Core Schéma simple, adapté aux données sur fichiers plats. 46 éléments regroupés dans 7 catégories : Record level, taxonomic, identification, locality, collecting event, biological, reference. Liste des champs sur : nCoreDraftStandard nCoreDraftStandard

ABCD Projet BIOCASE Standard déchange de données sur les spécimens et les données dobservation. Plus complexe que Darwin Core (1200 élements). Site internet :

Biocase Logiciel mettant en correspondance une source de données avec un standard choisi. Produit : Fichier XML formaté et exploitable

Démonstration Base de données Biocase / ABCD XML

Integrated Publishing Toolkit (1.0)

Présentation générale de lIPT Introduction Fonction dans le réseau GBIF Resources Caractéristiques Fonctionnalités Une plate-forme pour faciliter la décentralisation Sommaire

Démonstration Configuration Publication de métadonnées Publication de données Web application, interfaces Sommaire

Une web application Java open-source : Connecter et publier 3 types de données de biodiversité : - Données primaires - Information sur les espèces - Métadonnées sur les ressources À partir dune source de données - Base de données - Fichier plat Pour rendre ces données visibles sur le réseau distribué du GBIF LIPT est…

Un composant du réseau GBIF

Ressources Documentation et téléchargement Demo site Version 1.0 disponible depuis le 31/03/2009 Lead developer Markus Döring, Senior Software Engineer, GBIF

Caractéristiques Web application multilingue Contient un serveur de géolocalisation Gestion de rôles Base de données embarquée Supporte lutilisation de fichiers texte (.csv) Utilisation de vocabulaire pour limiter les termes Utilisation dextension pour Darwin Core Vérification de la qualité de données basique Utilisation didentifiant unique (uuid)

Utilisation des wrappeurs Scénario original Les wrappeurs exposent les bases de données aux requêtes

Utilisation des wrappeurs Scénario fréquent Une copie de base est utilisée pour la publication des données Souvent sur une machine de moins bonne qualité (perte de performance) Souvent non mise à jour (fraîcheur des données)

Récolte avec les protocoles existants Le fournisseur a un wrappeur TAPIR Ce wrappeur permet de récuperer 200 enregistrements par requete. Si la base contient 260,000 enregistrements à récuperer : 1300 request / responses 9 heures au total 500MB de transfert XML Seulement 32MB utiles à lindex Compressées en 3MB

Une fois définies, les vocabulaires sont accessibles à tous les utilisateurs de lIPT Contrôle du vocabulaire

Schéma extensible

Page daccueil paramétrable (1)

Page daccueil paramétrable (2)

Gestion de rôles Les users ne peuvent quexplorer les données Les managers ne gèrent que leurs données Possibilité de partager une même instance IPT

Senregistrer au GBIF

Gestion des extensions

Gestion des vocabulaires

Créer des métadonnées

Catégories de métadonnées Basic metadata Resource originator Geographic coverage Taxonomic coverage Temporal coverage IP Rights Research project information Methods Keywords

Mapping

Chargement des données Pendant le chargement, les données sont importées de la source (fichier plat ou base de données) Des statistiques sont calculés

Vue sur les ressources disponibles

Exploration taxonomique La taxonomie provient de la source de données Un premier niveau de contrôle de qualité de données est effectué

Résumé statistique

Graphiques

Contrôle de la qualité de données

Sortie XML

Web site: Data portal: GBIF Secretariat Universitetsparken Copenhagen Denmark Phone: Contact