Comment faciliter la ré-utilisation des données du Système d’information sur l’Eau Laurent Coudercy, Onema Pierre Lagarde, BRGM 24 juin 2016.

Slides:



Advertisements
Présentations similaires
> 1 Pôle INSIDE GIGE mars Un pôle d’innovation regroupant le BRGM et l’Onema Formalisé en 2014, pour répondre aux enjeux du système d’information.
Advertisements

© 2006 Les Éditions de la Chenelière inc., La gestion dynamique: concepts, méthodes et applications, 4 e édition1/14 Chapitre 4 : Le gestionnaire en tant.
GPA – 19 novembre Urbanisation : « ranger » le SIE GCiB – 16 mars 2010 F. Rougerie – Onema / DCIE.
Hub’eau.fr. J’ai une idée ! J’ai une super idée d’application mobile J’ai besoin de données sur l’eau Et y’a pleins de trucs sur eaufrance.
INSPIRE KEN workshop « schema transformation » Retours du séminaire 9-10 octobre Jean-Loup DELAVEAU CERTU Secrétariat COVADIS Ministry of Ecology, Sustainable.
CR Vie de Campus F. De Castelbajac, Directeur Système d’information de l’Université Paris Saclay description, avantages, difficultés Un exposé et discussions.
Refonte du portail eaufrance Présentation du cadre de référence pour avis GCIB – 14/10/2014 – Anne Macaire.
J.-L. QUEMARD, S.G.C.B SGCB Echanges d’informations en vue d’une mise en œuvre efficace de Bâle II Groupe des Superviseurs Bancaires Francophones, 7 mars.
L’EIAH AMBRE- ADD 1 Mise en place d’une personnalisation du logiciel à partir de profils d’apprenants Nathalie Guin Marie Lefevre Stéphanie Jean-Daubias.
Plateforme Expadon2 - SPS Export
SYNTHESE COLLECTE D’INFORMATION ET ORIENTATION
SYSTÈMES D'INFORMATION, TRANSITION NUMÉRIQUE ET FORMATION EN MANAGEMENT Journée d’études « Numérique et intervention sociale, un monde en mutation » Lyon,
Sylvain Hamel - Analyste
Hub’eau L. Coudercy, AFB GPA – 19 novembre
Du local à l'international
Google analytics.
COOPÉRER DANS LA TRANSITION ENERGÉTIQUE
Transferts à usages multiples (MPG)
Davide Canali Sr. Threat Analyst – Proofpoint Inc.
Proposition modèle économique bâtiment A7
Les Bases de données Définition Architecture d’un SGBD
Stratégies de résolution de problèmes (RP) en mathématique
Contribution: Revue des études, enquêtes et systèmes d’informations disponibles au niveau de l’INS, pour alimenter la méthode d’analyse et la cartographie.
Quelle stratégie pour renforcer l’environnement des startups?
FENIX Aperçu GLOBALE DU Système
Analyse Performance Chaine Energie + Problématique
Veille technologique Nassima Mahcer 17 MAI 2017.
Presentation title Convention-cadre sur les changements climatiques
Ouverture.
Virtualisation d’applications mobiles dans un réseau de Cloudlets
Analyse du bulletin officiel Structuration des sujets,
Présentation d’un annuaire partagé au sein du SIE LDAP GPA 2009/09/22
Dossier d’inscription Nom de l’équipe
Épreuve E5 Diagnostic opérationnel et proposition de solutions
PROGRAMMATION INFORMATIQUE D’INGÉNIERIE II
Institut Universitaire Virtuel de Formation des Maîtres
Regroupement contextuel de cimes dans les images aéroportées
DATA WEARHOUSE 1ère année LA: Technologies systèmes d’information
Branche Professionnelle des organismes de formation
Techniques de diffusion électronique : L’annuaire statistique
Les données sur l’eau à portée de clic
BADE (responsable UE : Pascal RIGOLET)
Les fondamentaux de la Data Science Théorie
ODP Application de gestion des événements Occupant le Domaine Public
ATELIER 1 Comment les utilisateurs voient l’évolution de la stratégie de l’IGN vers l’Open Data ? Pauline Dumontet, Vincent Liebard, François Perrussel-Morin.
L1 Technique informatique
Territoire Intelligent Nom Projet : Sponsor(s) / Défis :
A l’aide du triangle pédagogique de Jean Houssaye
Les données du SIE Juin 2014.
Comment penser une organisation ?
Les Sciences Physiques
Députe-Bourgmestre de Namur
Un Mécanisme d‘Adaptation Guidé par le Contexte en Utilisant une Représentation par Objets Manuele Kirsch Pinheiro Laboratoire LSR – IMAG, Équipe SIGMA.
Y-a-t-il des avantages à intégrer un jeune réseau ?
Le pôle INSIDE Le numérique au service de l’environnement
Sécurité et santé au travail et activités de l'OIT
Numérique et Sciences Informatiques
projets en terminale Ssi …
Démarrage du projet Préparer les fonds de plan
Groupe de travail « Gestion des données de l’université »
La validation du projet
Numérique et Sciences Informatiques
GT informatique phase 1 Atelier informatique phase 2
Evolutions en matière de Systèmes d'information de santé (SIS) Jacques Sauret Chef de la Mission pour l'informatisation du système de santé Ministère.
Objectifs personnels Mettre les élèves en situation de création
Point d’information RNT
JOUR 1: Redevabilité et Transparence des Acteurs de la Santé
Conférence Témoignage-Métiers
Projet de Fin d'Études SEGUIN Pauline et SIMON Raphaëlle
Les données structurées et leur traitement
Transcription de la présentation:

Comment faciliter la ré-utilisation des données du Système d’information sur l’Eau Laurent Coudercy, Onema Pierre Lagarde, BRGM 24 juin 2016

Le SIE, un système d’information partenarial, de plus de 20 ans Application SIE …

Les données sur l’eau

J’ai une idée ! J’ai une super idée d’application mobile J’ai besoin de données sur l’eau Et y’a pleins de trucs sur eaufrance

Je cherche les données !

Et des services Web !

Le constat Emis lors du hackathon 2014 sur le SIE et issus de réflexions diverses Ma courbe d’apprentissage

hub’eau.fr, dans le cadre d’un PIA

La problématique : comment passer des données lisibles par le SIE Application SIE SIE ?

La problématique : comment passer des données lisibles par le SIE Application SIE SIE à des données lisibles par tous

dans le SIE Application SIE flux accès près de chez soi fichiers hub’eau difficultés d’usage consultation grand public professionnels relations entre machines hubeau.fr

les 4 thèmes disponibles actuellement taille et espèces poissonsservices publics d’eau et d’assainissement niveau des nappeschimie des cours d’eau

Un hackathon à mi parcours (1 er juin 2016) pour tester et corriger les API hubeau.fr

Big Data et Hub’eau … … Réferentie ls SIE Quadrige SIE Naiades SIE Ades SIE SIE 200 types de données200 types de données 40 ans de données40 ans de données 40 millions de données/an40 millions de données/an api.hubeau.fr Accès unifié et adapté Hackathon Juin Infrastructure BRGM

Les objectifs Hub’eau sur les 4V Volume Intégrer toutes les données sur l’eau en France en gérant la mise à l’échelle des infrastructures techniques et des applications Variété Velocity Veracity Etre capable de gérer la diversité des données définies dans le cadre du SIE (plusieurs centaines de concepts, dizaine de modèles de données,…) Pouvoir intégrer les données au fil de leur publication par le SIE que ce soit des données mise à jour annuelle ou quotidiennement Intégrer des données externes comme les statistiques des utilisateurs Faire confiance au processus qualité du SIE

Les verrous de l’accès aux données distribuées Comment exploiter l’interopérabilité et l’organisation distribuée des données du SIE avec les besoins d’accès rapide de HUB’EAU ? Comment (re)mettre à disposition les données à jour diffusées par les producteurs du SIE et les croiser ?

Les solutions envisagées Stratégie de proxy Stratégie de BD Centrale Projet SIPE/SICE Projet SEEE

Approche retenue Combiner les deux stratégies en : Exploiter les services d’accès aux données du SIE et leur normalisation Mettre en œuvre des mécanismes pour « absorber » les données Eau continuellement et les conserver dans un cache local sans les dénaturer de leur structuration Ne pas chercher à « structurer » une base centrale imposée mais accepter les données en tant que telles

> 22 Architecture applicative Ecosystème Hadoop V2.X

Le processus Big Data dans Hub’Eau

Exemple du processus Données piscicoles

Exemples de traitements opérés Transformation Lignes / Colonnes pour simplifier l’accès Précalcule le croisement des données avec les référentiels géographiques et non géographiques (UDF Hive) Réalise les produits cartésiens pour optimiser les traitements (dénormalisation) (UDF Hive + Spark ) « Sélection » des données pour l’API (UDF Hive) Indexation pour la recherche de l’API (Sol’R)

Un data lake pour aller plus loin Etape 1 : Mettre en oeuvre un environnement BigData en capacité de collecter, stocker et traiter simplement toutes les données sur l’eau Etape 2 : Constituer le data lake et partager les expériences dans le domaine « Big Data » Etape 3 : Ajouter des données en « temps réel » Etape 4 : Explorer les données avec des technologies de science des données (Machine Learning)

Conclusion Les données sur l’eau sont un domaine pour le Big Data HUB’EAU montre que le Big Data peut être une réponse à des verrous bloquants Des technologies récentes avec des challenges techniques et organisationnels importants Un sujet / terrain très prometteur pour les datascientits