Alimentation différentielle de Naïades via services Web suivi d’un début de retour d’expérience sur les architectures de synchronisation de données à base.

Slides:



Advertisements
Présentations similaires
24/05/2016 SHAREPOINT USER GROUP Quel SharePoint User Group voulons-nous?
Advertisements

Gestion de la concurrence avec Entity Framework Développement d’application avec base de données Chapitre 23 Hugo St-Louis – Automne 2015.
AUDIT Formuler des réponses aux recommandations TRAINING LAF 2009.
GROUPE RESTANT PROCÉDURE PRATIQUE. CONTEXTE GÉNÉRAL Les formations certifiées seront clôturées le 30 juin 2016 Les personnes en absence justifiée pour.
Page 1 Un scénario ? = une trame, des phases ou étapes, abordant diverses activités & processus = « ce que l’on donne » / « ce qu’ils font » / « pour quelles.
Démarrage d’un dispositif de connaissance des démarches de contrôle qualité des banques de données du SIE.
Les sauvegardes Pourquoi sauvegarder ? Que sauvegarder ? Quand sauvegarder ? Ou sauvegarder ? Et comment ?
Les systèmes d'information 1- Une pratique quotidienne 2- Les données 3- Approche conceptuelle 4- Notion de serveur 5- Conception d'un système d'information.
Gestion des données issues des réseaux de mesures de la qualité : densification et besoin de flexibilité SIG, Géo-traitements.
Le socle commun : des pistes pour la technologie Plan de la présentation : - Introduction - Contexte (socle commun et document eduscol) - Repérage des.
1 Contrôle des données stations. GPS 20/11/ Objectifs et état des lieux Objectifs: –Contrôler la qualité des données stations des agences avant.
GPA – 19 novembre Urbanisation : « ranger » le SIE GCiB – 16 mars 2010 F. Rougerie – Onema / DCIE.
TRAAM Académie de Limoges1 TRAvaux Académiques Mutualisés Comment intégrer à l’enseignement de la technologie les services mis à la disposition des élèves.
Acquisition Multicanal
Module S41 Chapitre 11  Configuration de Windows XP Professionnel pour l'informatique mobile.
Sommaire de la présentation
PRESENTATION LETTRE SUIVIE
AMUE – SIFAC Intégration Fichier Mouvements BDF
Choisir le bon format de visualisation pour réussir sa dataviz
Mise en place d’un système de partage de fichiers
Plateforme de tests flux et services du SIE (O-WS)
Phase 3 Architecture collaborative Y. Stroppa – A. Ly – F. Badin
Le suivi évaluation : de quoi s'agit-il et à quoi cela sert-il ?
Je collecte l’information Je mets en place une veille informationnelle
Stratégie de maintenance
Naïades Portail national d’accès aux données sur la qualité des eaux de surface continentales.
Le processus de vente CARTEMANIA PREMIUM
Atelier sur la gestion de projets (collectifs)
de la productivité individuelle au travail collaboratif
Le Répertoire National des Structures de Recherche – RNSR
Quels outils collaboratifs pour mon association ?
Gestion des habilitations
Tables référentielles
Points d’actualité Olivier GRAS
ETUDE ET OPTIMISATION DU TRANSFERT DE L’INFORMATION VIA UN RESEAU DE
Contrôles des données Application aux données d’hydrométrie
Chiffrement de bout en bout
Profils d’emplois JT du 24 septembre 2001
Compte-rendu des réunions de travail Groupware du 29/05
Besoins de coordination Naïades - SEEE
Cyber-Sphinx Séance 2.
le plan de continuité d’activité ( le pca )
Strategic Roadmapping / La feuille de route stratégique
Le Plan National Canicule 2017
Échange de données informatisé (EDI)
Conception des SIG Entre construction théorique et mise en œuvre opérationnelle.
Différence entre mail et SMS. Avantages du mailing SMS o Forte interactivité entre le client et l’entreprise communicante o Permet de toucher tous les.
SYSTEME DE MANAGEMENT DE LA QUALITE : LA NOUVELLE NORME ISO 9001 version 2015.
Les données sur l’eau à portée de clic
COPIL EAUFRANCE Anne Macaire
LE RÉFÉRENTIEL LES 4 BLOCS DE COMPÉTENCES
Application par la composition de micro-services
OPPSARCOW 22/06/2015.
Nouveaux programmes de Bac pro
Réunion des directeurs
Utilisation d’ATRIUM : Retour d’expérience au CC
SCM Supply Chain Management.
COLLOQUE DES EDUCATEURS
La création de notices d’exemplaires
Épreuve E6 - Parcours de professionnalisation EXTRAITS
ORGANISER DES MANIFESTATIONS SCIENTIFIQUES A LA SFA
Tableau de bord d’un système de recommandation
Merise le modèle de traitement
Reprise des données BOMs pour le SIE Prévisions 2012 J. CHATAIGNER – F
Boulain Joris, Handouz Yassine, Regnier Fabien, Giraud Antoine
Présentation PISTE pour les partenaires raccordés en API
DONNÉE DE BASE QM Manuel de formation. Agenda 2  Introduction  Objectif de la formation  Données de base QM: Caractéristique de contrôle Catalogue.
Libramont – 29 juillet Intro faite par Emmanuel Grosjean (5 à 10 min) - contexte général et création du référentiel - Présentation brève du collectif.
UX DESIGN User exprérience en anglais Expérience Utilisateur en français Concevoir, Créer, dessiner UX DESIGN, consiste à penser et concevoir un site web.
Transcription de la présentation:

Alimentation différentielle de Naïades via services Web suivi d’un début de retour d’expérience sur les architectures de synchronisation de données à base de flux entre composants du SIE U. Clain – A. Mauclerc GPA 27/06/2017

2 sujets à traiter distinctement Projet Naïades : Identification d’une tâche de conception (2017) débouchant sur une mise en œuvre (2018) afin de basculer, pour au moins quelques agences, d’une alimentation totale en « annule et remplace » via échange de fichiers à une alimentation différentielle via Web Services Besoin opérationnel, visant à fluidifier les échanges et surtout à aller au devant de problèmes de volumétrie Début de retour d’expérience générique Sur la mise en place d’architectures de synchronisation de données sur la base de flux (WS) entre composants du SIE Sur la base du cas Naïades ainsi que de 2 autres cas en place, à savoir la synchronisation Interlocuteurs ARCADE et les échanges QESOUT sur ADES

Naïades

Contexte et objectifs Contexte Objectifs de l’action Alimentation des données physico-chimiques dans Naïades Proposer un processus de collecte des données métier selon un scénario stable, pertinent et performant  ouverture sur une discussion plus générale que Naïades seule Objectifs de l’action Fluidifier / optimiser les processus d’alimentation  automatisation visée Disposer d’un système capable d’encaisser la forte volumétrie de ces données  mode différentiel visé Objectifs du document et de la présentation Souligner les orientations / pré-choix faits par l’équipe projet, argumentaire inclus, afin de les valider et s’assurer de leur faisabilité / pertinence avec les principaux intéressés Faciliter les travaux induits (écriture de CdC chez les fournisseurs, études techniques…)

Modes d’alimentation A noter Sujet principal de discussion Distinguer système d’acquisition et système d’import (le même pour tous les lots de données) Sur Naïades, choix volontaire de (contrairement à ADES) : Soit synchronisation par WS en mode différentiel Soit synchronisation par dépôt de fichiers CSV en mode annule et remplace (sur une plage de temps données) Système de dépôt de fichiers CSV conservé pour les envois massifs et pour les producteurs ne pouvant basculer sur le WS

Aspects temporels A noter Appel préalable (non mentionné ici) du SANDRE pour actualisation des stations (référentiel) Récupération des données en asynchrone (simulé par polling) Estimatif Délai max d’une semaine entre mise à disposition par le producteur et diffusion Délai moyen de 7h entre acquisition et diffusion (temps de traitement)

Choix d’architecture et points de vigilance éventuels Format d’échange : QUESU 3.1 Raison : Version 2 ne prend pas en charge le différentiel et v3.0 implémentée par personne Protocole d’échange : SOAP : à débattre et confirmer avec le SANDRE versus des échanges Restfull Raison : Le QUESU V3.1 impose une implémentation du WS en SOAP Sécurité : HTTPS recommandé Raison : peu de criticité (données non confidentielles) mais facile à mettre en place et évite des attaques possible de type MITM ou Spoofing d’IP

Choix d’architecture et points de vigilance éventuels Asynchronisme : Asynchrone obligatoire : proposition de l’équipe projet Précision : implémentation de la méthode 2 du service monitoring 2.1 : getDataASync() Raison : délai de traitement côté WS producteur au vu du volume potentiel de données Alerte : pas de pagination dans le scénario d’échange, ce qui laisse courir un risque, même en asynchrone et différentiel ! Compression des flux : GZIP : le protocole HTTP ne permet que de le demander « de préférence » mais proposition de l’équipe projet de le rendre obligatoire à l’implémentation Raison : volume potentiel des échanges

Choix d’architecture et points de vigilance éventuels Mode différentiel : Obligatoire : proposition de l’équipe projet Précisions : passe par l’envoi de la dernière date de synchronisation à comparer aux dates de MAJ des objets en bases producteurs, et par l’utilisation de la balise <Action> (sans cela, rejet des objets retournés) Raison : volumétrie des données échangées Granularité minimale des échanges différentiels : L’Opération (au sens SANDRE) Raison : bon compromis entre objet traçable en différentiel dans les banques producteur et volumétrie max induite par ce type d’objet Vigilance : afin d’identifier de façon unique une opération (l’objet élémentaire de toute transaction), Naïades s’appuiera sur le cdStation, le support, la date et l'heure. Cette clé multiple devra être suivie chez chaque producteur. Par ailleurs, toute modification d’un de ces attributs se répercutera, non pas comme une modification côté Naïades, mais comme une suppression + ajout sous la nouvelle clé.

Début de retour d’expérience sur les architectures de synchronisation de données à base de flux entre composants du SIE

Expériences actuelles Synchronisation Interlocuteurs AE  ARCADE Synchronisation QESOUT sur ADES Synchronisation QESU sur Naïades

Synchronisation Interlocuteurs AE  ARCADE Direction et déclenchement Synchronisation bilatérale (modifications possibles de part et d’autre du système)  complexité Appel de l’AE vers ARCADE, soit à chaque modification, soit à pas de temps régulier Protocoles et formats : Uniquement via services Web (pas de dépôt institutionnalisé de fichiers ni XML ni CSV) Scénario INC Mode de mise à jour : Différentiel sans balise « Action » Cas de suppression inexistant (gel des objets) donc uniquement notion de mise à jour Granularité : Interlocuteur (objet référentiel donc plus simple) Souplesse du système : Pas de découplage des processus d’acquisition et d’import : problématique Appels synchrones mais paginables Appel des producteurs vers l’organe central : risque d’engorgement

Synchronisation QESOUT sur ADES Options à la disposition du producteur Dépôt de fichier En annule et remplace sur un plage de temps spécifiée En différentiel Appel du service QESOUT

Synchronisation QESOUT sur ADES Direction et déclenchement Synchronisation unilatérale du producteur vers ADES Protocoles et formats : Dépôt de fichiers (fichier XML) ou appel du service Web Monitoring Scénario QESOUT V2 Mode de mise à jour : Annule et remplace sur une plage de temps spécifiée à l’envoi Différentiel via balise Action Granularité : Prélèvement (objet non référentiel donc obligation de disposer d’un identifiant stable) Gérer les suppressions spécifiquement Souplesse du système : Découplage des processus d’acquisition et d’import : atout (WS) Appel d’ADES vers les producteurs : possibilité de mieux séquencer les appels Idée intéressante de rendre les actions « idempotentes » (best practices en Event Sourcing)

Tentative de synthèse Sur les synchronisations unilatérales déjà (cas majoritaire) Protocoles et formats Synchronisation via WS ET conservation d’un système de dépôt de fichiers (au moins dans le même format que l’échange WS) semble un bon compromis : sans trop de surcout Mode de mise à jour Différentiel Au niveau scénario, capitaliser sur ce qui est fait sur le QESOUT v2+ et QESU v3+ avec en complément : Gestion de la pagination Définir, peut-être dès le scénario, le niveau de granularité visé, et son identification si non référentiel Idée de rendre les actions idempotentes à creuser Souplesse des systèmes Découplage Acquisition / Import très intéressant De manière plus globale, découplage des flux à plusieurs endroits préconisés (cf. dernière slide) Privilégier les appels du consommateur vers le producteur (meilleure gestion des conflits et des charges) si lien direct entre les 2 Autres HTTPS et GZIP à ancrer : simple à mettre en œuvre et important dans certains cas

Ouverture : architecture prometteuse Issue du CDC (Change Data Capture) et des approches de type Reactive Stream Principes : Découplage complet entre émission des modifications par les producteurs, et consommation par les « abonnés » Outil de Change Data Capture outillant les bases à « surveiller » et transformant les modifications en événements Outil central offrant un mécanisme de PubSub (Publication / Abonnement) Principes anciens, mais maturité récente des solutions sur étagère CDC Producteur 1 Modifications DEBEZIUM Change log Publish Subscribe CDC Producteur 2 Modifications DEBEZIUM Change log KAFKA Banque centrale CDC Producteur 3 Modifications DEBEZIUM Change log