Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre 2009 1 Sébastien Denvil Pôle de Modélisation, IPSL PRODIGUER un nœud de distribution.

Slides:



Advertisements
Présentations similaires
Projet RNRT ICare: Services évolués de signature
Advertisements

Terminologie, propositions, repères Séminaire CPU / DES / ADBU Couperin Universités et communication scientifique : la problématique des Archives Ouvertes.
Mercredi 2 Décembre I.G.N. Saint Mandé Journée de linteropérabilité Forum OGC France «GPW airport scenario» Exemple de participation à un testbed.
Atelier sur les Archives Ouvertes mai 2012, Monastir, Tunisie Les Archives ouvertes et les archives institutionnelles. NEREUS : portail européen.
SITools Présentation de l’outil (1/2)
Applications de GdX Coordinateur thématique : Christophe Cérin
A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences.
Atelier THATCamp Paris mai Qualité de l'information, maintien collaboratif des ontologies, infrastructure mutualisée : quel socle technologique.
Praia,Septembre 2011 Session 7: Le stockage des données, la maintenance et la sécurité La experience: INE-cv United Nations Regional Seminar on Census.
ISP/ASP ISP ASP Conclusion DESS Réseaux 2000/2001
Stockage dans DIET Groupe de travail du 16 décembre 2002.
WP9: Applications Observation de la Terre Revue de lESA Partcipants: EU: Kyriakos Baxevanidis, K. Decker, S. Filippone, G. Samaras ESA: L. Fusco, J. Lindford,
Le point sur l’incubateur
NFE 107 : Urbanisation et architecture des systèmes d'information
SECURITE DU SYSTEME D’INFORMATION (SSI)
Par Sidi Mahmoud Aidara Mbibi
7 - EAI Les EAI : Enterprise Application Integration Marché
Informatique temps réel et réseaux de terrain – ELEC365
Framework Play 2.0 Démonstration du proof of concept
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks VO Fusion Pierrick Micout, CEA - DAPNIA.
J-L Dufresne Responsable du pôle de modélisation Pôle de modélisation de l'IPSL: travaux en cours en vue de la préparation du prochain rapport du GIEC.
MACROES A MACRoscope for Oceanic Earth System PI : Olivier Aumont, LPO, Brest Facts Facts - 7 participating labs, ~20 researchers involved - The funded.
LEGO – Rennes, 18 Septembre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de.
GDS – Paris, 13 Octobre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de M2RI.
31/01/2001Réunionn WP6-Y. Schutz (SUBATECH) 1 Simulation-Reconstruction ALICE Une application pour le TestBed 0 ?
Plan Définitions et exemples Composants de cluster
Earth System Grid Federation
Modèles et protocoles de cohérence des données en environnement volatil Grid Data Service IRISA (Rennes), LIP (Lyon) et LIP6 (Paris) Loïc Cudennec Superviseurs.
PROJET AssetFrame IT ASSET MANAGEMENT Demo.
SCIENTIX, la communauté de l’enseignement scientifique en Europe Scientix is funded with support from the European Commission under Seventh Framework Programme.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Observation des concentrations et flux d’azote atmosphériques
Modélisation du climat à l’IPSL: existant, objectifs et enjeux à 4 ans
Dyalog.Net Peter Donnelly Managing Director Dyadic Systems Toronto 30/10/2002.
Modèle et distribution des données (TWP1) Données CMIP5: Guillaume Levavasseur – Mise à disposition des données IPSL – Pérennisation et documentation –
1Auteur : Oleg LODYGENSKY XtremWeb-HEP Atelier Opérations France Grille Lyon – Villeurbanne 13 et 14 octobre.
Pôle de modélisation de l'IPSL: simulations en vue de la préparation du prochain rapport du GIEC.
ATELIER GENIE LOGICIEL
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
La technologie Shibboleth
Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.
Contribution de l’IPSL au projet CMIP5
Student Management Marks Gaston Berger University School Year Project on Mobile Application Development.
Les Web Services Schéma Directeur des Espaces numériques de Travail
Configuration LOOP Retour d’expériences P. CADULE, L. BOPP, P. FRIEDLINGSTEIN.
L’environnement Labo : Laboratoire de Physique des Particules d’Annecy-le vieux: LAPP (PP, Astro) Effectif du labo : 144 personnes Nombre d’IT : 76 dont.
A Pervasive Reminder System for Smart Homes Sylvain GIROUX and Simon GUERTIN Département d’informatique, Université de Sherbrooke 2500 boul. Université,
Réseau National pour l’Education , la Recherche et L’innovation
Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre PRODIGUER un noeud français de distribution de données GIEC/IPCC Sébastien Denvil.
Persistance de noyau dans les systèmes dynamiques à grande échelle
UNDP Regional Bureau for Africa MDG-based national Development Planning Training Workshop HIV/AIDS Assessments 10 March, 2006 Niger.
HEPIX N. Neyroud 1.
Historique L’évolution des architectures du début à nos jours.
Calcul pour le spatial & le CC-IN2P3 Jean-Yves Nief (CC-IN2P3)
Climserv à Polytechnique (X) CICLAD à l’UPMC
GAME - AUAT - CERFACS ENM-CIRED - GEODE GRECAU - IMT - ONERA Le projet ACCLIMAT a bénéficié d’une aide de la Fondation de Coopération Scientifique STAE.
Hébergement d’une infrastructure de Cloud Expérience d’un laboratoire Guillaume Philippon.
Retour d'expérience de l'utilisation du cloud comme infrastructure de service Guillaume PHILIPPON.
SYSTEMATIC PARIS-REGION Groupe thématique Ville Numérique Feuille de route.
Roadmap opérations Revue fin 2013 Planification 2014 Visio opérations – décembre 2013.
I nformatisation et N umérisation des A rchives D épartementales des P yrénées A tlantiques Avant projet sommaire.
Mésocentre ESPRI IPSL Importance des données pour la recherche à l’IPSL – Campagnes de mesure terrain – Observations satellites – Simulations Services.
Réunion EGEE France 11/6/2004Page 1Rolf Rumler Structure de l’exploitation d’EGEE.
Grid au LAL Michel Jouvin LAL / IN2P3
Projet LCG: Vue d’Ensemble Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3 Rencontre IN2P3/STIC Grenoble, 25.
Grilles de recherche Veronique Donzeau-Gouge. 2 objectifs Renforcer la présence du CNRS dans ce domaine en liaison avec : L’Institut ST2I L’INRIA, Les.
Resource allocation: what can we learn from HPC? 20 janvier 2011 Vincent Breton Crédit: Catherine Le Louarn.
Stratégie technique G. Mathieu – V. Breton. Stratégie vers les fournisseurs de services et de ressources France Grilles2 Jouer le rôle central dans le.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
Transcription de la présentation:

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Sébastien Denvil Pôle de Modélisation, IPSL PRODIGUER un nœud de distribution des données CMIP5 GIEC/IPCC

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre En route pour CMIP5? Coupled Model Intercomparison Project (5) ‏ > 20 groupes de modélisation du climat > 50 expériences numériques > 86 simulations pour satisfaire aux expériences > 6500 ans de simulation > 750 TB d’archive “CORE” envisagée (peut être 1PB) Qui sait au juste combien de TB de simulations au total? Coordination de l’aspect données : PCMDI: Communauté CMIP5 BADC et WDCC: Communauté Climat Européenne et IPCC working group 2 et 3 (“mandat” IPCC-DATA.ORG)‏ 3 Décembre 2008: MoU Tripartite (PCMDI, BADC, WDCC)

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Earth System Grid - Center for Enabling Technologies Fournira une architecture capable de rendre visible des données hébergées sur des “data nodes” via des “gateways” Support à CMIP5 à travers des “modelling-nodes” et des “core-nodes”, le premier type hébergeant les données des groupes, et le second hébergeant le “core” data défini par CMIP5. Plusieurs “core-nodes” sont prévus, deux en Europe (BADC, WDCC), plusieurs aux Etats Unis et un au Japon. Le « core-data » défini par CMIP5 est un compromis entre les plus utiles pour l’inter comparaison et ce qui est faisable Rappel: 2 usages différents de CMIP5 “CORE” 1) CORE experiments et 2) CORE data (de toutes les expériences: CORE, Tier1 and Tier2).

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Calendrier ESG/CMIP5 2008: Design and implement core functionality: Browse and search Registration, Single sign-on / security Publication,Distributed metadata Server-side processing Early 2009: Testbed By early 2009 it is expected to include seven centres in the US, Europe and Japan: Program for Climate Model Diagnosis and Intercomparison - PCMDI (U.S.), National Centre for Atmospheric Research - NCAR (U.S.), Geophysical Fluid Dynamics Laboratory - GFDL (U.S.), Oak Ridge National Laboratory - ORNL (U.S.), British Atmosphere Data Centre - BADC (U.K.), Max Planck Institute for Meteorology - MPI (Germany), The University of Tokyo Centre for Climate System Research (Japan). 2009: Deal with system integration issues and develop production system. Summer 2009, hardware/software requirements will be provided to those that want to be Nodes. 2010: Modeling centres publish data : Research and journal articles submissions 2013: IPCC Assessment Report #5

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre La Fédération Earth System Grid conduite par le PCMDI Données disponible auprès des groupes de modélisation (via ESG), et dans de multiples “CORE centres”. Plusieurs copies du “CORE data”; ESG et d’autres interfaces! Tout les centres qui fourniront des “core-data” ne rendront pas disponible le reste au sein de la fédération de sites. Si chaque couleur représente les sorties d’un groupe de modélisation, alors on peut voir que la structure est en hub, avec réplication au sein des noeuds centraux, et connections à des noeuds périphériques. Données disponible seulement auprès des groupes CORE (au moins)‏ TROIS COPIES

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Estimation du Stockage global des simulations IPSL Stockage brute borne basse  565 TB Stockage brute borne haute  1000 TB Distribution CMIP5 (25-50%)  ( ) ( ) TB Stockage global  TB LMDz 0.5° (50 Km)

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Gestion des données depuis des années Principalement centralisée, stockée sur un san Accès OpenDAP pour les centres de calcul (dods) Système basique de récupération de données Accès à des données brutes Sécurité/Authentification/Restriction d’accès aux données : pas un problème Pas de post-processing à la demande Pas d’intégration des metadata Ne supporte pas les requêtes d’interrogation de haut niveau

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Gestion des données par Prodiguer Bouger les données un minimum, les garder proche des centres de calcul d’origine quand c’est possible  Protocole d’accès aux données, liens forts avec les centres de calcul Quand on doit bouger les données, le faire vite et avec un minimum d’intervention humaine  Management des ressources de stockage, réseaux rapides Garder une trace de ce que l’on a, de ce qui est sur “deep storage”, suivi des accès  Metadata et Catalogues de données Exploiter une fédération de sites  Couche logicielle Earth System Grid

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Fédération de sites Earth System Grid

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Earth System Grid en 3 Tiers.

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Architecture Earth System Grid

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Publication des données par les “data nodes”

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre ESG Data Node Publisher GUI

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Conclusions Étroite collaboration avec les centres de calculs Espace de stockage adéquate (cache système, disponibilité des fichiers) Interconnections des centres de calcul (utilisation croisée des données) Logiciel de Tiers3 ESG sur les centres  Installation couche logicielle  Ouverture de services

Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Perspectives La réponse Européenne à la prolifération des simulations de modèles climatique s’écrit en partenariat avec les américains du consortium ESG-CET. Venir en support de CMIP5 requiert un travail sur l’environnement logiciel, le stockage de données, leur manipulation, la distribution aux utilisateurs ET de décrire les simulations, leurs contextes, et les données résultats.  Financement national (pour le stockage des données CMIP5/AR5), et le support au travail de distribution des données.  Un certain nombre d’initiatives de financement Européenne majeure, parmi lesquelles:  Financement CE pour développer les infrastructures:  METAFOR  IS-ENES (et d’autres financements nationaux en support d’IS-ENES).