Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre 2008 1 PRODIGUER un noeud français de distribution de données GIEC/IPCC Sébastien Denvil.

Slides:



Advertisements
Présentations similaires
Les technologies décisionnelles et le portail
Advertisements

STRATEGIE DONNEES MARINES Les données in situ Catherine Maillard, IFREMER/TMSI/IDM/SISMER SISMER Table Ronde RIO 29/11/2000 SISMER Systèmes dInformations.
Forum des utilisateurs des bases de données marines 23 novembre ème forum des utilisateurs des bases de données marines Ifremer Compte-rendu.
Présentation PTSC – Journée Take 5 – 6 février Le Pôle Thématique Surfaces Continentales Une structure nationale inter-organismes pour répondre.
Des programmes internationaux
Projet ORI-OAI Comité de pilotage Jeudi 17 décembre 2009 Bibliothèque de médecine.
Microsoft Office Groove Le contexte Une utilisation des postes de travail en très grande évolution chez les professionnels. Des lieux de travail.
Gestion de l'information
Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
Laboratoire d'InfoRmatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon.
22 permanents, 27 non permanents Objectifs de l'équipe: 1- Développement d'un modèle de circulation générale atmosphérique (LMDZ) et d'un modèle d'hydrologie.
NFE 107 : Urbanisation et architecture des systèmes d'information
École virtuelle - le 18 janvier ENCPB
« Modélisation du cycle du carbone et impact climatique »
Des services conçus pour les réseaux : Le Dossier Patient Partagé(DPP) Les espaces collaboratifs Plateforme Télésanté Pays de la Loire
Système de stockage réseaux NAS - SAN
DRIAS Le portail DRIAS : point d’avancement Comité des Utilisateurs
FrontCall - 4C Les Centres de Contacts Virtuels
Etude des Technologies du Web services
PAA-NIGERIA PRISE DE DÉCISIONS ÉCLAIRÉE Leçons, livrables et options durables CONFÉRENCE PAYS DU PAA « CÉLÉBRER NOS RÉUSSITES » DU 12 AU 16 NOVEMBRE 2012.
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
Pérennité du Secteur de la Réadaptation Physique:
Relation processus Anthony Tomat, Marcel Grosjean IG2PTB.
Construire un modèle numérique avec des élèves : exemple du cycle du carbone. Frédéric David, Agnès Rivière.
Lutilisation de la Cloudwatt-box Emmanuel Keller, CTO OpenSearchServer.
Le Travail Collaboratif ...
Constitution des bases de données. n Partenaires u Creatis u Liris/Systèmes dinformation communicants n Lot de travail situé entre le lot Applications.
J-L Dufresne Responsable du pôle de modélisation Pôle de modélisation de l'IPSL: travaux en cours en vue de la préparation du prochain rapport du GIEC.
Amélioration du parallélisme du code de climat de l'IPSL.
Table ronde Variation décennale du climat
Lyon, 24/04/2007 Ce que l'application a besoin de connaître: Paramètres physiques par scénario de 150 ans Nombre et numéro d'ordre des mois à effectuer.
LEGO EPISODE III LEGO: simulations climatiques avec DIET E.Maisonnave, V.Pichon.
France Grilles: plan stratégique version du 15 Novembre 2012.
Centre de Calcul de l'IN2P3 - Lyon Toulouse - Lyon, 21 décembre 2004 Les projets de grille au Centre de Calcul de l’IN2P3.
SI Recherche « Offre de services aux unités » Octobre 2013.
Bureau d’études Présentation du sujet Organisation des projets Version 1 8 octobre 2004.
Earth System Grid Federation
Modélisation du climat à l’IPSL: existant, objectifs et enjeux à 4 ans
Rôle des CI dans la démarche qualité
1Auteur : Oleg LODYGENSKY XtremWeb-HEP Atelier Opérations France Grille Lyon – Villeurbanne 13 et 14 octobre.
Pôle de modélisation de l'IPSL: simulations en vue de la préparation du prochain rapport du GIEC.
Journées du pôle de modélisation de Branville. Merci à Martine et Blandine et Jean-Louis pour l’organisation !!
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Sébastien Denvil Pôle de Modélisation, IPSL PRODIGUER un nœud de distribution.
Présentation rapide de l’état des outils IPSL Marie-Alice Foujols Octobre 2005.
Communications dans le domaine des postes
Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.
Contribution de l’IPSL au projet CMIP5
Le noeud de grille Tier 3 LAPP.
Soutenance de projet Mise en place d’une solution de reporting.
L’enseignement de spécialité SLAM
Point sur l'utilisation des moyens de calcul à court terme et stratégie à moyen terme Marie-Alice Foujols Pôle de modélisation du climat IPSL.
Ressources calcul 2008 GENCI PRACE IDRIS : brodie NEC SX-8 - vargas IBM Power6 CCRT : mercure NEC SX-8R - GIEC NEC SX-9 platine Bull Itanium / Nehalem.
Recapitulatif des sujets abordés Frédérique Chollet Fabio Hernandez Fairouz Malek Réunion LCG-France Tier-2s & Tier-3s Paris, 20 mars 2008.
HEPIX N. Neyroud 1.
Présentation de l’exercice Présentation de l’exercice Réalisation au CNRM Réalisation au CNRM Quelques résultats… Quelques résultats… Mise à disposition.
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
Cancer info Conseil d’administration du 19 mars 2010.
15 septembre Formation GBIF-France, MNHN
Calcul pour le spatial & le CC-IN2P3 Jean-Yves Nief (CC-IN2P3)
Présentation de la plateforme numérique collaborative dédiée aux acteurs de l’intégration 14 octobre 2015 – Préfecture à Melun.
Sciences à Cœur Sorbonne Universités Le climat : enjeux scientifiques et sociétaux #SciencesACoeur Jeudi 12 février 2015 Regards croisés autour de la confiance.
Retour d'expérience de l'utilisation du cloud comme infrastructure de service Guillaume PHILIPPON.
Roadmap opérations Revue fin 2013 Planification 2014 Visio opérations – décembre 2013.
Mésocentre ESPRI IPSL Importance des données pour la recherche à l’IPSL – Campagnes de mesure terrain – Observations satellites – Simulations Services.
1 Master Data Management au SANDRE. ADD 27/11/ Une philosophie de diffusion des référentiels 3 grands blocs dans les systèmes d’information environnementaux:
Présentation au conseil scientifique. Une e-infrastructure dédiée au traitement des données Infrastructure distribuée, par les utilisateurs, pour les.
Centre de Calcul de l’Institut National de Physique Nucléaire et de Physique des Particules Table Ronde : Quelles orientations pour le CC ? JP2015, Autrans.
Stratégie technique G. Mathieu – V. Breton. Stratégie vers les fournisseurs de services et de ressources France Grilles2 Jouer le rôle central dans le.
Transcription de la présentation:

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre PRODIGUER un noeud français de distribution de données GIEC/IPCC Sébastien Denvil Pôle de Modélisation, IPSL

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Le contexte : le compte à rebours du rapport GIECC/IPCC  Fin 2009  Automne 2010 : Simulations climatiques  Fin 2010  ? Distribution des résultats de simulations  Fin 2010  Début 2012 : Publications scientifiques  Début 2013 : Publication du rapport GIECC/IPCC AR5 (Assessment Report #5)  Octobre 2013 : Prix Nobel

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Plan de l’exposé Pourquoi Prodiguer : PROjet de Diffusion Internationale des données du GIEC AR5, Une plateformE pour la Recherche Le plan du PCMDI pour assurer la distribution de CMIP5 L’architecture Earth System Grid (ESG)

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Ordres de grandeurs Résolution couramment utilisée à l’IPSL : Atmosphère 2.5° (280 Km) : 144 x 143 x 19 Océan 2° (220 Km) : 180 x 149 x 31 Atmosphère 2.5° - Océan 2° : 11 GB/an, 300 ans  3,45 TB Atmosphère 1.0° - Océan 2° : 35 GB/an, 300 ans  10,25 TB Atmosphère 0.5° - Océan 0,5° : 210 GB/an, 30 ans  6,3 TB

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Impact d’une hausse de capacité Augmentation du nombre de simulations, développements du modèle, simulations d’ensemble, régionalisation … Augmentation d’un facteur 10 Atm 2.5° - Océan 2° : 3,45 TB  34,5 TB Atm 1.0° - Océan 2° : 10,25 TB  102,5 TB Atm 0.5° - Océan 0.5° : 6,3 TB  63 TB LMDz 0.5° (50 Km)

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Impact des avancées majeures Qualité: Amélioration de la couche limite atmosphérique, nuages, convection, physique océanique, nouveau modèle de glace, amélioration du modèle de surface, hydrologie … Augmentation d’un facteur 2-3 Complexité: Chimie atmosphérique (sulfates, ozone…), Biogéochimie (cycle du carbone, dynamique des écosystèmes) … Augmentation d’un facteur 10+

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Le facteur limitant et dimensionnant : le calcul 3 noeuds SX9 dédiés GIEC AR5 Équivalent de 91 processeurs SX8 Dédiées pendant 2 ans, disponible mi ans avec IPSLCM4_v2 (Atmosphère 2.5° - Océan 2°) 600 TB distribuable d’après les ratios ENSEMBLES 300 TB grâce à la compression

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre L’exercice GIEC : quelques chiffres AR 4 (Assessment Report #4), 2007  35 Terabytes, 77,000 fichiers  Quantité de données distribuée : 300 Terabytes fichiers.  Les groupes ont généré et exploité probablement 10x plus de données AR 5 (Assessment Report #5), 2013  Un facteur 20 à 40  Volonté de distribuer une plus grande proportion des données  La base de données doit être distribuée

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Gestion actuelle des données Principalement centralisée, stocké sur un san Accès OpenDAP pour les centres de calcul (dods) Système basique de récupération de données Accès à des données brutes Sécurité/Authentification/Restriction d’accès aux données : pas un problème Pas de post-processing à la demande Pas d’intégration des metadata Ne supporte pas les requêtes d’interrogation de haut niveau

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Gestion des données par Prodiguer Bouger les données un minimum, les garder proche des centres de calcul d’origine quand c’est possible  Protocole d’accès aux données, liens forts avec les centres de calcul Quand on doit bouger les données, le faire vite et avec un minimum d’intervention humaine  Management des ressources de stockage, réseaux rapides Garder une trace de ce que l’on a, particulièrement de ce qui est sur “deep storage”  Metadata et Catalogues de données Exploiter une fédération de sites  Intergiciel de grille  Grille de données

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Cas simple d’intercomparison Scénario Courant Scénario Futur Parcourir la base de données PCMDI centralisée Télécharger les données Organiser les données en local Regriller les données en local Faire les diagnostics Produire les résultats Rechercher, Interroger, Parcourir des données distribuées Site distant  Demande de données  Regrillages  Diagnostics Le portail renvoie le résultat

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre publications scientifiques basées sur l’analyse des données CMIP3 IPCC AR4 Downloads 300 TB fichiers 300 GB/jour (moyenne) Supporter l’infrastructure nécessaire aux communautés climats nationales et internationales. ESG procure une technologie cruciale pour accéder de manière sécurisé, monitorer, cataloguer, transporter, distribuer les données dans la grille d’aujourd’hui. 818 utilisateurs enregistrés 35 TB de données au PCMDI fichiers Expériences coordonnées par l’IPCC Données de modèles provenant de 11 pays. Portail CMIP3 IPCC AR4 ESG Objectif ESG Nov 2004 – Oct 2006 IPCC Téléchargements (10/12/06) Worldwide ESG user base Le Earth System Grid

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Evolution d’ESG Base de données centrales Archive centralisée de données traitées Agrégation temporelle Distribution par transfert de fichiers Pas d’implication dans l’analyse Portail orienté caddy de supermarché Connexion d’ESG au poste de travail orienté analyse (i.e., CDAT et CDAT-LAS) 2006 Test grandeur nature Metadata fédérées Portails fédérés Interface utilisateur unifiée “Quick look server-side” analyse avec CDAT Indépendant de la localisation Partage de données manuel Publication manuel Début 2009 Partage de données complet Fédération synchronisée  metadata, données Suite complète d’analyse “server-side” Intégration Modèles/Données ESG intégrée dans les postes de travail orientés analyse avec CDAT Intégration SIG Métrique d’intercomparison Support, maintenance … 2011 AR5, satellite, In situ biogéochimie, écosystèmes Archive de Données ESG Terabytes Petabytes AR4 Le plan de route ESG vers l’AR5

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Fédération de sites Earth System Grid

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Earth System Grid en 3 Tiers.

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Architecture Earth System Grid

Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre Conclusions PRODIGUER : projet déposé en septembre 2008 au GIS climat Dans le sillon METAFOR (FP7), IS-ENES (FP7) : standard de métadonnées, outils associés La solution distribuée est incontournable Mise en œuvre de ces outils au plan national et intégration à une grille européenne et internationale Doit se faire en étroite collaboration avec les centres de calcul nationaux