Chaîne de calcul IPSL - niveau 2 avril 2013

Slides:



Advertisements
Présentations similaires
Active Directory Windows 2003 Server
Advertisements

Master Professionnelle Sciences et Techniques 2 juillet
Autorisations Utilisation eCATT
Les changements climatiques dus aux activitées humaines. Le changement climatique: une prévision théorique 19 ème siècle: découverte du rayonnement infrarouge,
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
Active Directory Windows 2003 Server
Formation au module Structure de ZENTO
IPSLCM5 Couplé « physique » NEMO bleu : océan
Mars 2013 Grégory Petit
Mise en place de diagnostics pour ORCHIDEE version off-line Scripts de lancement et atlas Rachid Benshila, IPSL 01 Octobre 2003.
Estimations des changements climatiques dus aux activités humaines. Jean-Louis Dufresne CNRS / IPSL / LMD Laboratoire de Météorologie.
Atelier ADOMOCA Nov 2007 Hervé Le Berre Larborescence du projet Mocage.
DeltaPROD Suivi des interventions Gestion de configuration
Ressources calcul 2014 Demandes d'heures DARI et PRACE 2 septembre 2013 Marie-Alice Foujols
Le Travail Collaboratif ...
Configuration de Windows Server 2008 Active Directory
F Copyright © Oracle Corporation, Tous droits réservés. Créer des programmes avec Procedure Builder.
EPID-CPI-ISAIP Philippe Bancquart - mise à jour 24/02/ page 1 Procédures stockées CPI-SQLServer.
@SSR – Installation des applications eduscol.education.fr/securite - février 2007 © Ministère de l'Éducation nationale, de l'Enseignement supérieur et.
Développer en C avec Eclipse Introduction Création d'un projet Ajout de fichiers Compilation Exécution Utiliser le débogueur Département dinformatique.
Chaîne de calcul IPSL - niveau 2 avril 2013
Chaîne de calcul IPSL - niveau 2 avril Plan Présentation du pôle de modélisation Présentation du modèle IPSL-CM5 Rappel du fonctionnement de la.
Chaîne de calcul IPSL - niveau 2 avril 2013
J-L Dufresne Responsable du pôle de modélisation Pôle de modélisation de l'IPSL: travaux en cours en vue de la préparation du prochain rapport du GIEC.
Amélioration du parallélisme du code de climat de l'IPSL.
Janvier 2010 ESCI.
Novembre 2008 ESCI.
Juin 2010 Groupe de travail Plate-forme. Le modèle couplé de lIPSL Contexte – Présentation – IPSL – Pôle de modélisation du climat et CMIP5 – Historique.
Jean-Louis Dufresne, Jean-Yves Grandpeix LMD/IPSL; CNRS/UPMC Introduction à la.
HPC et sciences du climat
CPL-IPSL, 24 novembre 2008 Odj: Aperçu des simulations requises dans le cadre de WGCM/CMIP-5 en préparation du prochain rapport du GIEC (AR5) Préparation.
Table ronde Variation décennale du climat
Les simulations : Nous avons réalisé, courant 2008, un jeu cohérent de simulations à 6 différentes résolutions horizontales avec exactement le même modèle.
Grandes bases de données sur le système climatique 20 février 2012
Point sur le modèle couplé IPSL (CM et ESM)
Module 5 : Publication de ressources dans Active Directory
Etats des lieux (un début …) sur lergonomie de Méso-NH Soline Bielli Réunion Méso-NH 11 mai 2010.
L'outil MOCAGE-PALM au Laboratoire d'Aérologie
Programmation Système et Réseau (sous Linux)
Plateforme de modélisation de l'IPSL : présentation et point sur la réalisation des simulations CMIP5 Foujols 1, M-A - Dufresne 2, J-L - Denvil 1, S. –
Version 2.2 Septembre 2008 ESCI. Accès au modèle système terre et Analyse des résultats IPSL - Pôle de modélisation du climat Le modèle système terre.
Gérer la sécurité des mots de passe et les ressources
Ressources calcul septembre 2014
Groupe 20 e -21 e siècles Bilan Enjeux Participation à la préparation du 4e rapport du GIEC Analyse des simulations de changements climatique.
PSI : actualités PSI : PRISM Sustained Initiative Accord de gré à gré entre CNRS, CERFACS, ECMWF, Met-Office, MPI-M et M&D pour poursuivre le partage d’expertise.
Point sur le modèle couplé IPSL (CM et ESM) Branville mai 2008 Marie-Alice Foujols Olivier Marti et groupes Cplipsl et Esci.
Point sur le couplé // CSPOLE 16 juin 2006 Marie-Alice Foujols - Olivier Marti.
Créer des packages.
Modélisation du climat à l’IPSL: existant, objectifs et enjeux à 4 ans
Master 1 ère année Sécurité des Systèmes Informatique 1 Gestion de modules  Un module est un morceau de code qui peut être chargé à la volée dans le noyau.
Pôle de modélisation de l'IPSL: simulations en vue de la préparation du prochain rapport du GIEC.
Journées du pôle de modélisation de Branville. Merci à Martine et Blandine et Jean-Louis pour l’organisation !!
Environnement des modèles Contraintes liées au parallélisme Utilisation de plusieurs machines Liens couplé/forcé.
NEMO dans le Pôle de modélisation du climat de l'IPSL
Septembre Accès au modèle système terre et Analyse des résultats IPSL - Pôle de modélisation du climat Le modèle système terre : de IPSLCM4_v1 vers.
Présentation rapide de l’état des outils IPSL Marie-Alice Foujols Octobre 2005.
MSDOL/PALM Atelier ADOMOCA - Toulouse novembre 2007 D. Cugnet.
Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.
Contribution de l’IPSL au projet CMIP5
Couplé parallèle Etat des lieux. Objectifs Couplé parallèle en production à l’arrivée de la nouvelle machine vectorielle IDRIS (entre février et avril.
Configuration LOOP Retour d’expériences P. CADULE, L. BOPP, P. FRIEDLINGSTEIN.
Point sur l'utilisation des moyens de calcul à court terme et stratégie à moyen terme Marie-Alice Foujols Pôle de modélisation du climat IPSL.
Ressources calcul 2008 GENCI PRACE IDRIS : brodie NEC SX-8 - vargas IBM Power6 CCRT : mercure NEC SX-8R - GIEC NEC SX-9 platine Bull Itanium / Nehalem.
L’arrivée des versions parallèles des modèles de l’IPSL Adapter les codes aux architectures multiprocesseurs des futures machines afin d’améliorer les.
Subversion.
Formation.
Installation du PGI – CEGID
Abes agence bibliographique de l’enseignement supérieur Les scripts.
Attente de cette réunion : redéfinir stratégie commune calendrier rappel demande IPSL février 2014 comparatif CMIP5/CMIP6, ressources et développements.
Cur ? Quo ? Commando ? Quando ? Quibus auxiliis ? ….
Transcription de la présentation:

Chaîne de calcul IPSL - niveau 2 avril 2013

Plan Présentation du pôle de modélisation Présentation du modèle IPSL-CM5 Rappel du fonctionnement de la chaine Surveillance de la chaîne de calcul Travaux pratiques personnalisés

Le pôle de modélisation du climat 80 personnes, coordinateur Jean-Louis Dufresne, dir adj IPSL Missions : Fédérer les études multidisciplinaires (scientifiques ou techniques) faisant intervenir les composantes du modèle de l'IPSL Identifier et coordonner les simulations de référence Fédérer et rationaliser les moyens, les développements techniques Animation scientifique Modèle climat : Atmosphère Océan et glace de mer Surfaces continentales Cycle du carbone Chimie IPSLCM5 Earth System Model Le modèle climat IPSL 3

Organisation du pôle de modélisation du climat Resp: J-L Dufresne; Bureau: L. Bopp, MA Foujols, J. Mignot Comité de pilotage Modeling platform (IPSL-ESM) Arnaud Caubel (LSCE) - Marie-Alice Foujols (IPSL) Data Archive and Access Requirements Sébastien Denvil (IPSL) - Karim Ramage (IPSL) Atmospheric and surface physics and dynamics (LMDZ) Frédéric Hourdin (LMD) - Laurent Fairhead (LMD) Ocean and sea ice physics and dynamics (NEMO, LIM) C Ethé (IPSL) - Claire Lévy - Gurvan Madec (LOCEAN) Atmosphere and ocean interactions (IPSL-CM, different resolutions) Sébastien Masson (LOCEAN) - Olivier Marti (LSCE) Biogeochemical cycles (PISCES) Laurent Bopp (LSCE) - Patricia Cadule (IPSL) Current and future climate changes Jean-Louis Dufresne(LMD) - Olivier Boucher (LMD) Paleoclimate and last millennium Pascale Braconnot - Masa Kageyama (LSCE) “Near-term” prediction (seasonal to decadal) Eric Guilyardi (LOCEAN) - Juliette Mignot (LOCEAN) Evaluation of the models, present-day and future climate change analysis Sandrine Bony (LMD) - Patricia Cadule (IPSL) - Marion Marchand (LATMOS) - Juliette Mignot (LOCEAN) – Jérôme Servonnat (LSCE) Regional climates Robert Vautard (LSCE), Laurent Li (LMD) Atmospheric chemistry and aerosols (INCA, INCA_aer, Reprobus) Anne Cozic (LSCE) - M. Marchand (LATMOS) Continental processes (ORCHIDEE) Philippe Peylin (LSCE) - Josefine Ghattas (IPSL)

Groupe de travail Plate-forme coordination M-A. Foujols, A. Caubel Ancien nom ESCI : Equipe Système Climat IPSL 40 personnes ( 15 régulières ) Missions : Organiser les développements techniques en accord avec les activités scientifiques du pôle Assurer le lien et la cohérence des développements entre les différentes composantes et le modèle couplé IPSLCM5 Support aux utilisateurs des modèles, liste entraide : platform-users@ipsl.jussieu.fr Documentation Animation technique, formations Veille technologique Organisation : 1 réunion/mois (Jussieu et LSCE) liste interne : esci@ipsl.jussieu.fr

forge.ipsl.jussieu.fr/igcmg 6

Plan Présentation du pôle de modélisation Présentation du modèle IPSL-CM5 Rappel du fonctionnement de la chaine Surveillance de la chaîne de calcul Travaux pratiques personnalisés

Le modèle climat de l’IPSL : IPSLCM5

IPSLCM5 Modèle du système Terre (ESM) Chimie tropo & aérosols (INCA) Émissions Physique – Transport Atmosphère (LMDZ) Surface (ORCHIDEE) Océan (NEMO) Glace de mer (LIM) Coupleur (OASIS) Climat global Utilisation des sols Carbone / CO2 (Orchidée, Pisces) Volcans Insolation Ozone strato. (Reprobus) LMDZ zoomé Climat régional 9

lmdz.lmd.jussieu.fr

http://www.nemo-ocean.eu/

Les grilles horizontales - couplage - 3 exécutables Atmosphère et surf. continentale (LMDZ - ORCHIDEE) 19 vert. levels coupleur (OASIS) Résolutions: Atm: 3.75°x2.5° (~350 km) Oce: 2°x2° reserré à l’équateur Océan et glace de mer (ORCA-LIM)

History of IPSLCM model since 2004 from IPSLCM4_v1 … NEC SX-9 2004 2005 2006 2007 2008 2009 2010 2011 Frozen IPSLCM4 for CMIP3/ IPCC AR4 Oasis3 : IPSLCM4_OASIS3 libIGCM : IPSLCM4_OASIS3 NEMO for ocean : IPSLCM5 iomput for ocean : IPSLCM5 Carbon configurations for CMIP3/AR4 LMDZ and Orchidee // IPSLCM4_v2 Carbon cycle included : IPSLCM5_v3 IPSLCM5A-LR : ready for CMIP5 Operationnal on vargas, titane (32 procs) Implicit usage of MPI/OpenMP IPSLCM5A-MR : 144x142x39 New physic : LMZ5B IPSLCM5B Increasing of resolution for ocean IO server Increasing of resolution for atm … to IPSLCM5A … New dynamical core for atm … and prepare the next generation

Modèles de l'IPSL pour CMIP5 LMDZ-ORCHIDEE-ORCA-LIM-PISCES-INCA-REPROBUS-OASIS IPSL-CM5A Modèle intégré du système Terre (ESM) IPSL-CM5B Idem IPSL-CM5A, avec modèle atmosphérique LMDZ5B IPSL-CM5A-LR Basse résolution atm: 3.75°x2°L39 oce: 2° L31 IPSL-CM5A-MR Moyenne résolution atm: 2.5°x1.25°L39 oce: 2° L31 IPSL-CM5B-LR Basse résolution atm: 3.75°x2°L39 oce: 2° L31

1 Pflops Curie 1 Tflops 1 Gflops

TOP 500 : nb de processeurs/cores

Eléments techniques : parallélisme, HPC Composantes seules : parallélisme MPI et mixte MPI/OpenMP utilisation de fichiers de forçages Couplé ou MPMD : 3 composantes au moins : coupleur, atmosphère, océan chacune MPI ou MPI/OpenMP avec nombre différent de tâches les serveurs d'IO ajout des composantes imbriquées : 5 exécutables ajout OpenMP en routine Codes écrits en Fortran, sauf exception Beaucoup de sorties NetcDF librairie IOIPSL serveur : XIOS : en attaché/détaché Grand challenge au CINES, SGI, > 2000 procs Couplé LMDZ 1/3°- OASIS -NEMO 1/4°

Evolutions prévues à court terme : Physique : nouvelle physique LMDZ Plus de résolutions, Pulsation et S Masson Des ensembles, S Denvil tests actuels Des simulations plus longues, P Braconnot Des modèles plus complexes à bon escient: ajout de la chimie A Cozic Plus grand nombre de processeurs : cœur dynamique de LMDZ sur grille icosaédrique, Y Meurdesoif Optimisations des IO, XIOS, Y Meurdesoif de l'ensemble de la chaine: modipsl/libIGCM, ...  Contraintes ressources calcul, données, réseau

Quelques Enjeux pour les simulations climatiques Des questions de plus en plus précises impliquant : de nombreuses échelles de temps et d’espace (global au local, quelques années à quelques décennies) Evolution des caractéristiques de la météorologies et de la variabilité climatique (heure à décennale) Couplages entre le climat et les cycles biogéochimiques (gaz à effet de serre, aérosols, cycle du carbone, utilisation des terres,…) GIEC (simulations coordonnées) : Ensembles de projections climatiques suivant différents scénarios socioéconomiques À 3° de résolution : 380 cœurs pendant 2 ans (exercice actuel) À 2° de résolution : 840 cœurs pendant 2 ans (exercice en cours) À 1/3° de résolution : 500000 cœurs pendant 2 ans (à venir?) Ensembles Résolution Calcul effectué pour machine type titane (correspond à nombre cœurs nécessaires à plein temps sur 2 ans CMIP5 LR : 380 cœurs pendant 2 ans. Atm : 96x96x39 – océan 182x149x31 – 32 cœurs CMIP5 MR : 840 cœurs pendant 2 ans Atm : 144x142x39 – océan 182x149x31 – 64 cœurs. CMIP5 GD : 500 000 cœurs pendant 2 ans. Atm : 768x768x39 – océan 1440x1200x40 – 2191 cœurs. Et plus en augmentant les ensembles, la complexité … Complexité

Plan Présentation du pôle de modélisation Présentation du modèle IPSL-CM5 Rappel du fonctionnement de la chaine Surveillance de la chaîne de calcul Travaux pratiques personnalisés

Environnement Récupération de la configuration Serveurs CVS/SVN Visualisation/comparaison des résultats Assemblage du modèle IOserver Modipsl Accés aux résultats Compilation LibIGCM Support Formation Machines Soumission/Exécution Description d’une expérience Documentation

(Version PDF disponible) Environnement Récupération de la configuration Compilation Soumission/Exécution Visualisation/comparaison des résultats Description d’une expérience Assemblage du modèle Modipsl Machines LibIGCM IOserver Support Formation Accés aux résultats Serveurs CVS/SVN Documentation Documentation : http://forge.ipsl.jussieu.fr/igcmg/wiki/platform/documentation (Version PDF disponible)

Le modèle climat de l’IPSL Définition : plateforme qui permet, sur les centres de calcul usuels : de récupérer des configurations de référence de compiler : les sources des différentes composantes les interfaces de couplage (océan-atmosphère) et le coupleur de réaliser une expérience type fournie (y compris fichiers entrée), de suivre son exécution, de produire et stocker des résultats bruts, de produire, stocker et rendre accessible des ATLAS et analyses systématiques 25

Deux centres de calcul privilégiés Calcul Ada (10 624 cores, 233 Tflops) : 332 nodes, 4 proc Intel Sandy Bridge 8-cœurs à 2,7 GHz (32 cores/node), 128Go/nodes (4Go/core) Turing (65 536 cores, 836 Tflops) : 4.096 nœuds de calcul, PowerPC A2 (16 cores/node), 16 Go/node (1G/core) Post Ada : 4 nœuds 4 proc Intel Westmere 8-cœurs à 2,67GHz (32cores/node), 1 To (32 Go/core)  Fichiers Gaya, transferts des fichiers dods : http://dods.idris.fr Assistance assist@idris.fr, 01-69-35-85-55 Infos www.idris.fr Calcul Curie NF (80 640 cores, 1,6 Pflops) 5 040 thin nodes, 2 proc Intel Sandy Bridge 8-cœurs à 2,7 GHz (16 cores/node), 64Go/nodes (4Go/core) Curie NL (11 520 cores) 90 fat nodes, 16 proc Nehalem-EX 8-cœurs à 2,27 GHz (128 cores/node), 512Go/nodes (4Go/core) Titane (12 768 cores, 140 Tflops) 1596 nœuds de calcul, 2 proc Intel Xeon 8 cœurs à 2,93 GHz (8 cores/node), 24 Go/node (3G/core) Post Curie NL, titane Fichiers $CCCWORKDIR, $CCCSTOREDIR, quotas : ccc_quota dods : http://dods.extra.cea.fr/work, http://dods.extra.cea.fr/store Assistance hotline.tgcc@cea.fr, 01-77-57-42-42 Infos curie.info

Configurations distribuées dans modipsl → Une configuration contient les sources des modèles, les outils de lancement basés sur libIGCM (driver et card) et les paramètres d'entrée Les configurations cohérentes avec IPSLCM5A : IPSLCM5A : Modèle couplé standard LMDZ-ORCHIDEE-NEMO-PISCES, utilisé pour CMIP5. Responsable A. Caubel et M-A Foujols LMDZOR_v4 : Modèle forcé LMDZ-ORCHIDEE. Responsable J. Ghattas. Même réglage que LMDZ4OR_v3. LMDZORINCA : Modèle avec chimie troposphère LMDZ-ORCHIDEE-INCA. Responsable A. Cozic IPSLCM5A_C : Comme IPSLCM5A mais avec des versions des composants différentes Responsable P. Cadule IPSLCM5B : Comme IPSLCM5A mais avec la nouvelle physique dans LMDZ. Responsable L. Fairhead Ces configurations sont figées et ne sont plus maintenues 27 27

Configurations distribuées dans modipsl → « La famille v5 » : Refonte des configurations pour améliorer le cohérence entre les différentes configurations et faciliter leur gestion/utilisation. Les réglages pour une composante restent les mêmes dans toutes les configurations dans la même famille. Les configurations dans la famille v5 : IPSLCM5_v5 : Correspond à IPSLCM5A et 5B. Responsables A. Caubel et M-A Foujols LMDZOR_v5 : Prend la suite de LMDZOR_v4. Responsable J. Ghattas LMDZORINCA_v5 : Correspond au LMDZORINCA mais les réglages ont un peu changé pour correspondre à IPSLCM5_v5. Responsable A. Cozic LMDZREPR_v5 : Avec chimie stratosphère LMDZ-Reprobus. Responsable J. Ghattas IPSLCM5CHT_v5 : Comme IPSLCM5_v5 avec INCA. Responsable A. Cozic IPSLCM5CHS_v5 : Comme IPSLCM5_v5 avec Reprobus. Responsable M. Marchand A noter : IPSLCM5CHT_v5 et IPSLCM5CHS_v5 sont des versions de travail et non des version de production 28 28

Configurations distribuées dans modipsl Autre configurations : NEMO : Modèle forcé de l'océan OPA-LIM-PISCES. Responsable C. Ethé. ORCHIDEE_TAG : Modèle forcé de surface ORCHIDEE, contient le dernier tag de ORCHIDEE (actuellement 1.9.6). Responsable J. Ghattas. ORCHIDEE_SVN_AR5 : Modèle forcé de surface ORCHIDEE, contient la version utilisée pour CMIP5 de ORCHIDEE. Responsable J. Ghattas. Recommandation générale : prévenir lors de nouvelles études basées sur une de ces configurations, en particulier pour les modèles couplés 29 29

Récupérer, compiler et lancer une configuration de type _v5 Accès à MODIPSL svn co http://forge.ipsl.jussieu.fr/igcmg/svn/modipsl/trunk modipsl Accès à IPSLCM5_v5 cd modipsl/util ; ./model IPSLCM5_v5 Installation des Makefiles cd modipsl/util ; ./ins_make Compilation cd modipsl/config/IPSLCM5_v5 ; gmake + resolution choisie Installation de l’expérience type (et post-traitements) cp EXPERIMENT/IPSLCM5/piControl/config.card . vi config.card ### JobName=MYEXP ../../util/ins_job ### recopie repertoire piControl dans MYEXP avec COMP, DRIVER, PARAM Soumission du Job de lancement cd modipsl/config/IPSLCM5_v5/MYEXP; ccc_msub Job_MYEXP llsumbmit Job_MYEXP 30

Modipsl Frontale LibIGCM LibIGCM Gestion des sources des composantes IPSL Serveur cvs/svn Connexion Récupération de la configuration Modipsl Compilation Frontale Description de la simulation LibIGCM Choix des réglages physiques Exécution/ lancement du run LibIGCM Calcul

Script de référence : AA_Job PeriodLength 32

Schéma de la librairie de scripts libIGCM EXP00 EXP00/COMP 33

Comment vérifier que cela s’est bien passé? MY_EXPERIENCE Message de fin de simu reçu run.card : PeriodState=Completed Fichiers sur le serveur de fichiers Post-traitements lancés puis finis ATLAS et monitoring sur serveur dods modipsl en décalé config IPSLCM5_v5 EXP00 Script_Output* run.card run.card.init config.card Job_EXP00 COMP PARAM DRIVER 35 35

Message en fin de simulation A la fin d’une expérience, vous recevrez un message de ce type : Objet : T05042013 completed Dear user, Simulation TEST201301 is completed on supercomputer curie5779. Job started : 25000101 Job ended : 25011231 Output files are available in /ccc/store/cont003/dsm/user/IGCM_OUT/IPSLCM5A/DEVT/piControl/TEST201301 Files to be rebuild are temporarily available in /ccc/scratch/cont003/dsm/user/REBUILD/IPSLCM5A/TEST201301 Pre-packed files are temporarily available in /ccc/scratch/cont003/dsm/user/IGCM_OUT/IPSLCM5A/DEVT/piControl/TEST201301 Script files, Script Outputs and Debug files (if necessary) are available in /ccc/work/cont003/dsm/user/CURIE/CMIP5/R99/IPSLCM5A_20120910/modipsl/config/IP SLCM5A/TEST201301 36 36

Arborescence sur serveur de fichiers IDRIS IPSLCM5A/DEVT/pdControl gaya: cd IGCM_OUT IPSLCM5A/DEVT/pdControl JobName ATM OCE MBG ICE SBG SRF CPL RESTART DEBUG MONITORING ATLAS TAR Output Analyse Fichiers archivés à la fréquence définie (PackFrequency) TS_DA TS_MO SE NCRCAT DA [HF] MO [INS] 37 37

Arborescences sur serveurs de fichiers TGCC cd $CCCSTOREDIR/IGCM_OUT cd $CCCWORKDIR/IGCM_OUT IPSLCM5A/DEVT/pdControl IPSLCM5A/DEVT/pdControl JobName JobName ATM OCE MBG ICE SBG SRF CPL RESTART DEBUG TAR MONITORING ATLAS Output Analyse Fichiers archivés à la fréquence définie (PackFrequency) TS_DA TS_MO SE NCRCAT DA [HF] MO [INS] 38 38

Simulations avec libIGCM : les options 2007 create_ts monitoring Job_EXP00 create_se atlas rebuild online RebuildFrequency=NONE, PackFrequency=NONE(ou absent), mode « DEBUG » ou « TEST » 2010 create_ts monitoring Job_EXP00 rebuild create_se atlas RebuildFrequency=1Y, PackFrequency=NONE, mode « Sans pack » (IDRIS-vargas) Job_EXP00 create_ts create_se atlas monitoring rebuild pack_restart pack_debug pack_output RebuildFrequency=1Y, PackFrequency=1Y, mode « Avec pack » (CCRT-TGCC et IDRIS-ada) 2012

Les utilitaires de pack pack_restart.job : archive, avec tar, les restart par période « PackFrequency » pack_debug.job : archive, avec tar, les fichiers debug par période « PackFrequency » pack_output.job : concatène, avec ncrcat, les fichiers output (netcdf) par période « PackFrequency » est lancé par le job de rebuild Une simulation de type historical (1850-2005) : 50 jobs de calcul (36 mois à la fois) 156 rebuild, 156 pack_output, 156 pack_debug, 156 pack_restart 16 create_se, 45 atlas, 500 create_ts, 30 monitoring

IDRIS tar ncrcat PackFrequency Job_EXP00 Job_EXP00 Job_EXP00 ada Calcul Job_EXP00 Job_EXP00 Job_EXP00 IDRIS PeriodLength PeriodLength PeriodLength $WORKDIR/REBUILD $WORKDIR/IGCM_OUT PackFrequency RebuildFrequency ada pack_restart pack_debug rebuild tar Post $WORKDIR/IGCM_OUT gaya : IGCM_OUT PackFrequency ada pack_output ncrcat Post gaya : IGCM_OUT TimeSeriesFrequency SeasonalFrequency ada create_ts create_se Post monitoring atlas gaya:IGCM_OUT dods.idris.fr

TGCC tar ncrcat Job_EXP00 pack_restart rebuild pack_debug pack_output Calcul Post titane, curie Job_EXP00 RebuildFrequency PackFrequency $SCRATCHDIR/IGCM_OUT PeriodLength rebuild $CCCSTOREDIR TGCC $SCRATCHDIR/REBUILD pack_restart pack_debug tar Post titane, curie TS et SE : $CCCSTOREDIR/IGCM_OUT/…  dods/store MONITORING et ATLAS : $CCCWORKDIR  dods/work create_ts create_se SeasonalFrequency $CCCSTOREDIR/IGCM_OUT monitoring atlas TimeSeriesFrequency pack_output ncrcat

quotas

Nombre de fichiers : historical Sans Pack Pack 1 an Pack 5 ans Output (ncrcat) 59 904 4 992 1 000 Analyse TS 1 700 Analyse SE 255 Restart (tar) 16 848 156 32 Debug (tar) 20 592 Exe 3 MONITORING (work) 400 ATLAS (work) 19 400 TOTAUX 121 000 7 262 3 019

Plan Présentation du pôle de modélisation Présentation du modèle IPSL-CM5 Rappel du fonctionnement de la chaine Surveillance de la chaîne de calcul Travaux pratiques personnalisés

1 : Suivi de la simulation 2 : Vérification, correction

Suivi de la simulation Il est indispensable de surveiller très régulièrement sa simulation !!! RunChecker : script (libIGCM) à lancer pour obtenir des informations sur l’état d’une (ou plusieurs) simulations. Rappel : une simulation historical : 50 jobs de calcul et près de 1000 jobs de post-traitements Documentation http://forge.ipsl.jussieu.fr/igcmg/wiki/platform/documentation/suivi

RunChecker : usage et options Le script RunChecker.job peut être lancé de n'importe où : path/to/libIGCM/RunCkecker.job [-u user] [-q] [-j n] [-s] [-p path] job_name -u user : lance le Checker sur la simulation d'un autre utilisateur -q : mode silencieux -j n : affiche n jobs de post-traitement (10 par défaut) -s : recherche d'une simulation non référencée $WORKDIR pour l'ajouter à son catalogue personnel de simulations avant d'afficher les informations -p path : pour donner le chemin !!!absolu!!! du répertoire contenant le config.card à la place du job_name. A donner une fois seulement. Ensuite le nom de la simulation suffit. Voir ~/.simucatalog.dat 1) path/to/libIGCM/RunCkecker.job -p $CCCWORKDIR/CURIE/CMIP5/R1414/IPSLCM5A_20120731/modipsl/config/IPSLCM5A/v5.rcp45CMR2 2) path/to/libIGCM/RunCkecker.job v5.rcp45CMR2

RunChecker : exemple de simulation OK

RunChecker : exemple de simulation à problèmes

Message signalant un problème : failed Si souci, vous recevrez un message de ce type : Objet : v5.historicalCMR5 failed Dear user, Simulation v5.historicalCMR5 is failed on supercomputer curie2024. Job started : 18500101 Job ended : 20051231 Output files are available in /ccc/store/cont003/dsm/user/IGCM_OUT/IPSLCM5A- MR/PROD/historical/v5.historicalCMR5 Files to be rebuild are temporarily available in /ccc/scratch/cont003/dsm/user/IGCM_OUT/IPSLCM5A- MR/PROD/historical/v5.historicalCMR5/REBUILD Pre-packed files are temporarily available in /ccc/scratch/cont003/dsm/user/IGCM_OUT/IPSLCM5A-MR/PROD/historical/v5.historicalCMR5 Script files, Script Outputs and Debug files (if necessary) are available in /ccc/work/cont003/dsm/user/CURIE/CMIP5/R1414/IPSLCM5A_20120731/modipsl/config/IPSLCM5A/v5. historicalCMR5 52 52

Suivi et correction (si problèmes) 1/ D’où vient le problème ? Job calcul (1 mail failed) Pb machine ? On regarde le Script_output_xxxx. Si pas de messages très clairs, on relance (clean_month): path/to/libIGCM/clean_month.job ccc_msub (llsubmit) Job_...

Suivi et correction (si problèmes) 2/ D’où vient le problème ? Job calcul (1 mail failed) : analyse du Script_outputxxxx ####################################### # ANOTHER GREAT SIMULATION # 1ère partie # DIR BEFORE RUN EXECUTION # 2ème partie # DIR AFTER RUN EXECUTION # 3ème partie http://forge.ipsl.jussieu.fr/igcmg/wiki/platform/documentation/ suivi#AnalysedelasortieduJob:Script_Output

Suivi et correction (si problèmes) 3/ D’où vient le problème ? Job calcul (1 mail failed) : analyse du Script_outputxxxx ####################################### # ANOTHER GREAT SIMULATION # 1ère partie # DIR BEFORE RUN EXECUTION # 2ème partie # DIR AFTER RUN EXECUTION # 3ème partie http://forge.ipsl.jussieu.fr/igcmg/wiki/platform/documentation/ suivi#AnalysedelasortieduJob:Script_Output

Suivi et correction (si problèmes) 4/ D’où vient le problème ? Job calcul (1 mail failed) : analyse du Script_outputxxxx ======================================================================== EXECUTION of : mpirun -f ./run_file > out_run_file 2>&1 Return code of executable : 1 IGCM_debug_Exit : EXECUTABLE !!!!!!!!!!!!!!!!!!!!!!!!!! !! IGCM_debug_CallStack !! !------------------------! IGCM_sys_Cp : out_run_file Debug/xxxxxxxxxxxx_out_run_file_error http://forge.ipsl.jussieu.fr/igcmg/wiki/platform/documentation/suivi#AnalysedelasortieduJob:Script_Output

Suivi et correction (si problèmes) 5/ --> Regarder en détail le sous- répertoire Debug (si il existe) Regarder le fichier xxxxx_error dans le répertoire Debug/ Contient le texte de sortie de LMDZ LMDZ s’arrête souvent dans hgardfou Stopping in hgardfou Contient les erreurs brutales de toutes les composantes Regarder les fichiers texte de sortie de NEMO, ORCHIDEE, INCA, OASIS Debug/xxxx_ocean.output Debug/xxxx_output_orchidee Debug/xxxx_inca.out Debug/xxxx_cplout

Debug 1/ Par ex : Plantage inexpliqué Dans Debug/out_execution : indices sur le modèle qui plante ? forrtl: severe (174): SIGSEGV, segmentation fault occurred Image PC Routine p25mpava_lmdz.x_2 0000000000EF005B Unknown p25mpava_lmdz.x_2 00000000006F293D Unknown p25mpava_lmdz.x_2 00000000006BB58F Unknown p25mpava_lmdz.x_2 0000000000477A6F Unknown p25mpava_lmdz.x_2 0000000000457C99 Unknown p25mpava_lmdz.x_2 00000000004568BC Unknown libc.so.6 00000034AB81ECDD Unknown p25mpava_lmdz.x_2 00000000004567B9 Unknown Compilation du modèle en mode « debug » Execution Si toujours rien, utiliser un débugueur (voir la documentation)

=> Travail d’harmonisation des systèmes de compilation en cours Debug 2/ Par défaut nous compilons les codes en mode « optimisé » (= « prod »). Pour pouvoir trouver l’origine des bugs, certaines options du compilateur sont utiles. La méthode « debug » est différente suivant les modèles : Pour ORCHIDEE et IOIPSL il faut modifier les options de compilation dans le fichier modipsl/util/AA_make.gdef #-Q- curie F_O = -DCPP_PARA -xHost -O3 -p -g -traceback -fp-stack-check -ftrapuv $(F_D) $(F_P) -I$(MODDIR) -module $(MODDIR) Après avoir modifié ce fichier, vous devez relancer la commande ins_make permettant la création des Makefile Pour LMDZ et INCA il faut modifier le fichier Makefile dans config/xxx/ en rajoutant l'option -debug ou -dev dans la ligne de compilation (cd ../../modeles/INCA3; ./makeinca_fcm -debug -chimie CH4 -resol (...) ../../bin/inca.dat ; ) (cd ../../modeles/LMDZ; ./makelmdz_fcm -cpp ORCHIDEE_NOOPENMP -debug -d (..) ../../bin/gcm.e;) Pour NEMO il faut modifier le fichier Makefile dans modeles/NEMO/WORK/Makefile F_O = -O3 -i4 -r8 –xHost -traceback -module $(MODDIR)/oce -I$(MODDIR) -I$(MODDIR)/oce -I$(NCDF_INC) $(USER_INC) A noter : Lorsqu’on débugue (mode « debug »), il peut être utile de diminuer l’optimisation qui est (-O3) en mode « prod ». => Travail d’harmonisation des systèmes de compilation en cours

Debug 3/ Par ex : Valeurs « étranges » dans un fichier de sortie Execution (1er niveau debug) Space name=TEST dans config.card, pas de pack, tout sur $SCRATCHDIR(curie) ou $WORKDIR(ada). Rebuildfrequency=1M ou 1 période dans config.card Execution (2ème niveau debug) Durée de simulation +Rebuildfrequency=1M ou 1 période (1M) dans config.card RUN_DIR_PATH=…/rep/debug sur le $SCRATCHDIR(curie) ou $WORKDIR(ada) + Jobtype=DEV dans Job_... Analyse dans dir : $RUN_DIR_PATH (Pas de rebuild (niveau expert !) : supprimer les fichiers outputs des cards)

Suivi et correction (si problèmes) 6/ Pb Job calcul : relance (après correctif éventuel) relance après clean_month : path/to/libIGCM/clean_month.job ccc_msub (llsubmit) Job_...

STOP (Fatal dans run.card) Pb !

Suivi et correction (si problèmes) 7/ Vous avez reçu 2 messages failed ou le RunChecker est anormal. Etudiez la situation : cas simple : Relancer un rebuild ou pack_debug ou pack_restart Relancer un pack_output cas plus compliqué : utiliser clean_year pour revenir à la date saine path/to/libIGCM/clean_year.job [SSAA] avec SSAA = année jusqu'à laquelle on efface tout (incluse). poursuivre la simulation

Refaire tourner un job de post-traitement Installer un répertoire dédié à cela par simulation Y copier : config.card, run.card, COMP, POST Y copier le job à relancer Modifier les paramètres de ce job pour qu'il traite la simu en question Voir documentation : http://forge.ipsl.jussieu.fr/igcmg/wiki/platform/documentation/suivi#Lancerourelancerlespost-traitements

Refaire tourner une simulation à l'identique Cela peut être nécessaire pour boucher un trou Trous évités : avec suivi régulier de la simulation ! avec arrêt du job de calcul par les jobs de pack si souci Les configurations actuelles sont reproductibles à l'identique, si fichier Bands identique. Voir trusting : http://webservices.ipsl.jussieu.fr/trusting/ Principe : mettre en place une simulation avec SpaceName=REDO faire tourner une période complète, pack inclus Repérer et recopier les fichiers de l'espace REDO vers PROD, et seulement ceux-ci Détails : fichier Bands fichier meshmask si océan RESTART 1 seul config.card SpaceName=REDO Dates Pas de TS ou SE PROD REDO

Suivi et correction (si problèmes) 8/ Tout s’est bien passé : Mail de fin de simulation Aucune anomalie RunChecker TimeSeriesChecker (et SE_checker) : vérifie les séries temporelles (SE) existantes propose de détruire les TS en double (même date de début) relance les jobs create_ts (create_se) nécessaires pour reconstruire les TS et SE manquantes. Rappel : les rebuilds lancent automatiquement pack_output, ainsi que les TS et SE en découlant. les pack (debug, restart, output) peuvent être relancés séparement (sans passer par les rebuilds)

Message en fin de simulation A la fin d’une expérience, vous recevrez un message de ce type : Objet : T05042013 completed Dear user, Simulation TEST201301 is completed on supercomputer curie5779. Job started : 25000101 Job ended : 25011231 Output files are available in /ccc/store/cont003/dsm/user/IGCM_OUT/IPSLCM5A/DEVT/piControl/TEST201301 Files to be rebuild are temporarily available in /ccc/scratch/cont003/dsm/user/REBUILD/IPSLCM5A/TEST201301 Pre-packed files are temporarily available in /ccc/scratch/cont003/dsm/user/IGCM_OUT/IPSLCM5A/DEVT/piControl/TEST201301 Script files, Script Outputs and Debug files (if necessary) are available in /ccc/work/cont003/dsm/user/CURIE/CMIP5/R99/IPSLCM5A_20120910/modipsl/config/IP SLCM5A/TEST201301 67 67

The END ! (déjà ) champagne-users@ipsl.jussieu.fr Liste pour trinquer entre utilisateurs. platform-users@ipsl.jussieu.fr Liste pour communiquer entre utilisateurs.

Cas particulier : IPSLCM5A-MR Voir : platform/documentation/configuration/IPSLCM5#IPSLCM5A-MR MR : sur curie, les rebuild du MR prennent plus de 24h. Il faut utiliser une astuce pour pouvoir les faire. Modifier rebuild.job Tourner dans /tmp (SSD), RUN_DIR_PATH=/tmp/REBUILD_$$ -q standard, noeud fin -x, réserver le noeud entier (16 cores) 1h40 pour les rebuild historical au lieu de 18h à 30h Sur ada, il faut préciser: # @ as_limit = 7.0gb dans le job de calcul. Réduire les tailles des Chunck TagName, pmagic, ...

Les monitorings Modifier/créer un fichier de type EXP_../POST/monitoring01_model.cfg Attention : il faut que les variables que l'on veut visualiser dans les monitoring soient sorties en time series #---------------------------------------------------------------------------------------------------------------- # field | files patterns | files additionnal | operations | title | units | calcul of area #----------------------------------------------------------------------------------------------------------------- NOX_surf_global | "NO NO2" | LMDZ4.0_9695_grid.nc | "(NO[d=1,k=19]+NO2[d=2,k=19])" | " NOX a la surface" | "VMR" | "aire[d=3]" CH4_surf_global | "CH4" | LMDZ4.0_9695_grid.nc | "CH4[d=1,k=19]" | " CH4 a la surface" | "VMR" | "aire[d=2]" CO_surf_global | "CO" | LMDZ4.0_9695_grid.nc | "CO[d=1,k=19]" | " CO a la surface" | "VMR" | "aire[d=2]" O3_surf_global | "_O3" | LMDZ4.0_9695_grid.nc | "O3[d=1,k=19]" | " O3 a la surface" | "VMR" | "aire[d=2]" HNO3_surf_global | "HNO3" | LMDZ4.0_9695_grid.nc | "HNO3[d=1,k=19]" | " HNO3 a la surface" | "?" | "aire[d=2]"

http://webservices. ipsl. jussieu http://webservices.ipsl.jussieu.fr/monitoring/tmp/fegg_plot01_wHiyP3_prod/

InterMonitoring – tutoriel Vidéo du tutoriel : http://dods.ipsl.jussieu.fr/brocksce/screencast/InterMonitoring.html

IGCMG Web services http://webservices.ipsl.jussieu.fr/monitoring/ 73

Formations Formations IPSL Autres formations Formations niveau 1 et 2 : modipsl, libIGCM, chaîne de calcul Formation LMDZ (contact catherine.rio@lmd.jussieu.fr) Chaque mois, INCAHowTo (inscription per mail to anne.cozic@lsce.ipsl.fr) Autres formations Fortran(14-05-2013) and MPI(30-09-2013) à l’IDRIS (2 fois par an) www.idris.fr Formations à l’utilisation des calculateurs du TGCC Formation UNIX

A retenir Avant de lancer une simulation informer le responsable de la configuration s’assurer de la bonne version des modèles s’assurer du type de simulation qu’on lance historique, piControl, pdControl paramètres dans les fichiers de configuration niveaux des sorties (écritures,…) Savoir ce qu’on fait - faire attention à ce qu’on fait chaîne de calcul IPSL = chaîne complexe un ou plusieurs modèles (modèles couplés) gros calculateurs (milliers/millions de cœurs de calcul) on pense à soi : gain de temps on pense aux autres : ressources partagées par la communauté Problèmes machine => hotline centre de calcul configuration, chaîne de calcul => documentation, platform-users, responsable de la configuration modèle => « hotline » modèle

Plan Présentation du pôle de modélisation Présentation du modèle IPSL-CM5 Rappel du fonctionnement de la chaine Surveillance de la chaîne de calcul Travaux pratiques personnalisés

Le groupe de travail Plate-forme de l’IPSL Contributions Le groupe de travail Plate-forme de l’IPSL

Outils NCO/netCDF R netcdf/3.6.3 + 4 hdf5 udunits ferret netpbm imagemagick tetex-latex CDO RSYNC NCAR NCL VTK Subversion et accès non filtrés aux serveurs cvs/svn Paraview gnuplot Firefox gs