INFSO-RI-508833 Enabling Grids for E-sciencE www.eu-egee.org Support MPI avec Torque/PBS C. Loomis (LAL-Orsay) EGEE-FR Conférence Téléphonique 7 Juin 2005.

Slides:



Advertisements
Présentations similaires
GEF 435 Principes des systèmes dexploitation Les systèmes dexploitation en général (Tanenbaum 1.1 et 1.3)
Advertisements

1 HPC et Windows 2003 CCS pour les développeurs Visual Studio 2005.
GEF 435 Principes des systèmes dexploitation Appels de système (Tanenbaum 1.6)
Point sur le DataGRID à Saclay – Mai 2001 D. Calvet, Z. Georgette, M. Huet, J-P. Le Fèvre, I. Mandjavidze, P. Micout, B. Thooris DAPNIA/SEI, CEA Saclay.
TOOLKIT INSTALLATION Disponible pour i686 uniquement sur marianne. ( Version unique pour.
MDS 2 Michel Jouvin LAL Pourquoi changer ? Sécurité –MDS non intégré avec GSI –Pas didentification des serveurs ni des utilisateurs.
Intégration du système de production LHCb sur la DataGRID V. Garonne, CPPM, Marseille Réunion DataGRID France, 13 fv fév
Exportation des données
Juin 2009 Olivier Jeannin Sauvegarde avec SyncBack sous Windows Petit tutoriel.
Systèmes d’exploitation
Traitement de texte ++.
Plateforme de Calcul pour les Sciences du Vivant Le Système dInformation de gLite.
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
Date : Juillet 2014 Formation : TAI Formateur : Tayeb BENDJELTI
Pourquoi est-il nécessaire d'installer de nouveaux logiciels sur votre ordinateur ? J'exclus de cette présentation l'installation de nouveaux matériels.
Plan Définitions et exemples Composants de cluster
Projet BASTILLE-LINUX ou comment sécuriser « simplement » sa distribution Linux.
Accounting régional. Status actuel Base de données node56 : – 22GiB de données – 16 sites – 3.7TiB disponibles… Tous sites sur la base de données node56.
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Quattor : Opérations Courantes - G. Philippon/M. Jouvin4-5/2/2009Quattor : Opérations Courantes - G. Philippon Opérations courantes.
Le noeud de grille Tier 3 LAPP.
Le Tier2 de Subatech Logiciel : Jean-Michel Barbet
Installation UI EGEODE Équipe GRID1 Installation UI EGEODE.
21/01/08 v Outil confmanager Configuration des serveurs Linux version du 21/01/08.
Production DC2 ATLAS David Bouvet LHC Calcul 22 juillet 2004.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks L’OAG R. Rumler, CC-IN2P3 (CNRS) EGEE’07,
Enabling Grids for E-sciencE EGEE-III INFSO-RI La Grille EGEE M. Jouvin (LAL-Orsay) Tutorial EGEE Utilisateur (LLR) 4 Juin 2008.
Michel Jouvin LAL/Orsay
Gérez vos références bibliographiques avec France.Martin [à]univ-paris1.fr
Les fermes de PCs au Centre de Calcul de l’IN2P3 Journée « ferme de PCs » 27 juin 2000 Benoit Delaunay
LHCb DC06 status report (LHCb Week, 13/09/06) concernant le CC : –Site currently fine / stable 3% of simulatated events 30% of reconstructed events –Site.
Sample Image 3ème rencontre EGEODE – Villefranche-sur-Mer – 29 May 2009 g-Eclipse avec EGEODE
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data management David Bouvet IN2P3-CC Clermont.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Sécurité sur le GRID Ahmed Beriache (CGG)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Sécurité sur le GRID Ahmed Beriache (CGG)
Cemagref Antony, 2 décembre 2005Séminaire d'information sur le projet européen HarmoniQuA 1 Les outils proposés par le projet Séminaire d’information sur.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs David Bouvet IN2P3-CC.
D0 côté info D0 à FNAL  Données du RunII  Infrastructure matérielle  Infrasturucture logicielle  Monte Carlo à D0 D0 à Lyon  Production Monte Carlo.
Enabling Grids for E-sciencE EGEE-III INFSO-RI Sécurité sur la Grille G. Philippon (LAL – CNRS ) Tutorial EGEE Utilisateur (DAKAR)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Quelques commandes de la grille David Bouvet.
GRIF Status Michel Jouvin LAL/Orsay
INFSO-RI Enabling Grids for E-sciencE NA4 test Eric Fede on behalf of the team.
Projet StratusLab Technologies Cloud et Virtualisation M. Airaj (CNRS/LAL), C. Loomis (CNRS/LAL) LCG-France, CPPM Marseille Juin 2010 The StratusLab.
Mardi 31 mai 2016 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
BABAR Georges Vasseur CEA Saclay, DSM/IRFU/SPP Workshop sur l’analyse des données au centre de calcul de Lyon 17 avril 2008.
INFSO-RI Enabling Grids for E-sciencE Les services d’EGEE Fede Eric Inspirée de la présentation de Frédéric Hemmer JRA1 EGEE 1 st.
Edit Knoops CPPM 20/01/2009 Enabling Grids for E-sciencE Gestion des données Gestion des jobs Edith Knoops.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs C. Loomis / M. Jouvin.
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
Tutorial ATLAS France, CCIN2P3, 05/02/2007 INFSO-RI Enabling Grids for E-sciencE Introduction à la grille LCG/EGEE Pierre Girard.
INFSO-RI Enabling Grids for E-sciencE Technologie de la grille C. Loomis (LAL-Orsay) EGEE Tutorial (Marseille) 3-4 octobre 2006.
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
INFSO-RI Enabling Grids for E-sciencE Adaptation de GRIDSITE à WEBDAV Cédric Duprilot CNRS/IN2P3/LAL.
Tutorial “Administrateur de site EGEE”, CCIN2P3, 24/10/2007 INFSO-RI Enabling Grids for E-sciencE Introduction à la grille LCG/EGEE.
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
INFSO-RI Enabling Grids for E-sciencE Gestion des Données David Bouvet CCIN2P /10/10.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
INFSO-RI Enabling Grids for E-sciencE La gestion des données Daniel Jouvenot LAL-IN2P3-CNRS 18/06/2008.
EGEE France, Marseille, 24 mars 2005 INFSO-RI Enabling Grids for E-sciencE Activité SA1 Regional Operations Centre Pierre Girard.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
CALCUL ATLAS LCG France (CC IN2P3 Lyon) 30 Avril SOMMAIRE Data Challenge 2 (DC2) d’ATLAS Utilisation du CC IN2P3.
INFSO-RI Enabling Grids for E-sciencE L’activité EGEE au CINES Nicole Audiffren, Adeline Eynard et Gérard Gil Réunion de la fédération.
INFSO-RI Enabling Grids for E-sciencE Les projets EGEE et LCG C. Loomis (LAL-Orsay) EGEE Tutorial (Marseille) 3-4 octobre 2006.
GRIF : Grille pour la Recherche en
Transcription de la présentation:

INFSO-RI Enabling Grids for E-sciencE Support MPI avec Torque/PBS C. Loomis (LAL-Orsay) EGEE-FR Conférence Téléphonique 7 Juin 2005

NA4 Status – C. Loomis – 24/03/ Enabling Grids for E-sciencE INFSO-RI Grandes Lignes Jobs MPI dans LCG2 Problèmes résolus –Logiciel MPICH –Job Managers –Utilisation de CPUs Difficultés non-résolues Informations détaillées –

NA4 Status – C. Loomis – 24/03/ Enabling Grids for E-sciencE INFSO-RI Jobs MPI dans LCG2 JDL –JobType = "MPICH"; –NodeNumber = 11; RB choisit une ressource –other.GlueCEInfoTotalCPUs >= NodeNumber RB envoie un job à gatekeeper –Globus le traite comme job “multiple”. Système de batch démarre le job –Nombre de CPUs nécessaires. Job wrapper –Appelle “mpirun” directement. Traitement de job normal...

NA4 Status – C. Loomis – 24/03/ Enabling Grids for E-sciencE INFSO-RI Logiciel MPICH LCG2 distribution par défaut –MPICH –Installée dans un endroit non-standard. –N'inclut pas les bibliothèques de développement. –N'inclut pas les binaires mpicc, etc. Utilisez une version plus récente –MPICH –Installée dans les répertoires standards. –Inclut tous les outils de développement. –Disponible vers LCG wiki.

NA4 Status – C. Loomis – 24/03/ Enabling Grids for E-sciencE INFSO-RI Job Managers Torque/PBS –lcgpbs  peut avoir un système de fichiers non-partagés, mais  ne supporte pas les jobs MPI –pbs  doit avoir un système de fichiers partagés, et  supporte les jobs MPI LSF –Même chose pour “lcglsf” et “lsf”. (Je pense.) Nom de système de batch –Doit être “pbs” ou “lsf”. –“torque”, le défaut, ne marche pas!

NA4 Status – C. Loomis – 24/03/ Enabling Grids for E-sciencE INFSO-RI Utilisation de CPU Différence sémantique entre PBS et maui –PBS utilise des nœuds, mais maui utilise des CPUs. Exemplaire: –Cluster avec 10 nœuds (bi-pro) = 20 CPU. –JDL avec “NodeNumber = 11”. –Maui OK : 11 < 20 CPU disponibles. –PBS NON : 11 > 10 nœuds disponibles. –Le gatekeeper accepte ce job, mais se plante! Solution: –Réécrit la contrainte du nœud au niveau batch. –“-l nodes=11” comme “-l nodes=9+nodes=1,ppn=2”. Torque >= et Maui >= 3.2.6p11

NA4 Status – C. Loomis – 24/03/ Enabling Grids for E-sciencE INFSO-RI Espace Scratch Possible de utiliser une espace disk local: –TMPDIR (torque/PBS) –EDG_WL_SCRATCH (“job wrapper”) Malheursement: –mpirun ne fonctione pas N'utilisez pas EDG_WL_SCRATCH pour MPI

NA4 Status – C. Loomis – 24/03/ Enabling Grids for E-sciencE INFSO-RI Difficultés Non-Résolues Impossible –Configurer MPI sans utiliser tous les CPUs. –Remplacer “mpirun” avec “mpiexec”. Difficultés –Détecter un système de fichiers partagés/non-partagés. –Faire un planning efficace sans contraintes de jobs. Mais... –MPI au niveau de base fonctionne sur LCG2. –Les versions plus récentes de torque, MPICH, et maui arriveront dans les “releases” futures de LCG2.