Mardi 31 mai 2016 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul.

Slides:



Advertisements
Présentations similaires
A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences.
Advertisements

Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
TOOLKIT INSTALLATION Disponible pour i686 uniquement sur marianne. ( Version unique pour.
LCG DATAGRID - France 8 Juillet 2002 LCG : LHC Grid computing - qui, quoi, quand, comment ? Quoi ? But : préparer l'infrastructure informatique des 4 expériences.
PhyloJava : une application de phylogénie sur la grille DATAGRID
Intégration du système de production LHCb sur la DataGRID V. Garonne, CPPM, Marseille Réunion DataGRID France, 13 fv fév
Diffusion Nationale TOULOUSE -Mars 2006 Structure et Services « STS » Les échanges.
Framework Avancement au Plan Principales avancées pour les parties Ligand, Sites Actifs et Docking Processus dinstallation de.
Recherche de similarité de séquences à grande échelle S. Penel, P. Calvat, Y. Cardenas LBBE, CCIN2P3 Calculs BLAST intensifs sur la plateforme TIDRA -
Architecture de machines Principes généraux
Sécurité Informatique
Exposé Duan Kun Alexandra Moraru M2 Pro Traductique, INALCO
Module 1 : Préparation de l'administration d'un serveur
LA VIRTUALISATION Par AVIGNON, CHOMILIER, MIGNOT 1.
Sommaire Objectif de Peakup Principes de fonctionnement
Le protocole FTP.
Plateforme de Calcul pour les Sciences du Vivant Le Système dInformation de gLite.
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
Plateforme de Calcul pour les Sciences du Vivant Soumission de jobs sur grille.
Les ouvertures au CC Pascal Calvat. Plan 2 Présentation des ouvertures Les besoins des utilisateurs Les solutions apportées par le CCIN2P3 Les ouvertures.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
CAZIER Kévin JACOB Sébastien Réalisée dans le cadre du Projet Pluridisciplinaire Encadré par Mme Martine COQUET Responsable de l’entreprise.
La mémoire virtuelle Dans laquelle un ordinateur exécute des programmes dont les besoins en mémoires dépassent la mémoire disponible. Par exemple des.
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Le noeud de grille Tier 3 LAPP.
Lundi 20 avril 2015 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul IN2P3.
Clustering. Le Clustering est une technique qui consiste à assembler virtuellement plusieurs machines afin de les faire travailler en parallèle. Cela.
Présentation de la gestion centralisée Siège – unités EM - RES3000.
Centralisation des sites web d’ELTA & Mise en place d’un serveur NAS
Cours n°4M1.ist-ie (S. Sidhom) UE 203 Promo. M1 IST-IE 2006/07 Conception d’un système d'information sur Internet Architecture trois-tiers : technologies.
Interprétation de données d’analyses protéomiques sur une grille de calcul : Utilisation d’algorithmes libres pour l’identification MS/MS. Christine CARAPITO.
La base de spectres BeSS Une collaboration amateurs/professionnels Ecole d’astrophysique du CNRS La Rochelle – mai 2006 François Cochard.
ATLAS Ghita Rahal CC-IN2P3 Novembre 9, /6/2006Réunion CAF2 Activités Création et externalisation d’outils de monitoring de l’état du T1 (CPU,
Développement et maintenance sur le projet RefPack
Sample Image 3ème rencontre EGEODE – Villefranche-sur-Mer – 29 May 2009 g-Eclipse avec EGEODE
1 Démo SoftGrid. Le Séquenceur SoftGrid Utilisation d’un « packageur » SoftGrid Possibilité de “séquencer” en ligne de commande (CLI) Existence d’outils.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data management David Bouvet IN2P3-CC Clermont.
Cette présentation… … fait partie d’une série de 3 :
Master 1ère année Sécurité des Systèmes d’Information 1 Rôle et profil de l'administrateur  Profession généraliste peu connue mais très recherchée  Il.
1 Academie OCS 2007 R2 – Partie 1 Damien Caro Architecte Infrastructure Microsoft France
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs David Bouvet IN2P3-CC.
1.1: notions de bases de l’informatique
Yannick Patois _ Journée du Libre _ 1er Novembre n° 1 Datagrid Une grille de calcul sous Linux Yannick Patois.
EGEODE 08/11/2006 Équipe GRID1 EGEODE EGEODE. 08/11/2006 Équipe GRID2 Plan  La géophysique sur la Grille : EGEODE  Partenariat académique  Comment.
Analyse, élaboration et exploitation d’une Base de Données
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Quelques commandes de la grille David Bouvet.
INFSO-RI Enabling Grids for E-sciencE NA4 test Eric Fede on behalf of the team.
EGEE is a project funded by the European Union under contract IST Job Soumission Eric Fede CPPM Grid Tutorial, Novembre
EGEE is a project funded by the European Union under contract IST Job Soumission N.Lajili Seminaire Grille-21 Novembre
Mercredi 1er juin 2016 La biologie au centre de calcul Pascal Calvat Centre de calcul.
Mercredi 1er juin 2016 La biologie au centre de calcul Pascal Calvat Centre de calcul.
Mardi 30 mars 2010 Technologies employées par le portail des opérations Cyril L’Orphelin, Olivier Lequeux, Pierre Veyre IN2P3/CNRS Computing Centre, Lyon,
PROJET DE SESSION DANS LE CADRE DU COURS: SCG Réalisation d’applications en SIG PRÉSENTÉ PAR: Marie-Andrée Levesque 18 AVRIL 2006.
KOSMOS 1 Outils transversaux Module 7 1.L’annuaire 2.La recherche d’informations 3.La réservation de ressources.
Sample Image Comment utiliser la grille ? 3ème rencontre EGEODE des utilisateurs de Geocluster et des Sciences de la Terre sur la grille EGEE à Villefranche-sur-Mer.
Edit Knoops CPPM 20/01/2009 Enabling Grids for E-sciencE Gestion des données Gestion des jobs Edith Knoops.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs C. Loomis / M. Jouvin.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
Réunion des sites LCG France- Marseille juin ACTIVITES DU GROUPE ACCOUNTING FRANCE GRILLES Cécile Barbier (LAPP)
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
Centre de Calcul de l’Institut National de Physique Nucléaire et de Physique des Particules Rien ne se perd, rien ne se crée, tout se Cyril L’Orphelin,
Tier 2 au LAPP. Plan Historique Objectifs Infrastructures Status/métriques Avenir Conclusion.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
INFSO-RI Enabling Grids for E-sciencE La gestion des données Daniel Jouvenot LAL-IN2P3-CNRS 18/06/2008.
GPU sous LabVIEW eTIG_OOP_ Plan de la présentation 1.Frameworks OOP référencés 2.Performances d’accés 3.Performances de compilation 4.Erreurs.
Fonctionnement de la grille
JJS (Java Job Submission) Soumission de jobs sur grille
Transcription de la présentation:

mardi 31 mai 2016 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul

31/05/ Plan Présentation de JJS Soumission d’un job avec utilisant le langage JDL Performances de JJS Démonstration en direct live avec soumission de jobs sur la grille

31/05/ Présentation de JJS: Origine du projet JJS développé en 2003 au CCIN2P3 pour certains biologistes du projet DATAGRID DATAGRID: projet européen de grille pour la recherche académique. Ce projet se nomme maintenant EGEE. JJS permet de soumettre des jobs sur la grille EGEE/LCG de façon automatique

31/05/ Présentation JJS: Ressource CPU en 2007 EGEE en 2007, c’est environ cpu répartis sur toute la planète avec une forte concentration de sites en Europe Europe, Amérique, Asie, Australie En France, 12 sites participent à EGEE dont 10 sont IN2P3 et 1 CEA (~7000 cpu): 1 marseille, 2 lyon, 1 clermont, 5 paris, 1 annecy, 1 strasbourg

31/05/ Présentation JJS: Virtual organisation Virtual organisation : ensemble d’utilisateurs ayant un même centre d’intérêt 250 VO réparties dans 3 domaines de recherche - physique des particules - biologie et bio-medical - science de la terre Pour utiliser JJS il faut disposer d’un certificat et appartenir à une « virtual organisation »

31/05/ Présentation JJS: Architecture JJS a besoin uniquement de JAVA 1.5 Testé sous Windows, Linux, Mac, Solaris Base de données côté client (optionnel): Oracle, Sybase, PostGreS, mySQL JJS s’appuie sur certains composants d’EGEE → Computing Element (Soumission job Globus GRAM) → Worker Node (Calcul sous Scientific Linux) → Storage Element (Stockage sur disque avec gsiftp)

31/05/ Présentation JJS: Architecture JJS utilise le framework « jsaga » développé au cc par Sylvain Reynaud dans le cadre du projet IGTMD JSAGA permet la virtualisation de l’authentification, du transfert des fichiers et de la soumission des jobs Grâce à JSAGA, JJS est de moins en moins dépendant des technologies de grille qui peuvent être diverses et variées.

(2) Soumission globus (1) Input Sandbox (3) Job local (4) Download inputsandbox (5) Upload outputsandbox (6) Download Outputsandbox Workflow Soumission d’un job: Workflow

31/05/ Présentation JJS: Installeur graphique

31/05/ Présentation JJS: Administration Paramétrage de l’application via un fichier unique : $JJS_HOME/conf/jjs.properties Mise à jour automatique des informations avec la commande « jjs-resource-manager --update_all » Possibilité de créer une connexion à la base de données de son choix. Désactivation automatique des computing elements non disponibles

31/05/ Soumission d’un job: Prérequis Avant de soumettre un job sur la grille, un certain nombre d’étapes sont nécessaires pour préparer le job 1) Avoir un certificat et appartenir à une VO 2) Ecrire un fichier JDL pour décrire le job 3) Ecrire un script shell contenant l’exécution du programme sous Linux 4) S’assurer que le binaire est compatible avec le linux installé sur les worker nodes

31/05/ Soumission d’un job: Langage JDL Executable="./pov.sh"; Arguments=" '+Idemo.pov +Linclude/ -q9 +FP +H400 +W400 -D +SR1 +ER20 +Odemo_1.ppm'"; StdOutput="stdout1.txt"; StdError="stderr1.txt"; InputSandbox={"C:\temp\pov.sh", "C:\temp\demo.pov"}; OutputSandbox={"demo_1.ppm"}; requirements={other.GlueCEPolicyMaxCPUTime >= 50} La description d’un job s’effectue au travers du langage JDL (Job Description Language). Un fichier JDL se présente sous forme d’une liste de clé/valeur.

31/05/ Soumission d’un job: requirements NomSignification other.GlueCEPolicyMaxCPUTimeQuantité de calcul nécessaire pour effectuer le calcul (en SpecIntHeure?) other.GlueCEPolicyMaxWallClockTimeTemps en seconde nécessaire pour votre calcul other.GlueHostApplicationSoftwareRunTi meEnvironment Label d’un logiciel installé sur les nœuds de grille other.GlueCEUniqueIDIndique le site sur lequel seront lancés les jobs RegExpExpression régulière utilisant les autres variables disponibles Requirements sont basés sur le GLUE (Grid Laboratory for an Uniform Environment) Schema utilisé pour le système d’information des sites

31/05/ Soumission d’un job: Mode commande Les jobs sont gérés via un mode commande unix ou windows > jjs-proxy-init VOMS (génération d’un VOMS PROXY) > jjs-submit -g test -n job1 -f./myFile.jdl -v dteam (soumission d’un job) > jjs-status –g test –v dteam (status d’un lot de jobs) > jjs-cancel –v dteam –all (suppression de tous les jobs) > jjs-get-output –v dteam –o c:\temp –g test (rappatriement des output d’un lot de jobs dans c:\temp)

31/05/ Performances Pour les biologistes, les calculs doivent s’effectuer le plus rapidement possible. Chaque phase d’un job doit être optimisée: → Soumission des jobs en parallèle (Bulk Submission) → Transfert des inputsandbox et outputsandbox sous forme d’archive tar → Récupération des status des jobs en une seul fois → Time out pour les jobs waiting et les jobs running

31/05/ Performances: mise en queue des jobs Temps moyen de passage d’un job à l’état WAITING 12 secondes Pourcentage de jobs avec un passage en WAITING < 15 secondes 95% Dans le gain à la performance, le temps de mise en queue d’un job est une phase cruciale. Le transfert de l’inputsandbox doit être rapide ainsi que la soumission du RSL

31/05/ Performances: monitoring des jobs Action effectuéeExtension fichier sur SEStatut du job Inputsanbox téléchargée.tarUPLOADED RSL soumis au CE.tarWAITING Job démarré.runRUNNING Job fini.res.tarDONE Temps moyen pour le monitoring de l’ensemble des jobs 3 secondes Le statut de plusieurs centaines de jobs est relevé en quelques secondes en analysant l’extension des fichiers sur le storage element

31/05/ Performances: gain sur le calcul En localSur la grilleGain 8000 s600 s avec 100 jobs s180 s avec 10 jobs0,6 JJS permet d’accélérer de façon significative l’exécution des jobs. Algorithme de soumission de jobs basé sur la qualité de service des sites.

31/05/ Conclusion Les + JJS est un outil très simple d’emploi et très facile à installer ( Bonne robustesse par rapport aux défaillances Bonnes performances Les - Storage element au centre de l’architecture Pas de retour d’output si le job est tué

31/05/ Démonstration avec povray 1 job