JJS (Java Job Submission) Soumission de jobs sur grille

Slides:



Advertisements
Présentations similaires
Lundi 20 avril 2015 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul IN2P3.
Advertisements

Mardi 31 mai 2016 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul.
Le projet MUST Méso infrastructure de calcul et de stockage ouverte sur la grille européenne LCG/EGEE Colloque Grille Rhône-Alpes 10 janvier 2008.
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
INFSO-RI Enabling Grids for E-sciencE Statistiques d'usage d'un site de la grille LCG/EGEE Emmanuel Medernach, IN2P3 LPC.
Projet de fin d'étude pour l'obtention du Diplôme Nationale d'Ingénieur en Informatique Conception et développement des modules de GED pour l’ indexation.
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
Composants Matériels de l'Ordinateur Plan du cours : Ordinateurs et applications Types d'ordinateurs Représentation binaires des données Composants et.
Projet tuteuré 2009 Les clients légers Alexandre Cédric Joël Benjamin.
Messagerie Open Source à la DGCP Implémentation réalisée par IBM et Pilot Systems Sylvain Viollon.
Le système Raid 5 Table des matières Qu'est ce que le RAID ? Les objectifs Le raid 5 Les avantages et les inconvénients Les composants d’un Raid.
Février 2006X. Belanger / Guilde Introduction à. Février 2006X. Belanger / Guilde Qu'est ce que Samba ? ● Implémentation libre du protocole CIFS/SMB (client.
Banques – 25 mai 2016.
Diffusion en streaming de vidéos d’assistance au dépannage
Mise en place d’un système de partage de fichiers
Présentation OCI700 et ACS Série 700
Albertine DUBOIS et Alexandre LIEGE
Sécurité - ASA8.x - Import du Plug-in RDP pour utilisation dans WebVPN
Séminaire EOLE Beaune Septembre 2007
Journée Analyse D0, 19 janvier 2004
Les Tests de performances
Introduction aux grilles de calcul et au projet EGI
Centralisation de logs
L’accounting dans EGEE
GENIUS – GANGA Alternative à la CLI
Réunion Analyse D0 France au CCIN2P3 19 janvier 2004
PROTEOMIQUE.
C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 2 février 2007
MATLAB sur la grille C. Loomis (LAL-CNRS)
Vue d'ensemble de l'utilisation du CCIN2P3 par les expériences LHC
GRIF : Grille pour la Recherche en
Etat des services grid de production
Surveillance des services grille par NAGIOS
Intégration de BQS dans CREAM
Fonctionnement de la grille
Développement d’une application Android destinée aux commerciaux
Soumission de jobs C. Loomis / M. Jouvin (LAL-Orsay)
Statut du T2 Île de France
Daniel JOUVENOT Laboratoire de l’Accélérateur Linéaire (LAL–ORSAY)
CeMEB La plateforme MBB
Présentation OCS-Inventory au LAPP
David Bouvet IN2P3-CC Annecy - 27/09/2007
Programmation système
L’exploitation des données du collisionneur LHC: un défi pour le calcul scientifique un enjeu pour le LAPP S. Jézéquel.
Tutorial Utilisateurs EGEE
CeMEB La plateforme MBB
CREAM-CE et SGE.
Documentation technique (Linux)
Atelier régulation de la production dans un contexte grille
Windows Server 2012 Objectifs
Comparaison RB et gLite WMS
M ICROS PROJETS 1 ÈRE A NNÉE. DESCRIPTION DES MICROS PROJETS Il s'agit de produire un programme (fichiers source et un exécutable testé et opérationnel.
Tutorial Utilisateurs EGEE
Outils et principes de base. Exemple d’application  Gestion de données d’enquête : Interface de saisie en ligne  insère directement les données dans.
Les protocoles de la couche application Chapitre 7.
Système d’exploitation UNIX
Infrastructure Opérationnelle d’EGEE
GRIF : Site EGEE au Service de la Recherche en IdF
Un cloud de production et de stockage
Atos, Atos et le poisson, Atos Origin et le poisson, Atos Consulting ainsi que le poisson seul sont des marques déposées d'Atos Origin SA. © 2006 Atos.
Modern Drivers/BIOS Management Joël Surget Octobre 2018
LUSTRE Integration to SRM
Tableau de bord d’un système de recommandation
Cluster CAU Sous Windows serveur 2012 R2.
GESTION DE LA PRODUCTION Réalisé par : EL MAROUSSI Mohammed DRIOUCHI Mohammed Abdeljabbar WAKENNOU Salah CRMEF Grand Casablanca Cycle de préparation à.
1 DEPLOIEMENT D’UN SYSTEME DE REPARTITION DE CHARCHE (LOAD BALANCING) Abasse KPEGOUNI, Ingénieur Systèmes et Réseaux.
Contenu Systèmes de test parallèles Multithreading Synchronisation
Présentation des missions en entreprise et formation
Présentation PISTE pour les partenaires raccordés en API
Transcription de la présentation:

JJS (Java Job Submission) Soumission de jobs sur grille jeudi 6 septembre 2018jeudi 6 septembre 2018 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul IN2P3

Plan Présentation de JJS Soumission d’un job avec utilisant le langage JDL Performances de JJS Démonstration en direct live avec soumission de jobs sur la grille Présentation de l’explorateur universel JUX 06/09/2018

Présentation de JJS: Origine du projet JJS développé en 2003 au CCIN2P3 dans le cadre du projet DATAGRID DATAGRID (projet européen de grille pour la recherche académique) est l’ancien nom du projet EGEE. JJS permet de soumettre des jobs sur la grille EGEE/LCG de façon automatique 06/09/2018

Présentation JJS: Ressource CPU en 2008 EGEE en 2008, c’est environ 60000 cpu répartis sur toute la planète avec une forte concentration de sites en Europe Europe, Amérique, Asie, Australie En France, 12 sites participent à EGEE dont 10 sont IN2P3 et 1 CEA (~10000 cpu): 1 marseille, 2 lyon, 1 clermont, 5 paris, 1 annecy, 1 strasbourg, 1 grenoble 06/09/2018

Présentation JJS: Virtual organisation Virtual organisation : ensemble d’utilisateurs ayant un même centre d’intérêt 300 VO réparties dans 3 domaines de recherche - physique des particules - biologie et bio-medical - science de la terre Pour utiliser JJS il faut disposer d’un certificat et appartenir à une « virtual organisation » 06/09/2018

Présentation JJS: Architecture JJS a besoin uniquement de JAVA 1.5 Testé sous Windows, Linux, Mac, Solaris Base de données côté client (optionnel): Oracle, Sybase, PostGreS, mySQL JJS s’appuie sur certains composants d’EGEE → Computing Element (Soumission job Globus GRAM) → Worker Node (Calcul sous Scientific Linux) → Storage Element (Stockage sur disque avec gsiftp) 06/09/2018

Présentation JJS: Architecture JJS utilise l’interface « JSAGA » développé au ccin2p3 par Sylvain Reynaud dans le cadre du projet IGTMD http://grid.in2p3.fr/jsaga L’interface JSAGA gère l’authentification, le transfert des fichiers Grâce à JSAGA, JJS est de moins en moins dépendant des technologies de grille qui peuvent être diverses et variées. 06/09/2018

Soumission d’un job: Workflow (2) Soumission globus (3) Job local (4) Download inputsandbox (1) Input Sandbox (6) Download Outputsandbox (5) Upload outputsandbox

Présentation JJS: Installeur graphique 06/09/2018

Présentation JJS: Administration Paramétrage de l’application via un fichier unique : $JJS_HOME/conf/jjs.properties Mise à jour automatique des informations avec la commande « jjs-resource-manager --update_all » Possibilité de créer une connexion à la base de données de son choix. Désactivation automatique des computing elements non disponibles 06/09/2018

Soumission d’un job: Prérequis Avant de soumettre un job sur la grille, un certain nombre d’étapes sont nécessaires pour préparer le job 1) Avoir un certificat et appartenir à une VO 2) Ecrire un fichier JDL pour décrire le job 3) Ecrire un script shell contenant l’exécution du programme sous Linux 4) S’assurer que le binaire est compatible avec le linux installé sur les worker nodes 06/09/2018

Soumission d’un job: Langage JDL La description d’un job s’effectue au travers du langage JDL (Job Description Language). Un fichier JDL se présente sous forme d’une liste de clé/valeur. Executable="./pov.sh"; Arguments=" '+Idemo.pov +Linclude/ -q9 +FP +H400 +W400 -D +SR1 +ER20 +Odemo_1.ppm'"; StdOutput="stdout1.txt"; StdError="stderr1.txt"; InputSandbox={"C:\temp\pov.sh", "C:\temp\demo.pov"}; OutputSandbox={"demo_1.ppm"}; requirements={other.GlueCEPolicyMaxCPUTime >= 50} 06/09/2018

Soumission d’un job: requirements Requirements sont basés sur le GLUE (Grid Laboratory for an Uniform Environment) Schema utilisé pour le système d’information des sites Nom Signification other.GlueCEPolicyMaxCPUTime Quantité de calcul nécessaire pour effectuer le calcul (en SpecIntHeure?) other.GlueCEPolicyMaxWallClockTime Temps en seconde nécessaire pour votre calcul other.GlueHostApplicationSoftwareRunTimeEnvironment Label d’un logiciel installé sur les nœuds de grille other.GlueCEUniqueID Indique le site sur lequel seront lancés les jobs RegExp Expression régulière utilisant les autres variables disponibles 06/09/2018

Soumission d’un job: Mode commande Les jobs sont gérés via un mode commande unix ou windows > jjs-proxy-init VOMS (génération d’un VOMS PROXY) > jjs-submit -g test -n job1 -f ./myFile.jdl -v dteam (soumission d’un job) > jjs-status –g test –v dteam (status d’un lot de jobs) > jjs-cancel –v dteam –all (suppression de tous les jobs) > jjs-get-output –v dteam –o c:\temp –g test (rappatriement des output d’un lot de jobs dans c:\temp) 06/09/2018

Performances Pour les biologistes, les calculs doivent s’effectuer le plus rapidement possible. Chaque phase d’un job doit être optimisée: → Soumission des jobs en parallèle (Bulk Submission) → Transfert des inputsandbox et outputsandbox sous forme d’archive tar → Récupération des status des jobs en une seul fois → Time out pour les jobs waiting et les jobs running 06/09/2018

Performances: mise en queue des jobs Dans le gain à la performance, le temps de mise en queue d’un job est une phase cruciale. Le transfert de l’inputsandbox doit être rapide ainsi que la soumission du RSL Temps moyen de passage d’un job à l’état WAITING 12 secondes Pourcentage de jobs avec un passage en WAITING < 15 secondes 95% 06/09/2018

Performances: monitoring des jobs Le statut de plusieurs centaines de jobs est relevé en quelques secondes en analysant l’extension des fichiers sur le storage element Temps moyen pour le monitoring de l’ensemble des jobs 3 secondes Action effectuée Extension fichier sur SE Statut du job Inputsanbox téléchargée .tar UPLOADED RSL soumis au CE WAITING Job démarré .run RUNNING Job fini .res.tar DONE 06/09/2018

Performances: gain sur le calcul JJS permet d’accélérer de façon significative l’exécution des jobs. Algorithme de soumission de jobs basé sur la qualité de service des sites. En local Sur la grille Gain 8000 s 600 s avec 100 jobs 13 120 s 180 s avec 10 jobs 0,6 06/09/2018

Conclusion Les + JJS est un outil très simple d’emploi et très facile à installer (http://cc.in2p3.fr) Bonne robustesse par rapport aux défaillances Bonnes performances Les - Storage element au centre de l’architecture Pas de retour d’output si le job est tué 06/09/2018

Démonstration avec povray 1 job 1 job 1 job 06/09/2018

JUX: Explorateur universel JUX: Java Universal eXplorer. Explorateur de fichiers « universel » permettant de lister/copier/effacer les fichiers stockés au travers de différents protocoles: gsiftp srb/irods srm http,sftp zip Gestionnaire de connexions Les fichiers, répertoires et connexions sont des url Copie de fichiers par « drag and drop » 06/09/2018

JUX: Connexion manager 06/09/2018

JUX: Drag and Drop 06/09/2018

JUX: Viewers disponibles JUX permet de visualiser les fichiers suivants leur extension. Plusieurs « viewers » sont disponibles: Ascii file viewer (toutes les extensions non associées) Image viewer (png, gif, jpg, bmp) Audio player (mp3, wav) Les viewers sont en lecture seule. Pas de possibilité de modifier les fichiers dans la version actuelle 06/09/2018

JUX: Image vizualizer 06/09/2018

JUX: Architecture Architecture JAVA 1.6 Testé sur Windows, Linux Utilisation de JSAGA pour gérer les différents protocoles Téléchargement Première version disponible en Septembre Installeur graphique 06/09/2018