Intégration de BQS dans CREAM

Slides:



Advertisements
Présentations similaires
Intégration de BQS dans le gLite-CE. Réunion TCG Présentation des difficultés rencontrées: Installation gLite-CE et WMS –Sensibilité aux modifications.
Advertisements

Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
TÂCHES D’ADMINISTRATION DE LA NAGIOSBOX BIOMED LE 24 Mai 2011, Christine Leroy,
CREAM & ICE Réunion SA1-France 11 mars 2008
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
INFSO-RI Enabling Grids for E-sciencE Statistiques d'usage d'un site de la grille LCG/EGEE Emmanuel Medernach, IN2P3 LPC.
INFSO-RI Enabling Grids for E-sciencE Les enjeux des nouvelles applications C. Loomis (LAL-Orsay) Journées Informatiques (Lyon-Valpré)
Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR Marseille Juin 2010Jean-Michel BARBET Subatech 1 /22 Support de la VO Alice à.
Présentation LabPlus v3. Solution novatrice en Technologies de l’information Solution novatrice en Technologies de l’information Application pour la Gestion.
Apache Tomcat Distributeur : Apache Software Foundation Projet : Jakarta Catégorie : Serveur d'applications Technologie : Java.
Revue N°1 : Projet DECMA BTS IRIS – 903 Étudiant : Florent BONNET.
Aspects SGBD Pierre Lombard BRGM - Juillet 2007 Mise à jour : :30.
- Formation ActiveMQ 1 1.
LCG-FRANCE_19/05/09L. Poggioli1 ATLAS Activités du nuage FR Production MC Reprocessing Analyse Au quotidien Next L.Poggioli, LAL.
Infrastructure de Calcul
Master II BioInfo - Galaxy – Session Décembre 2016
Solutions EOLE pour les ENR
Utentomatic - Gestion des comptes Unix sous Active Directory
Séminaire Novembre 2006 Zephir : Déploiement et supervision des serveurs Eole.
Devenir d’AFS et remplacement progressif
Guide Share MQ HA & Appliance
Les Bases de données Définition Architecture d’un SGBD
[Insérez le nom du programme]
AugerDb / SimDb Gestion des simulations Auger Java
Les Tests de performances
Intégration Continue et SQL
Clients riches RIA (Rich Internet Application) / RDA
Lustre au DAPNIA.
Le portail des opérations: retour d'expérience
C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 2 février 2007
Workshop Opération , Bordeaux , 07 Novembre 2016
GRIF : Grille pour la Recherche en
Etat des services grid de production
Pierre Girard LCG-France Tier
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Surveillance des services grille par NAGIOS
Etat des lieux des VO Boxes LHC
Intégration de BQS dans CREAM
Déploiement d’un LCG CE
Réunion coordination WLCG Lyon, le 13 mars 2008
Consolidation des services de grille de production
Installation des OS par réseaux (PXE)
LCG-France Tier-1 & AF Réunion mensuelle de coordination
David Bouvet LCG France T2 T3 – LPNHE
JJS (Java Job Submission) Soumission de jobs sur grille
Jobs ATLAS sur la grille
mardi 11 septembre 2018mardi 11 septembre 2018
CREAM-CE et SGE.
Exercices: Système d’Information
Atelier régulation de la production dans un contexte grille
Notion De Gestion De Bases De Données
Exemple Infrastructure Standing réservation Partition Priorité Autres.
Comparaison RB et gLite WMS
BALISE HTML5 <audio> : le son sur une page web
Migration de l’architecture classique vers le cloud privé
„La plate-forme EAI “ Initiation à WBI
5 Analyse avec Designer d'Oracle
Infrastructure Opérationnelle d’EGEE
Module 13 : Implémentation de la protection contre les sinistres
Communication Assistant V2.0
Serveurs d’applications
20 Données semi-structurées et XML
JDepend - Analyse de la qualité du code Java -
Représentant technique Représentant scientifique
Middleware : Status et Evolution
Infrastructure Opérationnelle d’EGEE2
Analyse et Mise en place de fvpat Webdev Server
Service d ’Annuaire Netware pour Windows NT SABATIER Antoine IR5
Parcours vers l’adoption d’une méthode de prestation DevOps (Opérations de développement) Applications offertes sur le marché et applications de SPC.
Transcription de la présentation:

Intégration de BQS dans CREAM Sylvain Reynaud Lyon, le jeudi 10 septembre

B Q S Système d'info. Monitoring Job control Vue d'ensemble Tomcat existant Computing Element BQS G I P Système d'info. Tomcat CEMon BLAH Notif. Monitoring B Q S CREAM B L A H P D xxx_status Job control

B Q S Système d'info. Tomcat Aucun nouveau développement System Info. Système d'info. existant Computing Element BQS G I P BQS IP du LCG-CE Tomcat CEMon Aucun nouveau développement Le service CEMon est compatible avec le GIP du LCG-CE Réutilisation du BQS information provider actuellement en production Refactoring était prévu… mais pas le temps de rentabiliser l'effort B Q S

B Q S Monitoring Tomcat Daemon en C++ System Info. Monitoring existant Monitoring Grid-BQS Computing Element BQS G I P Tomcat CEMon BLAH Notif. B Updater BQS B Q S CREAM B L A H P D bqs_status bselect Daemon en C++ Architecture contrainte par les choix du m/w Custom mapping était prévu, mais pas rentable bqs_submit

Monitoring status { QUEUED => status2 { HOLD=>HELD , *=>PENDING } RUNNING => status2 { SUBMITTED=>PENDING , *=>RUNNING } ENDED => status2 { SUBMITTED => FAILED: Batch failure RUNNING | STARTED | EOJ => step { SPAWNED => FAILED: Batch failure OVER => COMPLETED RUNNING | ENDING => etime { null | < now - 5*60 => RUNNING: Transitional status * => FAILED: Blocked in a transitional status } * => FAILED: Unexpected status } DELF* => ABORTED: Canceled by BQS operator DEL* => step { QUEUED => CANCELED: Canceled by user * => CANCELED: May have been canceled by user or BQS operator } RERUN* | REBOOTING => FAILED: Internal error (job should not be rerunnable) SIG* | KILL* => ABORTED: A limit has been exceeded LOST => FAILED: Job disappeared NREBOOT => FAILED: Worker node has rebooted * => FAILED: Unexpected status }

B Q S Job control Scripts en bash Tomcat System Info. Job control existant Monitoring Grid-BQS Job Control Computing Element BQS Scripts en bash parse les commandes BLAH et les variables d'environnement les convertit en commandes BQS Support N clusters par CE prévu, mais coûteux G I P Tomcat CEMon BLAH Notif. B Q S CREAM B L A H P D bqs_hold bqs_resume bqs_cancel bqs_submit

B Q S Serveur GBQS Tomcat Computing Element BQS CEMon CREAM G I P BLAH System Info. Serveur GBQS existant Monitoring Grid-BQS Job Control Computing Element BQS G I P xxx IP xxx_status xxx_hold xxx_resume xxx_cancel xxx_submit BLAH Parser xxx BQS IP du LCG-CE Tomcat CEMon BLAH Notif. BLAH Updater BQS B Q S CREAM B L A H P D bqs_status bselect bqs_hold bqs_resume GBQS Server bqs_cancel bqs_submit

B Q S Serveur GBQS Serveur en Java + XSL Tomcat System Info. Serveur GBQS existant Monitoring Grid-BQS Job Control Computing Element BQS Serveur en Java + XSL Adapte le job en fonction… du CE, de la CE queue du groupe, du user des requirements du job G I P xxx IP xxx_status xxx_hold xxx_resume xxx_cancel xxx_submit BLAH Parser xxx Tomcat CEMon B Q S CREAM B L A H P D GBQS Server

Serveur GBQS - configuration

Serveur GBQS - configuration

Serveur GBQS - performance xalan (6.4") / xsltproc (38") Cache de tous les composants config pré-traitée (0") stylesheets pré-analysées classes BQS récupérées persistant sur disque pour redémarrage (0.1") http/MINA > apache Minimum de traitements par job communication tcp transforme le JSDL génère le wrapper B Q S DOM B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element GBQS Server TCP

Serveur GBQS - robustesse L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element existant B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element Grid-BQS B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element gbqs update service gbqs-update-cron gbqs-update-start B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element B Q S GBQS Server PROS: pas de processus supplémentaire CONS: risque de CE pas à jour lors de la panne (notamment pour les CE de test)

Serveur GBQS - administration console locale (par défaut) console à distance web Utilisé par CEs B Q S JMX HTTP B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element GBQS Server TCP

Serveur GBQS - administration

Serveur GBQS - administration

Serveur GBQS - administration

Serveur GBQS - logging Plug-in log4j pour RLSng http://grid.in2p3.fr/maven2/fr/in2p3/log4j/in2p3-log4j-rlsng/ log4j.properties log4j.rootCategory=INFO,RLSNG,ROLLING_FILE log4j.appender.RLSNG=fr.in2p3.log4j.JMSQAppender log4j.appender.RLSNG.Threshold=WARN log4j.appender.RLSNG.InitialContextFactory=org.apache.activemq.jndi.ActiveMQInitialContextFactory log4j.appender.RLSNG.ProviderUrl_1=tcp://ccsymod01.in2p3.fr:61616 log4j.appender.RLSNG.ProviderUrl_2=tcp://ccsymod02.in2p3.fr:61616 log4j.appender.RLSNG.Queue=rlsng log4j.appender.RLSNG.Login=****** log4j.appender.RLSNG.Passcode=****** log4j.appender.RLSNG.layout=fr.in2p3.log4j.RlsngLayout log4j.appender.RLSNG.layout.tag=MyApp

Serveur GBQS - dépendances/BQS schema.xsd définition des attributs de configuration BQSClasses.java information sur les classes de BQS template-jsdl.xsl vérification + transformation de la description du job template-wrapper.xsl génération du job wrapper

Téléchargement & doc.

Serveur GBQS - recyclage ? N'a aucun équivalent quelque soit le prochain système de batch choisi idem pour les middlewares autres que gLite Très peu de dépendances sur BQS seulement 4 fichiers / 93 du sous-projet le nom du sous-projet : G-BQS Server Coût d'intégration dans BLAH très faible modification du script "xxx_submit.sh" (xxx = lsf, pbs…) patch du script "blah_common_submit_functions.sh" pour supporter l'ajout d'un épilogue

B Q S Vue d'ensemble Tomcat Computing Element Serveur central BQS System Info. Vue d'ensemble existant Monitoring Grid-BQS Job Control Computing Element Serveur central BQS G I P BQS IP du LCG-CE Tomcat CEMon BLAH Notif. B Updater BQS B Q S CREAM B L A H P D bqs_status bselect bqs_hold bqs_resume GBQS Server gbqs-update service ? bqs_cancel bqs_submit gbqs-update-start gbqs-update-cron