Intégration de BQS dans CREAM

Présentations similaires


Présentation au sujet: "Intégration de BQS dans CREAM"— Transcription de la présentation:

1 Intégration de BQS dans CREAM
Sylvain Reynaud Lyon, le jeudi 10 septembre

2 B Q S Système d'info. Monitoring Job control Vue d'ensemble Tomcat
existant Computing Element BQS G I P Système d'info. Tomcat CEMon BLAH Notif. Monitoring B Q S CREAM B L A H P D xxx_status Job control

3 B Q S Système d'info. Tomcat Aucun nouveau développement
System Info. Système d'info. existant Computing Element BQS G I P BQS IP du LCG-CE Tomcat CEMon Aucun nouveau développement Le service CEMon est compatible avec le GIP du LCG-CE Réutilisation du BQS information provider actuellement en production Refactoring était prévu… mais pas le temps de rentabiliser l'effort B Q S

4 B Q S Monitoring Tomcat Daemon en C++
System Info. Monitoring existant Monitoring Grid-BQS Computing Element BQS G I P Tomcat CEMon BLAH Notif. B Updater BQS B Q S CREAM B L A H P D bqs_status bselect Daemon en C++ Architecture contrainte par les choix du m/w Custom mapping était prévu, mais pas rentable bqs_submit

5 Monitoring status { QUEUED => status2 { HOLD=>HELD , *=>PENDING } RUNNING => status2 { SUBMITTED=>PENDING , *=>RUNNING } ENDED => status2 { SUBMITTED => FAILED: Batch failure RUNNING | STARTED | EOJ => step { SPAWNED => FAILED: Batch failure OVER => COMPLETED RUNNING | ENDING => etime { null | < now - 5*60 => RUNNING: Transitional status * => FAILED: Blocked in a transitional status } * => FAILED: Unexpected status } DELF* => ABORTED: Canceled by BQS operator DEL* => step { QUEUED => CANCELED: Canceled by user * => CANCELED: May have been canceled by user or BQS operator } RERUN* | REBOOTING => FAILED: Internal error (job should not be rerunnable) SIG* | KILL* => ABORTED: A limit has been exceeded LOST => FAILED: Job disappeared NREBOOT => FAILED: Worker node has rebooted * => FAILED: Unexpected status }

6 B Q S Job control Scripts en bash Tomcat
System Info. Job control existant Monitoring Grid-BQS Job Control Computing Element BQS Scripts en bash parse les commandes BLAH et les variables d'environnement les convertit en commandes BQS Support N clusters par CE prévu, mais coûteux G I P Tomcat CEMon BLAH Notif. B Q S CREAM B L A H P D bqs_hold bqs_resume bqs_cancel bqs_submit

7 B Q S Serveur GBQS Tomcat Computing Element BQS CEMon CREAM G I P BLAH
System Info. Serveur GBQS existant Monitoring Grid-BQS Job Control Computing Element BQS G I P xxx IP xxx_status xxx_hold xxx_resume xxx_cancel xxx_submit BLAH Parser xxx BQS IP du LCG-CE Tomcat CEMon BLAH Notif. BLAH Updater BQS B Q S CREAM B L A H P D bqs_status bselect bqs_hold bqs_resume GBQS Server bqs_cancel bqs_submit

8 B Q S Serveur GBQS Serveur en Java + XSL Tomcat
System Info. Serveur GBQS existant Monitoring Grid-BQS Job Control Computing Element BQS Serveur en Java + XSL Adapte le job en fonction… du CE, de la CE queue du groupe, du user des requirements du job G I P xxx IP xxx_status xxx_hold xxx_resume xxx_cancel xxx_submit BLAH Parser xxx Tomcat CEMon B Q S CREAM B L A H P D GBQS Server

9 Serveur GBQS - configuration

10 Serveur GBQS - configuration

11 Serveur GBQS - performance
xalan (6.4") / xsltproc (38") Cache de tous les composants config pré-traitée (0") stylesheets pré-analysées classes BQS récupérées persistant sur disque pour redémarrage (0.1") http/MINA > apache Minimum de traitements par job communication tcp transforme le JSDL génère le wrapper B Q S DOM B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element GBQS Server TCP

12 Serveur GBQS - robustesse
L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element existant B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element Grid-BQS B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element gbqs update service gbqs-update-cron gbqs-update-start B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element B Q S GBQS Server PROS: pas de processus supplémentaire CONS: risque de CE pas à jour lors de la panne (notamment pour les CE de test)

13 Serveur GBQS - administration
console locale (par défaut) console à distance web Utilisé par CEs B Q S JMX HTTP B L A H P D xxx_submit Tomcat CEMon CREAM G I BLAH Notif. Computing Element GBQS Server TCP

14 Serveur GBQS - administration

15 Serveur GBQS - administration

16 Serveur GBQS - administration

17 Serveur GBQS - logging Plug-in log4j pour RLSng
log4j.properties log4j.rootCategory=INFO,RLSNG,ROLLING_FILE log4j.appender.RLSNG=fr.in2p3.log4j.JMSQAppender log4j.appender.RLSNG.Threshold=WARN log4j.appender.RLSNG.InitialContextFactory=org.apache.activemq.jndi.ActiveMQInitialContextFactory log4j.appender.RLSNG.ProviderUrl_1=tcp://ccsymod01.in2p3.fr:61616 log4j.appender.RLSNG.ProviderUrl_2=tcp://ccsymod02.in2p3.fr:61616 log4j.appender.RLSNG.Queue=rlsng log4j.appender.RLSNG.Login=****** log4j.appender.RLSNG.Passcode=****** log4j.appender.RLSNG.layout=fr.in2p3.log4j.RlsngLayout log4j.appender.RLSNG.layout.tag=MyApp

18 Serveur GBQS - dépendances/BQS
schema.xsd définition des attributs de configuration BQSClasses.java information sur les classes de BQS template-jsdl.xsl vérification + transformation de la description du job template-wrapper.xsl génération du job wrapper

19 Téléchargement & doc.

20 Serveur GBQS - recyclage ?
N'a aucun équivalent quelque soit le prochain système de batch choisi idem pour les middlewares autres que gLite Très peu de dépendances sur BQS seulement 4 fichiers / 93 du sous-projet le nom du sous-projet : G-BQS Server Coût d'intégration dans BLAH très faible modification du script "xxx_submit.sh" (xxx = lsf, pbs…) patch du script "blah_common_submit_functions.sh" pour supporter l'ajout d'un épilogue

21 B Q S Vue d'ensemble Tomcat Computing Element Serveur central BQS
System Info. Vue d'ensemble existant Monitoring Grid-BQS Job Control Computing Element Serveur central BQS G I P BQS IP du LCG-CE Tomcat CEMon BLAH Notif. B Updater BQS B Q S CREAM B L A H P D bqs_status bselect bqs_hold bqs_resume GBQS Server gbqs-update service ? bqs_cancel bqs_submit gbqs-update-start gbqs-update-cron


Télécharger ppt "Intégration de BQS dans CREAM"

Présentations similaires


Annonces Google