Pierre Girard LCG-France Tier-1 2008-02 05/07/2018 07/02/2008 Point sur le déploiement des versions du middleware nécessaires pour CCRC'08 Pierre Girard LCG-France Tier-1 2008-02
Mise à jour des WNs Mise à jour des CEs Monitoring Nagios Plan 05/07/2018 Plan Mise à jour des WNs Mise à jour des CEs Monitoring Nagios Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Démandé pour CCR08 Mise à jour des WNs (1) 05/07/2018 Mise à jour des WNs (1) Démandé pour CCR08 WN Service/SL4 gLite 3.1 In production Mais… patché avec Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Déployé en test au CC (mardi 07/02) 05/07/2018 Mise à jour des WNs (2) Déployé en test au CC (mardi 07/02) De 3.1.0-2 à 3.1.4-1(Latest release) Incluant: lcg_util 1.6.7-1.slc4 (demandé 1.6.6-1) GFAL-client 1.10.7-1.slc4 (demandé 1.10-7-2) Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Mise à jour des WNs (3) Premiers résultats Quick fix 05/07/2018 Mise à jour des WNs (3) Premiers résultats Déploiement sur AFS sans problème Mais bug #32999 sur la version de production de lcg-utils Echec des SAM tests Quick fix Récupération de la dernière version via ETICS http://egee-jra1.web.cern.ch/egee-jra1/ Software Development > gLite 3.1 Builds Les SAM tests passent maintenant Déployé sur PPS et cclcgceli03 (Production) Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Prochaines étapes Mise à jour des WNs (4) 05/07/2018 Mise à jour des WNs (4) Prochaines étapes Si tout est ok, configuration de tous les CEs dès lundi prochain pour attaquer cette installation des WNs Déploiement des UIs la semaine prochaine Et donc des VO boxes Redémarrage des services de VO faisant appel à lcg_env Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Pierre-Emmanuel a: Mise à jour des CEs (1) 05/07/2018 Mise à jour des CEs (1) Pierre-Emmanuel a: Deployé un CE Torque/Maui avec la version SL4 du LCG-CE (3.1.3-0) sur une VM Adapté nos scripts de déploiement (cc-yaim) Au nouveau YAIM A la réorganisation du M/W Au nouveau GIP (globus-mds -> BDII) Puis déployé un LCG-CE-bqs sur une VM cclcgceli06 Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Etat du déploiement Mise à jour des CEs (2) 05/07/2018 Mise à jour des CEs (2) Etat du déploiement Il reste un problème à résoudre avec le GIP Mais il est identifié: le nouveau GIP efface le contenu d’un répertoire dans lequel lcg-info-dynamic-bqs « cache » des données Un fix est en cours Ensuite CE cclcgceli05 sera réinstallé en SL4 Mis en production sur le T2 Attendu la semaine prochaine Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Planning de déploiement 05/07/2018 Mise à jour des CEs (3) Planning de déploiement Migration progressive de tous les CEs vers SL4 Stratégie de migration à (re)définir CE cclcgceli02 est un bon premier candidat Il supporte toutes les VOs sur le T2 Publication instable avec la version actuelle Semble résolu avec la version SL4 Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Mise à jour des CEs (4) Nouveau BQSJobmanager en test 05/07/2018 Mise à jour des CEs (4) Nouveau BQSJobmanager en test Sur le CE cclcgceli07 (PPS) Nouveautés Nouvelle stratégie de gestion des états BQS Tient compte des états BQS décrits par Julien: jobs « done » et « deleted » Et application d’une heuristique pour les cas de fin inhabituelle Si EndTime > now + 30mn, alors jobs status = failed Nouvelle indexation du cache contenant les données des jobs BQS Ajout dans le « path » de l’utilisateur et de l’heure /var/spool/bqsjobmanager/jobs/dteam003/lcg020319/lcg0203192022-20787/ Devrait éviter les problèmes des 32000 répertoires sous /var/spool/bqsjobmanager/jobs Mise en production: Prévu pour être posé à chaud (compatibilité ascendante) Mais il reste à adapter les « scripts » de ménage du cache des jobs BQS Avant les vacances de février ? Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008
Monitoring Nagios Pas d'avancée majeure depuis la dernière réunion. 05/07/2018 Monitoring Nagios Pas d'avancée majeure depuis la dernière réunion. Raison: 100% sur le déploiement du LCG CE SL4 Présentation à Philippe Olivero des possibilités de Nagios en comparaison avec l'existant (NGOP). Un recrutement CDD prévu pour l'équipe exploitation (congé maternité de Nadia) Avec pour mission la mise en place de l'outil de supervision. Reste à implémenter Tester la publication des Software tags sur les CE (T1, T2), le comparer à un fichier de référence et envoyer une notification en cas de changement. Autre test a faire ? Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008