Pierre Girard LCG-France Tier

Slides:



Advertisements
Présentations similaires
Réunion LCG-France, 7/4/2008 C.Charlot Acc è s aux donn é es Accès à dCache Problèmes de stageout des fichiers produits sur les WNs  Aussi pour le stagein.
Advertisements

EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
05-fevrier-2007Eric Lancon1 ATLAS Bilan Planning 2007.
Evènements Opérations Octobre : Vision, Buts, Logistique, Participation et Cibles H. Cordier.
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
État de la production LHC et statut de BQS Suzanne Poulat – groupe production.
Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR Marseille Juin 2010Jean-Michel BARBET Subatech 1 /22 Support de la VO Alice à.
Subversion. 2 Subversion : Pour Quoi Faire ? Problèmes de la gestion du code dans un projet – Durée de vie du projet peut être longue : besoin de gérer.
Séminaire EOLE Beaune Septembre 2007 SPHYNX NG.
Messagerie Open Source à la DGCP Implémentation réalisée par IBM et Pilot Systems Sylvain Viollon.
Séminaire EOLE Beaune Septembre 2007 AMON NG.
EGI FT 2010 European Grid Infrastructure H.Cordier Credit: C. L’Orphelin, D.Fouossong, E.Urbah, M.Pellen.
Déploiement du service Pack Business Entreprises
BTS SIO (Services Informatiques aux Organisations)
JT11-RSI janvier et 8 janvier 1999
Utilisation de PostgreSQL
Michel Jouvin LAL/Orsay
SmarTeam-Coord : mandat, composition, activités
LCG-France Tier-1 & AF Réunion mensuelle de coordination
PORTEFEUILLE DE COMPETENCES
Séminaire EOLE Beaune Septembre 2007
Portefeuille des compétences
Passage de Main SYSGRID Réunion 1
PPE – Contexte Service de consultation des stages de la section STS-SIO Exploité sur le serveur Intranet Barney depuis 2005 Utilisé par les professeurs.
Réunion Opérations France Grilles – 6 juin 2017
L’accounting dans EGEE
Batterie TSE.
Lustre au DAPNIA.
GENIUS – GANGA Alternative à la CLI
Atelier Opérations 29 Novembre - INRA - Bordeaux
Présentation du CERN Service Portal
Planification budgétaire Tier2s & Tier-3s Etat d’avancement
Etat des services grid de production
12 mars 2004, Lyon Reunion CAF F.Chollet 1
Point sur avancement du service de monitoring NAGIOS
Surveillance des services grille par NAGIOS
Status des problèmes d’accès à la software area de LHCb
Intégration de BQS dans CREAM
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Surveillance des services grille par NAGIOS
Etat des lieux des VO Boxes LHC
Intégration de BQS dans CREAM
Déploiement d’un LCG CE
Réunion de Coordination – Bilan des opérations LCG Hélène CORDIER
Réunion coordination WLCG Lyon, le 13 mars 2008
Etat actuel et perspectives des CEs
Consolidation des services de grille de production
2018/8/9 CLAP Cluster de virtualisation et de stockage distribué du LAPP Mardi 26 avril 2016 Entrez votre nom.
Présentation OCS-Inventory au LAPP
LCG-France Tier-1 & AF Réunion mensuelle de coordination
LCG –France Tier2 & AF Réunion de Coordination – Problèmes récurrents des VOs 11 Juin- 10 Septembre Hélène CORDIER.
Suzanne Poulat - Philippe Olivero
Synthèse problèmes rencontrés par les expériences LHC au CC-IN2P3
CREAM-CE et SGE.
Exploitation et déploiement
TreqS TReqS 1.0.
Atelier régulation de la production dans un contexte grille
Prise en main Emmanuel Braux Institut Mines Telecom / Télécom Bretagne
LCG –France Tier2 & AF Réunion de Coordination – Problèmes récurrents des VOs 10 Septembre – 21 Octobre Hélène CORDIER.
Infrastructure Opérationnelle d’EGEE
Réunion des directeurs
Middleware : Status et Evolution
Infrastructure Opérationnelle d’EGEE2
DC04 CMS Objectif Status Planning
Comité Scientifique GRIF
MIGRATION DE DONNEES GEP vers SCONET
Test de performances. Test de performances:  Un test de performance est un test dont l'objectif est de déterminer la performance d'un système informatique.
Intégration GRIF Michel Jouvin Comité Technique GRIF 28 Novembre 2005.
Présentation PISTE pour les partenaires raccordés en API
Transcription de la présentation:

Pierre Girard LCG-France Tier-1 2008-02 05/07/2018 07/02/2008 Point sur le déploiement des versions du middleware nécessaires pour CCRC'08 Pierre Girard LCG-France Tier-1 2008-02

Mise à jour des WNs Mise à jour des CEs Monitoring Nagios Plan 05/07/2018 Plan Mise à jour des WNs Mise à jour des CEs Monitoring Nagios Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Démandé pour CCR08 Mise à jour des WNs (1) 05/07/2018 Mise à jour des WNs (1) Démandé pour CCR08 WN Service/SL4 gLite 3.1 In production Mais… patché avec Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Déployé en test au CC (mardi 07/02) 05/07/2018 Mise à jour des WNs (2) Déployé en test au CC (mardi 07/02) De 3.1.0-2 à 3.1.4-1(Latest release) Incluant: lcg_util 1.6.7-1.slc4 (demandé 1.6.6-1) GFAL-client 1.10.7-1.slc4 (demandé 1.10-7-2) Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Mise à jour des WNs (3) Premiers résultats Quick fix 05/07/2018 Mise à jour des WNs (3) Premiers résultats Déploiement sur AFS sans problème Mais bug #32999 sur la version de production de lcg-utils Echec des SAM tests Quick fix Récupération de la dernière version via ETICS http://egee-jra1.web.cern.ch/egee-jra1/ Software Development > gLite 3.1 Builds Les SAM tests passent maintenant Déployé sur PPS et cclcgceli03 (Production) Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Prochaines étapes Mise à jour des WNs (4) 05/07/2018 Mise à jour des WNs (4) Prochaines étapes Si tout est ok, configuration de tous les CEs dès lundi prochain pour attaquer cette installation des WNs Déploiement des UIs la semaine prochaine Et donc des VO boxes Redémarrage des services de VO faisant appel à lcg_env Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Pierre-Emmanuel a: Mise à jour des CEs (1) 05/07/2018 Mise à jour des CEs (1) Pierre-Emmanuel a: Deployé un CE Torque/Maui avec la version SL4 du LCG-CE (3.1.3-0) sur une VM Adapté nos scripts de déploiement (cc-yaim) Au nouveau YAIM A la réorganisation du M/W Au nouveau GIP (globus-mds -> BDII) Puis déployé un LCG-CE-bqs sur une VM cclcgceli06 Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Etat du déploiement Mise à jour des CEs (2) 05/07/2018 Mise à jour des CEs (2) Etat du déploiement Il reste un problème à résoudre avec le GIP Mais il est identifié: le nouveau GIP efface le contenu d’un répertoire dans lequel lcg-info-dynamic-bqs « cache » des données Un fix est en cours Ensuite CE cclcgceli05 sera réinstallé en SL4 Mis en production sur le T2 Attendu la semaine prochaine Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Planning de déploiement 05/07/2018 Mise à jour des CEs (3) Planning de déploiement Migration progressive de tous les CEs vers SL4 Stratégie de migration à (re)définir CE cclcgceli02 est un bon premier candidat Il supporte toutes les VOs sur le T2 Publication instable avec la version actuelle Semble résolu avec la version SL4 Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Mise à jour des CEs (4) Nouveau BQSJobmanager en test 05/07/2018 Mise à jour des CEs (4) Nouveau BQSJobmanager en test Sur le CE cclcgceli07 (PPS) Nouveautés Nouvelle stratégie de gestion des états BQS Tient compte des états BQS décrits par Julien: jobs « done » et « deleted » Et application d’une heuristique pour les cas de fin inhabituelle Si EndTime > now + 30mn, alors jobs status = failed Nouvelle indexation du cache contenant les données des jobs BQS Ajout dans le « path » de l’utilisateur et de l’heure /var/spool/bqsjobmanager/jobs/dteam003/lcg020319/lcg0203192022-20787/ Devrait éviter les problèmes des 32000 répertoires sous /var/spool/bqsjobmanager/jobs Mise en production: Prévu pour être posé à chaud (compatibilité ascendante) Mais il reste à adapter les « scripts » de ménage du cache des jobs BQS Avant les vacances de février ? Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008

Monitoring Nagios Pas d'avancée majeure depuis la dernière réunion. 05/07/2018 Monitoring Nagios Pas d'avancée majeure depuis la dernière réunion. Raison: 100% sur le déploiement du LCG CE SL4 Présentation à Philippe Olivero des possibilités de Nagios en comparaison avec l'existant (NGOP). Un recrutement CDD prévu pour l'équipe exploitation (congé maternité de Nadia) Avec pour mission la mise en place de l'outil de supervision. Reste à implémenter Tester la publication des Software tags sur les CE (T1, T2), le comparer à un fichier de référence et envoyer une notification en cas de changement. Autre test a faire ? Pierre Girard / Etat du déploiement pour CCRC08 07/02/2008