La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Etat des services grid de production

Présentations similaires


Présentation au sujet: "Etat des services grid de production"— Transcription de la présentation:

1 Etat des services grid de production
02/07/2018 12/07/2007 Etat des services grid de production Pierre Girard LCG-France Tier

2 Statut des outils globaux d’exploitation Monitoring
02/07/2018 Plan Statut du déploiement Statut des outils globaux d’exploitation Monitoring Infrastructure d’exploitation grille Pierre Girard / Etat des services grid de production 12/07/2007

3 Statut du déploiement (1)
02/07/2018 Statut du déploiement (1) En juin… Arrêts du 12 et 19 -> 20 et 21 Installation de 5 services grilles sur des machines secouru fait le 11 Top BDII régional redirigé vers le LAL puis le LAPP Quelques problèmes liés à la re-planification en urgence des pannes Mobilisation pendant plusieurs jours Mise en place du T2 Site-BDII + CE (ATLAS, CMS) Accounting (« débrayé » vers le T1 pour l’été) Pierre Girard / Etat des services grid de production 12/07/2007

4 Statut du déploiement (2)
02/07/2018 Statut du déploiement (2) En juin… encore Remplacement du CE cclcgceli02 (Atlas) par le CE cclcgceli04 Cclcgceli02 va être mise-à-jour et être utilisé pour la soumission sur SL4 Changement du mapping sur tous les CEs Séparation du T1 et T2 Scripts pour extraire les différents mappings Suppression des informations VOMS dans la publication des Ces A la demande du projet (bug WMS) Nouveau Information Provider laissé en suspend du coup Publication « multi-clustering » sur les CEs pour prendre en compte la taille mémoire max. des classes BQS Pierre Girard / Etat des services grid de production 12/07/2007

5 Statut du déploiement (3)
02/07/2018 Statut du déploiement (3) En juin… toujours Mise à jour d’UI ( ) Pour les besoins de la VOBox atlas02 Le lendemain, une version critique sortait… ;) Donc pour l’instant, m-à-j non propagée à toutes les ccalis Arrêt définitif du RLS/RMC de Biomed Mise-à-jour du Top BDII Regional en urgence Nouveau Glue Schema (1.2 -> 1.3) Pierre-Emmanuel a beaucoup appris ;) De plus en plus autonome Pierre Girard / Etat des services grid de production 12/07/2007

6 Statut du déploiement (4) … pas fait
02/07/2018 Statut du déploiement (4) … pas fait Ce qui n’a pas été fait… M-à-j des WNs et des UIs (SL3) Devient critique Déploiement sur WN/UI SL4_32 En cours L’arrêt définitif des SE classiques Erreur dans l’envoi de l’annonce Repoussé au 3 septembre L’adaptation de la gestion des priorités pour prendre en compte les politiques des T1 et T2 Pierre Girard / Etat des services grid de production 12/07/2007

7 Statut du déploiement (5) … en cours
02/07/2018 Statut du déploiement (5) … en cours SL4_32 Mise-à-jour du CE cclcgceli02 (fin de semaine) Déploiement des WNs (3.1.0) sur AFS LFC LHCb (réplication r/o du LFC central) Machine SL4_64 en attente (fin de semaine) Version SL4 de LFC non-officielle Mais « full support » des développeurs Base de Données répliquée prête Pierre Girard / Etat des services grid de production 12/07/2007

8 Statut du déploiement (6) … prévu avant fin juillet
02/07/2018 Statut du déploiement (6) … prévu avant fin juillet Top BDII régional « load-balancé » 2 machines SL4 Installation éprouvée sur une VM SL4 Load-Balancing pour la robustesse du service (lbnamed) M-à-j des WNs/UIs SL3 Migrations des nœuds SL3 Encore sur des machines plus supportées (x330) Au fur et à mesure de la récupération de V20Z Serveurs VMware en cours de migration vers SL4 Pierre Girard / Etat des services grid de production 12/07/2007

9 Statut du déploiement (7) … travail prospectif (août ?)
02/07/2018 Statut du déploiement (7) … travail prospectif (août ?) Déploiement de test d’un cluster de CEs Tous les CEs supportent toutes les VOs Utilisation de GPFS (Loïc) Mapping commun TAGs des Vos Information provider ? Adaptation de l’Information Provider « Logical Load-Balancing » Prévu sur la nouvelle version de l’information provider Déploiement sur des VMs Clonage de plusieurs images de CE VO-oriented Load-Balancing Computing Element Computing Element Computing Element Computing Element Pierre Girard / Etat des services grid de production 12/07/2007

10 Statut des outils globaux d’exploitation
02/07/2018 Statut des outils globaux d’exploitation Nouvelle infrastructure SAM incluant des nouveaux « sensors » Beaucoup de changements Beaucoup de problèmes Mauvaise synchronisation avec la GOC DB Problème avec leur base Oracle Nouvelle GOC DB(3) Impact sur les autres outils opérationnels Des petites problèmes ergonomiques et fonctionnels en cours de correction Perturbation de l’exploitation des sites pendant juin Pierre Girard / Etat des services grid de production 12/07/2007

11 Monitoring Lemon Nagios Réinstallation sur une VM en SL5
02/07/2018 Monitoring Lemon Réinstallation sur une VM en SL5 Aucune avancée notable faute de temps Il va falloir statuer Réaffecter la responsabilité de l’installation ? Abandonner ? Nagios Remise à plat de tests (Pierre-Emmanuel) Mise-à-jour de la liste des nœuds à tester Suppression des tests obsolètes Recherche active de scripts de tests d’autres sites Pierre Girard / Etat des services grid de production 12/07/2007

12 Infrastructure d’exploitation grille
02/07/2018 Infrastructure d’exploitation grille Gestion du parc des machines Leur état, leur(s) profil(s), leur(s) responsable(s) Gestion de la configuration Des nœuds Du monitoring Gestion de la validation des nœuds Suite de tests post-installation Suite de scripts collectant l’état de la configuration des noeuds (à la source) Ex: Gestion du statut des jobs grille Fournir des informations pertinentes à la production Grid JobId, état / CE, DN et info. VOMS de l’utilisateur, dates d’expiration du proxy, mail de l’utilisateur Outils d’administration des nœuds Ex.: fermer une queue sur un CE, changer la configuration des UIs/WNs, fermer des channel Développer une infrastructure globale pour gérer tous ces aspects (factorisation et diffusion de l’information) La priorité est là, il faut dégager du temps pour ça Pierre Girard / Etat des services grid de production 12/07/2007


Télécharger ppt "Etat des services grid de production"

Présentations similaires


Annonces Google