Projet LCG: Déploiement Pierre Girard EGEE/LCG ROC EGEE/LCG site deployment Centre de Calcul de l’IN2P3 LCG France Lyon, 14 décembre 2005
P.Girard 2 Table des Matières Objectifs Contexte Déploiement LCG France Conclusions Liens utiles
P.Girard 3 Objectifs Déploiement de production Le rythme est donné Au niveau des sites français
P.Girard 4 Objectifs Déploiement de production Installation et mise-à-jour du middleware Optimiser la disponibilité des ressources Garantir la stabilité et la continuité des services Gestion des risques Configuration adaptée à chaque expérience Concertation entre VOs et Sites pour optimiser l’utilisation des ressources Identifier les services à faire tourner Adaptation à l’infrastructure de production de chaque site
P.Girard 5 Objectifs Le rythme est donné 2006: tout le monde entre dans la danse Vous êtes ICI
P.Girard 6 Objectifs Au niveau des sites français Maîtrise experte du middleware Sur la version courante, et autant que possible sur la (ou les) prochaine(s) version(s) Comprendre son fonctionnement pour ne pas le subir Maîtrise des interventions sur les sites Définition de procédures pour des interventions « sans (trop de) douleurs » la sécurité, les « backup », etc. Retour à la production dans un état stable et fonctionnel Identification des sources d’information et des interlocuteurs Pour la configuration des VOs Pour le middleware Pour les plannings et la coordination
P.Girard 7 Contexte Projets LCG/EGEE Cycle de vie du Middleware Rôles d’un ROC Outils d’aide au déploiement Outils d’aide à la configuration
P.Girard 8 Contexte Projets LCG/EGEE LCG: modèle de calculEGEE: modèle d’exploitation RAL/UK CNAF/IT PIC/SP CCIN2P3/FR FNAL/US T0 T1s Cambridge Rome Nikhef GRIF Krakow T2s IN2P3-SUBATECH IN2P3-LPC T3s IN2P3-CPPM IN2P3-LAPP UK/CCLRC IT/INFN SWE/IFAE FR/IN2P3 SEE/GRNET ROCs Cambridge Rome Nikhef GRIF Krakow RCs IN2P3-SUBATECH IN2P3-LPC IN2P3-CPPM IN2P3-LAPP OCC … … … CGG-LCG2 IPSL-IPGP-LCG2 … IN2P3-CC CEA-DAPNIA-SACLAY 170 sites Le même middleware Les mêmes sites La même infrastructure de grille Définit une utilisation Définit le fonctionnemen t Ne pas dupliquer les structures Réutiliser et adapter aux besoins de LCG
P.Girard 9 Contexte Cycle de vie du Middleware EGEE-II : Décomposition du M/W en 2 couches Foundation Grid Middleware Application independent Security model and infrastructure, Computing (CE) & Storage Elements (SE), Accounting, Information providers and monitoring Higher-Level Grid Services Specific solutions for supported applications Workload Management, Replica Management, Visualization, Workflows, Grid economies, etc. ProductionPre-production Testing/ Integration Support/ Development Other sw providers SA1SA3 JRA1 componentsreleases components high-level services components feedback, bugs, fixes Bob Jones - EGEE 4th conference - Pisa
P.Girard 10 Contexte Rôles d’un ROC Intermédiaire entre les sites et le projet Représente officiellement les sites de sa fédération auprès du projet. Coordonne, assiste et suit les sites dans leur déploiement S’informe continuellement des évolutions du projet, en assurant une forte présence dans les différents événements du projet Certification des sites de sa fédération Utilise sa propre infrastructure de test (grille régionale) et/ou utilise celle proposée par le projet Peut sortir un site de production si besoin est (problème de sécurité, dysfonctionnement avéré, etc.)
P.Girard 11 Contexte Outils d’aide au déploiement (1) Test, Monitoring et Metrics GIIS Monitor Site Functional Tests Soumission de SFTs
P.Girard 12 Contexte Outils d’aide au déploiement (2) Analyse d’une intervention et de ses conséquences Arrêt BQS Pb CE au redémarrage Drainage BQS Prévu Imprévu Ajout de mesure préventive : Basculer sur un CE de secours
P.Girard 13 Contexte Outils d’aide à la configuration Gestion des ressources et du workflow CIC Français CC-IN2P3 Vue par acteur: User, VO, RC, ROC, CIC Support des procédures d’exploitation ex.: CIC On-Duty Point d’entrée unique Intégrateur des outils d’exploitation
P.Girard 14 LCG France Etat des lieux Ressources Services Perspectives
P.Girard 15 LCG France Etat des lieux Production T1: CC (certifié) 3 T2s: GRIF (certifié), LPC (certifié), SUBATECH (en cours) 2 T3s: LAPP (certifié), CPPM (certifié) Pré-production (IN2P3-CC) VOMS FTS CE gLite Le ROC rassemble une communauté d’experts Grid Anime des formations Favorise l’entraide et l’échange de procédés entre sites Ex.: installation du M/W via Quattor ou YAIM, résolution de problèmes Le ROC s’appuie sur les outils fournis par EGEE Infrastructure de production Une fois certifiés, les sites sont autonomes
P.Girard 16 Déploiement LCG France Ressources Prévoir l’accroissement des ressources gérées par les Computing et Storage Elements ~Capacité actuelle du CC-IN2P3 ~10 x Capacité actuelle du CC-IN2P3 L’inertie augmente avec la capacité
P.Girard 17 Déploiement LCG France Services Actuellement ~3 Resource Brokers 1 File Transfer Service +ieurs LCG File Catalogs (locaux) +ieurs User Interfaces 3 MyProxy servers +ieurs MonBox (Accounting) 4 VO Boxes Futur ? Doit-on prévoir des services dédiés à la communauté française ?
P.Girard 18 Déploiement LCG France Perspectives (1) Infrastructure de test française Réutilisation et amélioration des SFTs Frédéric Schaer (CCIN2P3) D’autres intéressés ? Testbed « light » S’isoler de la production Utilisation de machines virtuelles –TestGrid de Grid-Ireland (140 VMs avec 45 machines) –VMware (LAPP, CC), Xen (CGG) –A venir, test d’échange d’images de VMs entre le LAPP et le CC D’autres intéressés ? Estimation des sites: 12% des SFTs sont pertinents
P.Girard 19 Déploiement LCG France Perspectives (2) La pré-production n’est pas le monopole du CC Invitation des autres sites à y participer Concertation avec les VOs Exemple du CC : Contacts actifs avec les VOs –David Bouvet: Atlas et Lhcb –Artem Trunov: Alice et Cms Site Web avec Wiki/Logs : –Utilisation par tous les sites ? Calendrier « online » mixant les événements des VOs et des sites ?
P.Girard 20 EGEE fournit le cadre du déploiement + d’une mise-à-jour tous les 2 mois Transition vers gLite (certains nœuds gLite déjà en production) Le ROC/T1 coordonne le déploiement au niveau français Tous les sites Français sont fonctionnels Il est important que les Sites et VOs fonctionnent de concert Il y a encore … Conclusions
P.Girard 21 Liens utiles EGEE ROC France : CIC France : Projet EGEE : LCG GOC : Projet LCG : User Support GGUS : Monitoring GridIce : Monitoring Gstat :
P.Girard 22 Questions