Projet LCG: Infrastructure opérationnelle Pierre Girard EGEE/LCG ROC deputy EGEE/LCG RC coordinator Centre de Calcul de l’IN2P3 Rencontre IN2P3/STIC Grenoble, 25 février 2005
P.Girard 2 Table des Matières Collaborations LCG/EGEE Principes d’exploitation LCG/EGEE 1 er Niveau / LCG 2 ième Niveau / EGEE Acteurs de l’exploitation Canaux de communication de l’exploitation Outils d’exploitation
P.Girard 3 Collaborations LCG/EGEE Les deux projets partagent la même infrastructure (technique) de grille : Le même middleware (fourni initialement par LCG) La plupart des sites offrent ses ressources aux deux projets Les deux projets se distinguent par : Leurs objectifs: grille dédiée vs grille générale Leurs politiques d’administration Une contribution bilatérale : LCG est moteur pour EGEE EGEE contribue à la mise en place de l’exploitation de LCG
P.Girard 4 Principes d’exploitation LCG/EGEE Sites de la grille (physique) Ressources de calculRessources de stockageServices de la grille GOC Taipei GOC RAL Système d’information de la grille (logique) BD Sites 1 er Niveau / LCG: Grid Operations Centres Basé sur le concept de “site” Enregistrement des sites (contacts, description, périodes de maintenance, etc) Monitoring de l’installation des sites et du système d’information Support via une mailing-list et des pages BD Sites Replication
P.Girard 5 Principes d’exploitation LCG/EGEE 2 ième Niveau / EGEE: CICs, ROCs et RCs (1) 1 er Découpage (logique): CICs et RCs Site Ressources Services Core Infrastructure Centres Resource Centres
P.Girard 6 Principes d’exploitation LCG/EGEE 2 ième Niveau / EGEE: CICs, ROCs et RCs (2) 2 ième Découpage (géographique): ROCs et RCs Resource Centres France Italie Europe du Sud-Ouest
P.Girard 7 Principes d’exploitation LCG/EGEE 1 OMC (Operations Management Centre) CERN 5 CICs (Core Infrastructure Centres) CERN France (CC-IN2P3) Italie (INFN) Royaume-Uni (CCLRC - RAL) Russie (SINP-MSU) 9 ROCs (Regional Operations Centres) France Italie GB+Irlande Allemagne+Suisse Europe du Nord (Belgique, Scandinavie, Pays Bas), Europe du Sud Ouest (Espagne+Portugal), Europe du Sud Est (Bulgarie, Chypre, Grèce, Israël, Roumanie), Europe Centrale (Autriche, Hongrie, Pologne, Rép. Tchèque, Slovaquie), Russie
P.Girard 8 Acteurs de l’exploitation (1) Centre de ressources (RC) Mutualisation des ressources Unités de calcul, ferme de “Worker Nodes” (WN) Unités de stockage Gestion experte de sa production Equipe de production Equipe système Equipe réseau Equipe stockage Experts: –Sécurité –Middleware Grille –… “Gérer la production au CC, c’est comme manoeuvrer un paquebot” [R. Rumler, 2004] Ferme1Ferme2 Batch System Système de partage de fichiers WN … Stockage
P.Girard 9 Acteurs de l’exploitation (2) Infrastucture de grille LCG/EGEE Mutualisation des centres de ressource Gestion des communautés via le concept de “Virtual Organization” Equipe d’exploitation répartie sur ~100 sites Donc manoeuvrer 100 paquebots de concert ! France Resource Broker(s) Replica Catalog(s) RC Italie RC … Stockage VO
P.Girard 10 Acteurs de l’exploitation (3) Core Infrastructure Centre Les CICs agissent comme un seul CIC Administration globale Serveurs de gestion de VO Services de Replica Catalog Resource Brokers Système d’information de la grille Outils d’exploitation Gestion des ressources Monitoring Accounting Assistance Sites et Utilisateurs Astreinte (CIC “On-Duty”) : rotation hebdomadaire des CICs Grille de pré-production déploiement de la version N+1 du middleware sur des sites pilotes RC France Resource Brokers Replica Catalogs RC Italie … Stockage VO
P.Girard 11 Acteurs de l’exploitation (4) Regional Operations Centre Représentant des sites d’une région Assistance aux sites de la région Coordination du déploiement du Middleware Canal de communication entre le projet et les sites Gestion régionale de la sécurité Monitoring régional Suivi des problèmes Certification des sites RC France Resource Broker Replica Catalog RC Italie … Stockage VO
P.Girard 12 Acteurs de l’exploitation (5) ROC Français: CC-IN2P3 ( CC-IN2P3 Lyon (Centre de Calcul de l'IN2P3) CC-IN2P3 LPC Clermont (Laboratoire de Physique Corpusculaire) LPC CPPM Marseille (Centre de Physique des Particules de Marseille) CPPM LAL Orsay (Laboratoire de l'Accélérateur Linéaire) LAL CGG Massy (Compagnie Générale de Géophysique) CGG ECP Paris (Ecole Centrale de Paris) ECP IPSL Paris (Institut Pierre Simon Laplace) IPSL LAPP Annecy (Laboratoire d'Annecy-Le-Vieux de Physique des Particules) LAPP DAPNIA Saclay (Département d'Astrophysique, de physique des Particules, de Physique Nucléaire et de l'Instrumentation Associée) DAPNIA CINES Montpellier (Centre Informatique National de l'Enseignement Supérieur) CINES
P.Girard 13 Canaux de communication de l’exploitation 2 représentants par entité RC, ROC ou CIC (manager, deputy) Mailing-listes spécialisées ROC managers CIC managers Sécurité CIC On-Duty Réunions régulières: ROC managers (15 j) CIC managers (15 j) ROC-RCs (selon le ROC) EGEE SA1-FR (15 j) Grid Operations Area (hebdo) Suivi de l’exploitation ROC managers, CIC On-Duty Outils : Support et suivi de problèmes centralisé (GGUS) Site de gestion du workflow d’exploitation ( CIC RC ROC RC ROC RC ROC RC ROC RC OMC
P.Girard 14 Outils d’exploitation (1) Accounting ( Basé sur R-GMA (Relational Grid Monitoring Architecture) Déployé sur tous les RCs
P.Girard 15 Outils d’exploitation (2) Monitoring GIIS MonitorGIIS Monitor graphs Sites Functional Tests GOC Data Base Scheduled Downtimes Live Job Monitor GridIce – VO view GridIce – fabric viewCertificate Lifetime Monitor
P.Girard 16 Outils d’exploitation (3) Gestion des ressources et du workflow CIC Français CC-IN2P3 Vue par acteur: User, VO, RC, ROC, CIC Support des procédures d’exploitation ex.: CIC On-Duty Point d’entrée unique
P.Girard 17 Outils d’exploitation (4) Gestion d’incidents centralisée GGUS, développé par FZK (Forschungszentrum Karlsruhe) « User Support » et « Operation Support » Interfaçable avec d’autres systèmes de suivi d’incidents (ex.: ROCs) Qualification et affectation des incidents aux entités concernées
P.Girard 18 Remerciements Merci à Rolf Rumler pour son proverbe Merci à Hélène Cordier et Ian Bird pour les emprunts de copies d’écran (1 ère review du projet EGEE)
P.Girard 19 Liens utiles EGEE ROC France : CIC France : Projet EGEE : LCG GOC : Projet LCG : GGUS : GridIce :
P.Girard 20 Questions