EGEE France, Marseille, 24 mars 2005 INFSO-RI Enabling Grids for E-sciencE Activité SA1 Core Infrastructure Centre Pierre Girard ROC deputy / RC site administrator Centre de Calcul de l’IN2P3
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Table des Matières Principes d’exploitation –Collaborations LCG/EGEE –1 er Niveau / LCG –2 ième Niveau / EGEE Canaux de communication de SA1 –Internes –Externes Core Infrastructure Centre –Outils d’exploitation –CIC Français Conclusions
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Principes d’exploitation Collaborations LCG/EGEE Les deux projets partagent la même infrastructure (technique) de grille : –Le même middleware (fourni initialement par LCG, basé sur Datagrid) –La plupart des sites offrent leurs ressources aux deux projets Les deux projets se distinguent par : –Leurs objectifs: grille dédiée : orientée par les applications LHC, organisation des sites en termes de capacités et d’objectifs de production (sites Tier-0/Tier-1/Tier-2) grille générale –Leurs politiques d’administration Une contribution bilatérale : –LCG est moteur pour EGEE (Echéance en 2008) –EGEE contribue à la mise en place de l’exploitation de LCG
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Principes d’exploitation 1er Niveau / LCG Sites de la grille (physique) Ressources de calculRessources de stockageServices de la grille GOC Taipei GOC RAL Système d’information de la grille (logique) BD Sites LCG : Grid Operations Centres –Basé sur le concept de “site” (oui, mais plus de 120 sites) –Enregistrement des sites (contacts, description, périodes de maintenance, etc) –Monitoring de l’installation des sites et du système d’information –Support via une mailing-list et des pages BD Sites Replication
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Principes d’exploitation 2 ième Niveau / EGEE (1) EGEE : 1 er Découpage (logique): CICs et RCs (1) Site Ressources Services IN2P3-LAPP IN2P3-LPC IN2P3-LAL
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Principes d’exploitation 2 ième Niveau / EGEE (2) Hébergés par des sites, mais coordonnés par les Core Infrastructure Centres Forment les (nombreux) Resource Centres CIC 1 er Découpage (logique): CICs et RCs (2)
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Principes d’exploitation 2 ième Niveau / EGEE (3) Resource Centres, gérés par les Regional Opreations Centres ROC France ROC Italie ROC Europe du Sud-Ouest 2 ième Découpage (géographique): ROCs et RCs
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Principes d’exploitation Répartition 1 OMC (Operations Management Centre) –CERN 5 CICs (Core Infrastructure Centres) –CERN –France (CCIN2P3) –Italie (INFN) –Royaume-Uni (CCLRC - RAL) –Russie (SINP-MSU) 9 ROCs (Regional Operations Centres) –France (CCIN2P3) –Italie –GB+Irlande –Allemagne+Suisse –Europe du Nord (Belgique, Scandinavie, Pays Bas), –Europe du Sud Ouest (Espagne+Portugal), –Europe du Sud Est (Bulgarie, Chypre, Grèce, Israël, Roumanie), –Europe Centrale (Autriche, Hongrie, Pologne, Rép. Tchèque, Slovaquie), –Russie
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Canaux communication Internes Externes (inter-activités)
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Canaux de communication Internes CIC RC ROC RC ROC RC ROC RC ROC RC OMC 2 représentants par entité RC, ROC ou CIC (manager, deputy) Mailing-listes spécialisées –ROC managers –CIC managers –Sécurité –CIC On-Duty Réunions régulières: –ROC managers (15 j) –CIC managers (15 j) –ROC-RCs (selon le ROC) EGEE SA1-FR (15 j) –Grid Operations Area (hebdo) Suivi de l’exploitation VO/ROC/CIC managers, CIC On- Duty Outils : –Support et suivi de problèmes centralisé (GGUS) –Site de gestion du workflow d’exploitation (
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Canaux de communication Externes NA4/SA1: Operation Advisory Group (OAG) –Coordination : Frank Harris pour NA4 et Rolf Rumler (CCIN2P3) pour SA1 –Négociations bi-latérales concernant les VOs –Rapporte au PEB SA2/SA1 –Services challenges (LCG) –Services challenges Biomed (M. Goutelle et CCIN2P3 et IN2P3-LPC) Support/SA1: EGEE Support Commitee (ESC) –Coordination : Alistair Mills –GGUS (David Bouvet – CCIN2P3) –CIC On-Duty et Site Support (Gilles Mathieu – CCIN2P3) Sécurité/SA1: Joint Security Policy Group –Coordination : Ian Neilson (CERN) –Contacts sécurité ROC/RC (Benoît Delaunay - CCIN2P3) SA1/NA3 –NA3 fournit une infrastructure organisationnelle pour les formations –SA1 fournit du matériel et de la main d’œuvre (Formations par CCIN2P3 et IN2P3-LPC) JRA1/SA1 –Project Technology Forum (long terme) –Grille de Testbed/Pré-production, coordonné par Nick Thackray (court terme) Le CCIN2P3 met en place un site de pré-production JRA3/SA1 –Statistiques (Geneviève Romier, CCIN2P3 et IN2P3-LAPP)
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Core Infrastructure Centre Rappel des rôles Outils d’exploitation –Accounting –Monitoring –Gestion d’incidents centralisée CIC Français –Services –Site Web CIC
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Core Infrastructure Centre Rappel des rôles Les CICs agissent comme un seul CIC Exploitation globale –Serveurs de gestion de VO –Services de Replica Catalog –Resource Brokers –Système d’information de la grille Mise en place d’outils d’exploitation –Gestion des ressources –Monitoring –Accounting Assistance –Sites et Utilisateurs –“Astreinte” (CIC “On-Duty”) : rotation hebdomadaire des CICs Grille de pré-production –déploiement de la version N+1 du middleware sur des sites pilotes RC France Resource Brokers Replica Catalogs RC Italie … Stockage VO
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Core Infrastructure Centre Outils d’exploitation (1) Accounting ( –Basé sur R-GMA (Relational Grid Monitoring Architecture) –Déployé sur tous les RCs
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Core Infrastructure Centre Outils d’exploitation (2) Monitoring GIIS Monitor GIIS Monitor graphs Sites Functional Tests GOC Data Base Scheduled Downtimes Live Job Monitor GridIce – VO view GridIce – fabric view Certificate Lifetime Monitor
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Core Infrastructure Centre Outils d’exploitation (3) Gestion d’incidents centralisée –GGUS, développé par FZK (Forschungszentrum Karlsruhe) – –« User Support » et « Operation Support » –Interfaçable avec d’autres systèmes de suivi d’incidents (ex.: ROCs) –Qualification et affectation des incidents aux entités concernées
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Core Infrastructure Centre CIC Français – CCIN2P3 (1) Services de grille –Serveur (LDAP) de VOs: Biomed Egeode –Replica Catalog de Biomed –Installation en test d’un serveur VOMS (en cours) –RB/BDII (en test) Service de pré-production –1 CE (3 WNs) –1 SE –1 UI
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Core Infrastructure Centre France – CCIN2P3 (2) Gestion des ressources et du workflow –CIC Français CC-IN2P3 –Proposer un point d’entrée unique –Vue par acteur: User, VO, RC, ROC, CIC –Support des procédures d’exploitation CIC On-Duty EGEE Broadcast (Manager) –Intégration des outils d’exploitation GOC DB Site Functional Tests
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Remerciements Merci à Hélène Cordier et Ian Bird pour les emprunts de copies d’écran (1 ère review du projet EGEE)
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Conclusions Une production qui s’organise et s’améliore –Ian Bird: + de 80% de réussite durant les Data Challenges d’ATLAS et CMS, au lieu de 50-70% avant Le CIC français –Participation active à l’établissement de procédures d’exploitation et au développement des outils pour supporter ces procédures. Moteur dans la mise en place de la procédure de support d’exploitation (CIC « On-Duty ») et réalisation des outils correspondants sur le site web du CIC. Ambition de développement complet du Workflow d’exploitation et des ses évolutions futures –Positionnement comme l’intégrateur des outils d’exploitation à travers le site Web du CIC Mise en place d’une collaboration avec les autres acteurs (GOC, CERN, etc.) Développement de l’interfaçage entre les services (si possible via des standards)
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Liens utiles EGEE –ROC France : –CIC France : –Projet EGEE : LCG / Monitoring –GOC : –Projet LCG : GGUS : GridIce :
Enabling Grids for E-sciencE INFSO-RI EGEE France, Marseille, 24 mars Questions