EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit Novak, Piotr Nyczyk, Valentin Vidic)
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 2 Etat des lieux Outils disponibles GOC DB SFT SFT Admin Pages SAM GRIDVIEW Gstat GGUS CIC Dashboard FCR
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 3 GOC DB Information Statique centralisée Données sur l’ensemble des sites partenaires (ou presque) contact, security contact, certification status, site type 290 sites actuellement scheduled downtimes Utilisé par monitoring tools SFT + gstat (via RGMA), SAM scripts qui génèrent des fichiers de config (BDII) operations management tools On Duty Dashboard
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 4 GOC DB
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 5 GOC DB
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 6 SFT Affichage du status d’un site, point de vue utilisateur Teste differents aspects d’un CE / Site: job submission, replica management, LCG version, rgma, CA rpms, etc. Soumission SFT officielle depuis le CERN Soumission pour les VOs dteam et ops Toutes les 3 heures Sur les sites certifiés; en production, et monitorés (status défini dans la GOC DB) Résultats des différents tests en ligne
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 7 SFT
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 8 SFT Admin Pages (Poznan) Soumission SFT à la demande Interface web pour les SFT Soumission possible aux sites non-certifiés Utilisé par : ROCs: certification d’un site site admins, GOoDs (Grid Operator On Duty)
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 9 SAM Service Availability Monitoring monitoring framework pour les services GRID "evolution des SFT " services mis en jeu : –CE, SE, BDII, RB, FTS etc. Developpement des sondes réparti –CERN, RAL, Sinica web services + Oracle DB
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 10 SAM
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 11 GRIDVIEW Statistiques de disponibilité, basé sur R-GMA et SAM Différents services évalués –Data transfers –Job status –Service Availability CE, SE, SRM Rapports très variés Affichage par VO Affichage par (importance de) site Disponibilité globale
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 12 GRIDVIEW
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 13 GSTAT Monitoring de l’Information System (BDII) Critères : Temps de réponse Cohérence des informations Graphiques générés CPU availability (nombre de CPUs), storage space, running jobs... Mise à jour toutes les 5 mins
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 14 GSTAT
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 15 GGUS Global GRID User Support ticketing system pour la grille, basé sur Remedy tickets créés par : Utilisateurs individuels d’EGEE Opérateurs (GOoD) Fournit des liens vers La documentation, Des outils de monitoring Des “news”
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 16 CIC dashboard Partie intégrante du CIC portal Résumé des informations de monitoring (GSTAT + SFT/SAM + GOC DB) –Classement par importance de site (CPUs) Création et management de tickets –1 ticket par site et par problème –Attention aux problèmes liés ! (Ré-)envoi d’ s (templates) si mise à jour de ticket
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 17 CIC dashboard
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 18 Lien entre les outils CIC dashboard gstat Monitoring tools GGUS Problem reporting et tracking fix Modifications des tickets Sites Admins (s) sft Grid operator tests résultats
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 19 FCR Freedom of Choice for Resources Sélection des “tests critiques” (SFT) et des ressources pour les VOs manipulation de la configuration des BDII Selection CEs Selection des SEs Le but : Sélectionner les fonctionnalités importantes pour chaque VO Blacklister (officieusement et automatiquement) les sites instables Exclure une ressource déficiente dès que possible
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 20 FCR - VO Biomed FCR : SFT :
Enabling Grids for E-sciencE EGEE-II INFSO-RI Journées Informatique IN2P3/DAPNIA, Lyon Valpré 21 Questions