Cécile Barbier David Bouvet Christine Leroy L'exploitation de la grille au quotidien.

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

Active Directory Windows 2003 Server
3/26/2017 7:29 PM Taxonomie et gouvernance Organiser le patrimoine informationnel des entreprises © 2006 Microsoft Corporation. All rights reserved. This.
LCG DATAGRID - France 8 Juillet 2002 LCG : LHC Grid computing - qui, quoi, quand, comment ? Quoi ? But : préparer l'infrastructure informatique des 4 expériences.
Module 1 : Préparation de l'administration d'un serveur
Parcours de formation SIN-7
Activité du Groupe Monitoring LCG/SA1 fr LCG T2 T3 Face to Face meeting Mai 2009.
Ipchains TP 1 TP 2 TP 3 Installer un serveur web sur votre poste,
Active Directory Windows 2003 Server
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Le monitoring réseau dans EGEE Guillaume.
Avancement des équipes de rédaction INSPIRE CNIG - Groupe de liaison INSPIRE 8 septembre 2009 Marie-Louise ZAMBON - IGN.
L’instance nationale de DIRAC Gilles Mathieu Workshop opérations 10 mai - Lille Lille – Mai 2012.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Projet LCG: Déploiement Pierre Girard EGEE/LCG ROC EGEE/LCG site deployment Centre de Calcul de l’IN2P3 LCG France Lyon, 14 décembre.
Accounting régional. Status actuel Base de données node56 : – 22GiB de données – 16 sites – 3.7TiB disponibles… Tous sites sur la base de données node56.
Frédérique Chollet Yannick Patois Réunion LCG-France, Nantes 19 septembre 2012 Résultats du questionnaire DPM.
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
Activités et actualités de la Direction Technique Hélène Cordier, Gilles Mathieu – 10/01/2012 – CTE10 CTE 10 – 10 janvier 2012.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Contact Sécurité du ROC français R. Rumler.
EGEE-III INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks SLA, SLD, MoU et Sécurité Rolf Rumler, CC-IN2P3.
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Quattor : Opérations Courantes - G. Philippon/M. Jouvin4-5/2/2009Quattor : Opérations Courantes - G. Philippon Opérations courantes.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Transition vers EGEE-III (et EGI?) Pierre.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Rapport du ROC France Pierre Girard French.
Transition EGEE SA1 FR vers Opérations France Grille
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks OSCT / OSCT-DC R. Rumler Lyon/Villeurbanne.
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
Présentation DU PROGICIEL NAGIOS
Mandat du Groupe -collecter les besoins des responsables des sites et de services de la région, -recenser les pratiques des sites et les outils de monitoring.
La Charte Informatique
Formation « Administrateur ATRIUM ». 1.Un accompagnement technique par la Région Formation des « administrateurs » Support technique 2.Un accompagnement.
Monitoring: état et perspectives Cette présentation fera le point sur le travail effectué au sein du groupe de travail, créé au sein de LCG-France et EGEE.
Système local d’accounting de l’IPHC 31/05/2011 Eric Kieffer.
Transition EGEE - EGI Jeudi 15 octobre 2009 Dominique Boutigny Guillaume Cessieux Pierrick Micout Bilan de la journée.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Roadmap opérations Revue fin 2013 Planification 2014 Visio opérations – décembre 2013.
Mardi 30 mars 2010 Technologies employées par le portail des opérations Cyril L’Orphelin, Olivier Lequeux, Pierre Veyre IN2P3/CNRS Computing Centre, Lyon,
Catalogues de fichiers de données. David Bouvet2 Problématique Possibilité de répliquer les fichiers sur divers SE  nécessité d’un catalogue de fichiers.
Mercredi 1er juin 2016 Panorama sur les outils de monitoring Cyril L’Orphelin David Bouvet.
Opérations France-Grilles : Etat des lieux Hélène Cordier/Gilles Mathieu LCG France, 30 Mai 2011.
Réunion EGEE France 11/6/2004Page 1Rolf Rumler Structure de l’exploitation d’EGEE.
Session « Pôle Infrastructure » Pierre Girard CC-IN2P3 ATELIER France-Grilles au CC-IN2P3 12 octobre 2010.
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
Conclusions (?) Fabio Hernandez Frédérique Chollet Fairouz Malek Réunion Sites LCG-France Annecy, May
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
Groupe de travail Monitoring LCG-France / SA1-FR Christine Leroy Pierre Girard Fabio Hernandez Frédérique Chollet.
Les Opérations dans la NGI et les outils et les procédures opérationnelles de la NGI H. Cordier Crédits : V.Dutruel, D.Fouossong, C. L’Orphelin.
Fabio Hernandez Lyon, 9 novembre 2006 LCG-France Tier-1 Réunion de Coordination.
Tier-2 : GRIF  CEA/IRFU  LAL  LLR  LPNHE  IPNO  APC Suivi des opérations au niveau français: quelle organisation, quels outils Hélène Cordier LCG-FR.
 rechercher et coordonner l'engagement des acteurs nécessaires, Christine=> Helene,Gilles (permet de réduire les groupes de travail comme mentionné dans.
Réunion des sites LCG France- Marseille juin ACTIVITES DU GROUPE ACCOUNTING FRANCE GRILLES Cécile Barbier (LAPP)
Resource allocation: what can we learn from HPC? 20 janvier 2011 Vincent Breton Crédit: Catherine Le Louarn.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks La région France dans la grille EGEE David.
Mardi 30 mars 2010 Les Outils d'Exploitation et de Surveillance Cyril L’Orphelin, Atelier technique France Grilles, 31 Mai 2010 IN2P3/CNRS Computing Centre,
Nouvelle procédure de demande de support informatique au LAPP
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
Procédures de sécurité dans France Grilles et EGI Réunion sécurité France Grilles Juin 2013, Clermont-Ferrand.
Activité du Groupe Monitoring LCG/SA1 fr LCG T2 T3 Face to Face meeting Mai 2009.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
Session: Intégration de nouveaux sites Le point de vue du ROC Pierre Girard French EGEE ROC deputy CC-IN2P3 grid site administrator.
TÂCHES D’ADMINISTRATION DE LA NAGIOSBOX BIOMED LE 24 Mai 2011, Christine Leroy,
Réunion LCG France18-19 mai ACTIVITES DU GROUPE DE TRAVAIL ACCOUNTING LCG-FR / SA1-FR Cécile Barbier (LAPP)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Site Monitoring -Contexte des sites Grilles EGEE &/|| LCG -Etat des sites Francais -Le groupe de travail LCG-Fr / SA1-FR monitoring et les prochaines actions.
EGI FT 2010 European Grid Infrastructure H.Cordier Credit: C. L’Orphelin, D.Fouossong, E.Urbah, M.Pellen.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Opérations : vers un modèle décentralisé...
Modèle opérationnel de la grille
Infrastructure Opérationnelle d’EGEE
Infrastructure Opérationnelle d’EGEE2
Transcription de la présentation:

Cécile Barbier David Bouvet Christine Leroy L'exploitation de la grille au quotidien

Plan Introduction Surveillance, "accounting", tickets et suivi des incidents, opérateurs de la grille Questions

Introduction Les outils Opérationnels pour la grille et leurs intéractions Information sur les ressources: GOCDB Monitoring: SAM/gstat/Nagios Accounting: Apel, accounting portal User support: GGUS Suivi de tickets: Dashboard EGI impose une régionalisation de ces outils: quelles implications?

Surveillance,

Actuellement surveiller son site = collectionner les onglets Plusieurs outils/sources de monitoring Local: nagios ou script VO: Dashboard Grille: SAM,gstat 1) Surveiller son site grille aujourd’hui

La présentation / l’échange/ la corrélation des données de monitoring restent les challenges majeurs du monitoring d’une grille  Liés aux opérations: Qui à la charge de surveiller?  Ne pas oublier les utilisateurs  Solutions choisies par EGEE:  Nagios: site monitoring; regional monitoring; gStat; and project and regional Metric Stores  MSG (Messaging System for Grids) :  ActiveMQ (Messaging System)  WLCG Format (Format des données)  Django (Django, a python based development framework, is used in the Metric Description DB, Aggregated Topology Provider, Worker Node configuration system, Metric Results Store and the WLCG Topology Provider) 2) Surveiller son site demain, vue OAT

"accounting",

Portail hébergé à CESGA : En France : mise à jour de la base APEL via la couche de transport R-GMA puis envoi des données au GOC (quelques soucis) envoi des données nominatives autorisé suite à la déclaration CNIL n° du 20/08/09 Wiki LCG-FR/SA1-FR Accounting WG Wiki LCG-FR/SA1-FR Accounting WG 1) L’accounting de la grille aujourd’hui

European Middleware Initiative (EMI) : Standardization efforts (RUS, UR) et harmonisation du logiciel à partir de ARC, gLite et UNICORE Usage Record (UR) WG Objectif : définir un format commun (basé sur l’actuel) pour les enregistrements pour que les sites puissent partager leur données d’accounting Resource Usage Service (RUS) WG Objectif : définir et développer une interface pour comptabiliser l’usage des ressources mais sans se préoccuper de l’aspect facturation ActiveMQ va remplacer Relational Grid Monitoring Architecture (R-GMA) d’ici fin 2009 pour les 1ers sites Nouvelle architecture pour le GOCDB L’acronyme ADC (Accounting Data Center) remplace GOC (Grid Operations Centre) dans les documents du Joint Security Policy Group (JSPG) Main Challenges for EGI: Storage Accounting Local job Accounting NGI Accounting Portal (nouvelles fonctionnalités au niveau du portail EGEE) 2) L’accounting demain dans EGI

Suite aux soucis de publication des derniers mois avec R-GMA, le CC va envoyer des résumés de consommation directement dans la GOCDB. Quand ActiveMQ sera opérationnel, un client fera de même. Quelle solution en France dans le futur ? Type 3 : Repository régional (avec portail web) au CC extensible à toute la France Type 2 : Les sites autres que le CC ne changent rien à leur fonctionnement actuel 3) L’accounting demain en France

tickets et suivi des incidents, opérateurs de la grille

1) Opération de la grille Actuellement : mode régional avec une fine couche centrale qui fait le lien avec le projet surveillance des sites via le dashboard régional pour les test de la VO OPS suivi des tickets opérations avec procédure d’escalation pas de surveillance des tests spécifiques des VO probablement à venir mais uniquement pour les VO LHC Transition vers EGI : fin 2009/début 2010 : mise à disposition d’un package du dashboard régional basé pour les tests Nagios pour les NGI

2) La NGI française et les opérations ? Les opérations pour les VO LHC oui, mais et les autres ? La NGI française aura besoin d'indicateur opérationnel pour toutes les VO Besoin de discussion avec les sites et les VO régionales sur les procédures opérationnelles à mettre en œuvre modèle des procédures WLCG ou autre ? Nécessité de créer des sondes spécifiques aux VO régionales intégrer les VO au groupe monitoring Mise en place d’un dashboard national spécifique nécessité de récupérer les alarmes en provenance du Nagios régional pour la soumission et le suivi des tickets ⇒ besoin d’un système de ticket national

3) Les incidents et leur suivi Besoin d’un système de ticket (pas seulement pour les opérations) point d’entrée unique pour la soumission d’incident de la grille française assignation site, VO interfaçage avec GGUS (ticket VO LHC) interfaçage avec le système de tickets global à EGI (si ≠ de GGUS) pour les core services transNGI Utilisation de GGUS en tant qu’helpdesk national probablement difficile ⇒ système de ticket national : définition du workflow des tickets, qui héberge/gère le service ? Manpower ? équipe pour les opérations équipe pour la gestion des tickets utilisateur  intégrée à l’équipe monitoring ?

Questions

Quelle est la suite de l’OAT dans EGI: un nouveau projet européen pour le développement d’outils d'exploitation? Qui participera à ces développements (à la fois sonde nagios et outils d'exploitation gocdb/dashboard…), sur quel fond? Comment se coordonner avec ce nouveau projet: est-ce que le groupe monitoring répond à ces attentes? La gestion de l'infrastructure de monitoring sous jacente ainsi que l'interopérabilité sont aussi des challenges auxquels nous devons répondre: Combien de serveurs mettra-t-on en France, qui les gèrera ? nos serveurs de messagerie Français seront-ils interopérables avec les serveurs d'autres NGI? Problème de manpower: Aujourd’hui les membres du groupe monitoring ont N tâches en plus du monitoring: des embauches sont elles prévues? En plus de nouvelles embauches nécessaires, on peut peut-être optimiser les choses: Aujourd’hui sur chacun des sites une personne doit régulièrement regarder les différentes sources de monitoring pour connaitre l’état de son site et régler les problèmes; est-ce que demain on peut envisager une équipe monitoring pour surveiller l’état de tous les sites: spécialiser les personnes, plutôt que de les rendre multitâche? Est-ce souhaitable? Exemple du GRIF: ou il y a un monitoring local commun et possibilité de régler les problèmes via des connexion par gsissh Exemple du RCOD: ou David et Cyril Gère les tickets pour la France. D’autres idées? Quelle solution d’accounting en France dans le futur ? Type 3 : Repository régional (avec portail web) au CC extensible à toute la France Type 2 : Les sites autres que le CC ne changent rien à leur fonctionnement actuel définir les opérations dans la NGI française quel outil et quelle procédure pour ces opérations ? quel système de tickets pour la NGI ? Manpower ? équipe pour les opérations équipe pour la gestion des tickets utilisateur => intégrée à l’équipe monitoring ? Questions / débats