Point sur avancement du service de monitoring NAGIOS

Slides:



Advertisements
Présentations similaires
KRIKORIAN Pierre HILMI Brahim
Advertisements

Quattor : Opérations Courantes - G. Philippon/M. Jouvin4-5/2/2009Quattor : Opérations Courantes - G. Philippon Opérations courantes.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
05-fevrier-2007Eric Lancon1 ATLAS Bilan Planning 2007.
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
MONITORING RÉSEAU AVEC PERFSONAR EN FRANCE : DÉPLOIEMENT ET EXPLOITATION Frédéric Schaer, CEA / DSM / IRFU / SEDI / LIS.
Quattor Status Guillaume PHILIPPON. Résumé EMI 2 / 3 DPM Changement de nom de profile SPMA 3 Aquillon Stratuslab Organisation de la communauté Quattor.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Grid Service Monitoring Working Group Exemple.
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
Comprendre Internet Bases théoriques et exercices pratiques, pour débutants complets... Et curieux !
PRESENTATION DU LOGICIEL Edité par. … et plus encore - De gérer vos présentations : individuelle, découverte ou en réunion et de générer vos précommandes.
Messagerie Open Source à la DGCP Implémentation réalisée par IBM et Pilot Systems Sylvain Viollon.
chkconfig Tel_Portable off Agenda ● Introduction – Mode de fonctionnement – Définitions ● Utilisation de base – Les commandes principales ● Utilisation.
SQL partie 5 1 LMD create – update – primary key secondary key.
Yannick Patois 1 Utilisation LCG-France Les Technical Evolution Groups et LCG-France.
1 Fully Automated Nagios. 2 ● Distribution Linux dédiée supervision ● Une ISO contenant : – La base du système sous CentOS – L'outil Nagios – Les applications.
Février 2006X. Belanger / Guilde Introduction à. Février 2006X. Belanger / Guilde Qu'est ce que Samba ? ● Implémentation libre du protocole CIFS/SMB (client.
EGI FT 2010 European Grid Infrastructure H.Cordier Credit: C. L’Orphelin, D.Fouossong, E.Urbah, M.Pellen.
Scribe Serveur pédagogique Séminaire octobre 2009.
Sécurité - Cisco ASA Outil de capture WebVPN
Présentation Scribe NG Serveur pédagogique.
VitaScan Online Calibration
Michel Jouvin LAL/Orsay
PORTEFEUILLE DE COMPETENCES
Portefeuille des compétences
Passage de Main SYSGRID Réunion 1
Séminaire EOLE Dijon Octobre 2010
Réunion Opérations France Grilles – 6 juin 2017
L’accounting dans EGEE
L’intégration en continue
GENIUS – GANGA Alternative à la CLI
C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 2 février 2007
Etat des services grid de production
Surveillance des services grille par NAGIOS
Pierre Girard LCG-France Tier
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Consolidation des services FTS et LFC
Etat d'avancement des réflexions sur la plate-forme de monitoring
Surveillance des services grille par NAGIOS
Etat des lieux des VO Boxes LHC
Les opérations régionales en France au quotidien après le 20 Avril
Déploiement d’un LCG CE
IOS Firewall - Blocage d'applets Java
Intégration des services grid à l'exploitation
Consolidation des services de grille de production
Présentation OCS-Inventory au LAPP
David Bouvet LCG France T2 T3 – LPNHE
LCG –France Tier2 & AF Réunion de Coordination – Problèmes récurrents des VOs 11 Juin- 10 Septembre Hélène CORDIER.
Suzanne Poulat - Philippe Olivero
mardi 11 septembre 2018mardi 11 septembre 2018
Exploitation et déploiement
TreqS TReqS 1.0.
Atelier régulation de la production dans un contexte grille
Windows Server 2012 Objectifs
Openstack - clients Emmanuel Braux
LCG –France Tier2 & AF Réunion de Coordination – Problèmes récurrents des VOs 10 Septembre – 21 Octobre Hélène CORDIER.
Présentation de Nagios
Une interface publique, construite sur les données de Coral
Infrastructure Opérationnelle d’EGEE
La surveillance des systèmes
Un cloud de production et de stockage
Infrastructure Opérationnelle d’EGEE2
DC04 CMS Objectif Status Planning
Formation SpeechExec Enterprise Dictate
FRAMEWORKS : XMLBEANS / STRIPES
LUSTRE Integration to SRM
Business Intelligence en ACube OLAP et Reporting avec ACubeOLAP et GRaM.
Transcription de la présentation:

Point sur avancement du service de monitoring NAGIOS mercredi 4 juillet 2018mercredi 4 juillet 2018 Point sur avancement du service de monitoring NAGIOS Réunion LCG-France Tier 1 (11/01/2008)

WLCG Grid Service monitoring Plan WLCG Grid Service monitoring Sondes fournis Outils de configuration Etat d'avancement des tests Nagios 3 Mise en production d'un service de monitoring basé sur nagios Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

WLCG Grid Service monitoring Initiative du WLCG Monitoring working group Basé sur Nagios Fournir un ensemble de sondes pour la supervision des service grille Intégrer les tests SAM Fournir un outil de configuration automatique de nagios Composants fournis sous forme de packages RPM dans un repository dedié Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

WLCG Grid Service monitoring 2 type de configuration : "Remote only" : Import des résultat des tests SAM uniquement "Remote and Local" : Import des résultat de SAM Envoi de sonde locale (Nécessite un serveur myproxy) Sondes : FTS-probe LFC-probe RGMA-probe CAdist-probe DPM-probe DPNS-probe GRAM-probe GridFTP-probe GridProxy-probe MyProxy-probe ResourceBroker-probe SRM-probe WMProxy-probe WMS-probe refresh_proxy Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

WLCG Grid Service monitoring Générateur de configuration Interroge la SAM DB Interroge le BDII (optionnel) Simple d'utilisation /opt/lcg/sbin/ncg.pl --site IN2P3-CC Créer la totalité de configuration nagios "hosts", "services", "contact" … La configuration nécessite d'etre adapté Définition des contacts du site (par défaut contact publié dans la goc DB) Suppression des tests redondant Suppression des tests SAM obsolète Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

WLCG Grid Service monitoring Etat d'avancement des test 1ere installation fin décembre sur une machine type UI non AFS Problème de timeout sur certain sondes : Les processus exécuté toujours présent en mémoire Envoi d'un rapport de bug sur la Mailing list le 07/01 Retour ce matin de James Casey et test en "primeur" du nouveau packages Problème d'un sonde qui bloque le service myproxy Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

WLCG Grid Service monitoring Etat d'avancement des test Réinstallation sur une machine SL4 AFS UI Nombreux problèmes du à l'environnement Reste à trier et à valider les sondes Valider la pertinence des tests Enlever les tests inutiles ou redondant Début prometteurs Support des sondes assurés par le projet ! Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

Version 3.0rc1 (17/12/07) Apport principal de la v3 Nagios 3 Version précédente le 23/11/07 Laisse présumer un release officielle dans les semaines à venir Apport principal de la v3 Support des résultat de plugins multi ligne Permet d'avoir des sorties plus "verbeuse" des résultat de sondes. Liste détaillé : http://nagios.sourceforge.net/docs/3_0/whatsnew.html Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

Avant Après Nagios 3 Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

Mise en production de nagios Installation de nagios similaire à celle attendus par les packages RPM du projet Authentification des utilisateur par certificate GRID-FR Définir précisement la structure des fichiers de configuration Configuration de nagios assez permissive Mécanisme d'héritage assez lourd Définir les service à superviser Fréquence des tests Contact associés … Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

Mise en production de nagios Définir un nomenclature des tests Passerelle RLS/NGOP Existant, mais non testé Ajouter éventuellement des recette NGOP aux messages **** Nagios ***** Notification Type: PROBLEM Service: hr.srce.MyProxy-ProxyLifetime Host: MyProxy server Address: 134.158.105.194 State: CRITICAL Date/Time: Fri Jan 11 12:27:07 CET 2008 Additional Info: (Service check did not exit properly) Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

Mise en production de nagios Est-ce que le service "production" est prêt pour utiliser un nouvel outil de monitoring ? Prise en compte de nouveau mails d'alerte Utilisation de l'interface de visualisation A terme : Intégration de nouvelle sondes Configuration de nagios (associé au service). Démonstrateur : http://ccgridvmli11.in2p3.fr/nagios/ Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

Exemple de configuration Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018

Exemple de configuration define command{ command_name check_fcr command_line /opt/ccin2p3/nagios/probes/check_fcr.sh -v $ARG1$ } define contact { contact_name pierrem host_notification_period 24x7 host_notification_options d,u,r host_notification_commands notify-host-by-email service_notification_period 24x7 service_notification_options w,u,c,r service_notification_commands notify-service-by-email email pbrinette@cc.in2p3.fr } define contactgroup { contactgroup_name linux-admins alias Linux Administrators name linux-admins register 1 members pierrem } define service { use generic-service host_name cclcgip01 service_description check_fcr_for_t1 # check_command check_fcr!IN2P3-CC check_command check_fcr!INFN-TRIESTE name check_fcr register 1 max_check_attempts 2 normal_check_interval 10 retry_check_interval 1 check_period 24x7 notification_options w,c,r notifications_enabled 1 contact_groups linux-admins } define host { host_name cclcgip01 alias cclcgbdiili01 address cclcgip01.in2p3.fr use generic-host max_check_attempts 2 contact_groups linux-admins check_command check-host-alive } Pierre-Emmanuel BRINETTE / Monitoring GRID Nagios 04/07/2018