Compte rendu Journée JOSY 13/04/2017 Compte rendu Journée JOSY Pierre-Emmanuel Brinette Pierre Girard
Retour sur la journée Monitoring JoSy "Supervision systèmes et réseaux (Open Source) dans un laboratoire de recherche" Programme et documents : http://www.resinfo.cnrs.fr/spip.php?article27 2 Présentations générale sur la supervision 2 Présentations sur nagios/Centreon Présentation de Zabbix par une SSII Présentation de Cacti Présentation de NMAP Présentation du monitoring réseau des labos IN2P3 (EXTRA) Réflexions sur la plate-forme de monitoring 13/04/2017
Généralités Enjeux de la supervision : Critères de choix : http://www.resinfo.cnrs.fr/IMG/pdf/supervision_introduction.pdf Enjeux de la supervision : Vue globale de l'infrastructure informatique Détection et prévention de pannes Indicateurs sur la performance de son architecture Optimisation de la disponibilité des services Remontées d'alertes (disponibilité des services) Critères de choix : Coût important en temps d'installation Reporting indispensable Supervision avec historique : recensement des maillons faibles de l'infrastructure, permet d'améliorer l'architecture. Réflexions sur la plate-forme de monitoring 13/04/2017
Généralités Travail préparatoire : 2 enjeux majeurs : http://www.resinfo.cnrs.fr/IMG/pdf/supervision_introduction.pdf Travail préparatoire : La compréhension des besoins prend plus de temps que l'installation du logiciel de supervision Création de la liste des équipements à surveiller Listing des paramètres de supervision: Services à surveiller Paramétrage des alertes associées Personnalisation des traitements 2 enjeux majeurs : Outil d'aide à la sécurité et de robustese Outils de reporting d'évènements en matière de sécurité sur les éléments actifs du réseau Outil d'aide à l'optimisation de l'exploitation Optimisation des performances Prévention des pannes Evolution du système d'information Réflexions sur la plate-forme de monitoring 13/04/2017
"Trop d'information tue l'information" Généralités http://www.resinfo.cnrs.fr/IMG/pdf/supervision_introduction.pdf [page10] : "Trop d'information tue l'information" => Faire attention à la pertinence des remontées d'informations Réflexions sur la plate-forme de monitoring 13/04/2017
Généralités http://www.resinfo.cnrs.fr/IMG/pdf/supervision_principes.pdf 4 phases : Collecte des données (acquisition). ciblage (ce qui sera mesuré) acquisition (comment le faire) stockage (où placer les mesures) Analyse des données recueillies. en direct (actif) en différé (passif) Action déclenchée par l’analyse. visualisation graphique (passif, pré-conditionnement) alertes (actif) réactions (actif) Pilotage (ou contrôle par l’opérateur). déclencher l’analyse (différée) renouveler mesure/analyse action sur l’objet de la mesure ou sur le système (ouverture/fermeture de ports réseaux, etc.) Réflexions sur la plate-forme de monitoring 13/04/2017
Nagios : Exemple d'utilisation http://www.resinfo.cnrs.fr/IMG/pdf/nagios.pdf Exemple d'utilisation à l'Univ Rennes 1 3 serveurs en production 1 Nagios "Serveur" pour 99 Serveurs / 625 Services 1 Nagios "Proximité" (bornes libre accès, salles,…) : 30 Serveurs / 66 Services 1 Nagios ToIP : 930 équipement téléphonique. Retour d'expérience: Utilisé depuis 2002, Aucun problèmes majeurs sur les serveurs (non redondés) Nagios uniquement pour les services, le monitoring réseau est fait par d'autres outils (CACTI, HP OpenView). Eclatement en services (Serveurs, téléphonie...) : Cloisonnement des intervenants et interventions Clarté et synthèse de l'affichage Applications développées autour de Nagios : information des utilisateurs (états des ressource MAIL/WEB/…) Actuellement à l'étude pour migrer vers Centreon (Nagios + service de configuration + graph RRD ) Réflexions sur la plate-forme de monitoring 13/04/2017
Nagios : Exemple d'utilisation http://indico.cern.ch/getFile.py/access?contribId=0&sessionId=1&resId=0&materialId=slides&confId=20228 Exemple d'utilisation au RAL Utilisé pour surveiller 900 Host / et 18000 Services Intégré à l'outil de supervision interne "Mimic" http://www.nagios.org/userprofiles/quickstats.php Autres exemples d'utilisateurs de Nagios Réflexions sur la plate-forme de monitoring 13/04/2017