Etat d'avancement des réflexions sur la plate-forme de monitoring

Slides:



Advertisements
Présentations similaires
Compte rendu Journée JOSY
Advertisements

Formation des Chefs d’établissement Vague 3 Janvier-Février 2011 – V.0 SAFCO-Mission TICE-IUFM Formation ENT Exploiter les statistiques.
1 / Univnautes Projet de portail captif de L'UNPiDF Pierre Cros
Outils et scénarios d’édition collaborative en Haute École Étienne Vandeput Projet HETICE © CRIFA - ULg.
Reformulation  L’AFPA promoteur du projet souhaite mettre en place une application WEB afin de remplacer une solution en Java. Pour ce projet 4 mandataires.
Présentation de Scribe Votre nouvelle organisation du Réseau Informatique Pédagogique.
CRM et e-marketing ● La gestion de la relation client est devenue un enjeu commercial majeur ● Il faut conquérir, transformer et fidéliser une clientèle.
1 Systèmes informatiques embarqués Direction Technique Systèmes Ce document est la propriété intellectuelle de DASSAULT AVIATION. Il ne peut être utilisé,
Ministère de l'Écologie, du Développement durable, des Transports et du Logement jEOLE 23 – 24 novembre 2011 Amon et.
Présentation LabPlus v3. Solution novatrice en Technologies de l’information Solution novatrice en Technologies de l’information Application pour la Gestion.
LE SUPPORT D'ORDINATEUR PORTABLE. Problématique Oh, j'ai chaud aux jambes ! Et moi, j'ai chaud à mon processeur !
Ministère de l'Écologie, du Développement durable, des Transports et du Logement Journées EOLE 23/24 Novembre 2011 Les.
Développement d'applications Web avec le framework PHP Symfony 2 Mathieu Peltier (Mercator Océan - CNRS) (UMS 831, Observatoire Midi-Pyrénées)
Logiciel Assistant Gestion d’Événement Rémi Papillie (Chef d’équipe) Maxime Brodeur Xavier Pajani Gabriel Rolland David St-Jean.
Initiation à QuickPlace, janvier Initiation à QuickPlace n Nature de l'outil n Fonctions de base (lecture, création) n Fonctions de gestionnaire.
Comité technique du 30/03/2012 Point d'étape sur l'assistance de la DISI Ouest.
Ministère de l'Écologie, du Développement durable, des Transports et du Logement jEOLE 23 – 24 novembre 2011 eSML Laurent.
1 TER 2012 Engilberge, Lludice, M'rah Flex Web Roster /32.
Installation De Peakup.  Télécharger le fichier peakup2.4.0.free.zip  Décompresser le fichier extrait sur une Directory de votre choix  Créer un lient.
Refonte du portail eaufrance Présentation du cadre de référence pour avis GCIB – 14/10/2014 – Anne Macaire.
L’EIAH AMBRE- ADD 1 Mise en place d’une personnalisation du logiciel à partir de profils d’apprenants Nathalie Guin Marie Lefevre Stéphanie Jean-Daubias.
Cahier des charges.
L’activation des réseaux informatique des lycées
Reforme du collège physique chimie au cycle 4
Comment Sécuriser Le Système d’information de son entreprise
Expérience de l’Université de Boumerdes
Déploiement de Octopus au CISSS de la Montérégie-Ouest
LE POINT DE VUE D’UN PHARMACIEN HOSPITALIER PRATIQUANT LES VALIDATIONS
PLAN DE FORMATION DES EQUIPES DES SYSTEMES D’INFORMATION EN DELEGATION
Centre Universitaire des Ressources Informatiques CURI-UH2MC
Cahier des charges Hôpital Avicenne.
Séminaire Novembre 2006 Zephir : Déploiement et supervision des serveurs Eole.
AugerDb / SimDb Gestion des simulations Auger Java
FENIX Aperçu GLOBALE DU Système
SECURITE DU SYSTEME D’INFORMATION (SSI)
Virtualisation d’applications mobiles dans un réseau de Cloudlets
Intégration des services grid à l'exploitation
Projet de « cellule Europe mutualisée »
Institut Universitaire Virtuel de Formation des Maîtres
GLPI Gestion libre de parc informatique Application à la cellule DSI Pédagogie Avec liaison OCS-NG Gaétan TIRMONT.
3- Nouvelles pages d’accueil
Mme Sarah Aouhassi Ingénieur d’Etat en Statistiques
DATA WEARHOUSE 1ère année LA: Technologies systèmes d’information
Branche Professionnelle des organismes de formation
Partage et Synchronisation de fichiers
Integrated Business intelligence
USER GUIDE : BASE DE DOCUMENTATION
ODP Application de gestion des événements Occupant le Domaine Public
LLAGONNE Vincent MAUPIN Nicolas FERNANDEZ Quentin
Module 13 : Implémentation de la protection contre les sinistres
Mésocentre de calcul et de stockage ouvert sur la grille EGEE (MUST) LAPP/ Université de Savoie / EGEE.
AG Clio 12 octobre 2018 Commission Education.
Les collectivités locales et l’e-Education
Un Mécanisme d‘Adaptation Guidé par le Contexte en Utilisant une Représentation par Objets Manuele Kirsch Pinheiro Laboratoire LSR – IMAG, Équipe SIGMA.
Bäz: Données relationnelles sécurisées
Infrastructure Opérationnelle d’EGEE2
Exploiter le WEB Etape no5.
REUNION DES INTENDANTS ET CHEF DE TRAVAUX BUREAU D’ETUDES TECSEN
Groupe de travail « Gestion des données de l’université »
Design, innovation et créativité
Exploitation de vos données
Backup des Postes de Travail
Modélisation des SI et de la connaissance
UC : Diagramme des cas d’utilisation Req : Diagramme d’exigence
CR-GR-HSE-414 Exigences HSE pour l’opération des pipelines
Convention 20 septembre 2019.
Transcription de la présentation:

Etat d'avancement des réflexions sur la plate-forme de monitoring 17/07/2018 Etat d'avancement des réflexions sur la plate-forme de monitoring Pierre-Emmanuel Brinette Pierre Girard

Retour sur la journée monitoring Synthèse sur nagios PLAN Retour sur la journée monitoring Généralités (synthèse* des présentations) Synthèse sur nagios Exemple d'utilisation par d'autres sites Retour d'expérience et point de vue personnel Discussion autour de la plateforme de monitoring au CC * Copier/Coller Réflexions sur la plate-forme de monitoring 17/07/2018

Retour sur la journée Monitoring JoSy "Supervision systèmes et réseaux (Open Source) dans un laboratoire de recherche" Programme et documents : http://www.resinfo.cnrs.fr/spip.php?article27 2 Présentations générale sur la supervision 2 Présentations sur nagios/Centreon Présentation de Zabbix par une SSII Présentation de Cacti Présentation de NMAP Présentation du monitoring réseau des labos IN2P3 (EXTRA) Réflexions sur la plate-forme de monitoring 17/07/2018

Généralités Enjeux de la supervision : Critères de choix : http://www.resinfo.cnrs.fr/IMG/pdf/supervision_introduction.pdf Enjeux de la supervision : Vue globale de l'infrastructure informatique Détection et prévention de pannes Indicateurs sur la performance de son architecture Optimisation de la disponibilité des services Remontées d'alertes (disponibilité des services) Critères de choix : Coût important en temps d'installation Reporting indispensable Supervision avec historique : recensement des maillons faibles de l'infrastructure, permet d'améliorer l'architecture. Réflexions sur la plate-forme de monitoring 17/07/2018

Généralités Travail préparatoire : 2 enjeux majeurs : http://www.resinfo.cnrs.fr/IMG/pdf/supervision_introduction.pdf Travail préparatoire : La compréhension des besoins prend plus de temps que l'installation du logiciel de supervision Création de la liste des équipements à surveiller Listing des paramètres de supervision: Services à surveiller Paramétrage des alertes associées Personnalisation des traitements 2 enjeux majeurs : Outil d'aide à la sécurité et de robustese Outils de reporting d'évènements en matière de sécurité sur les éléments actifs du réseau Outil d'aide à l'optimisation de l'exploitation Optimisation des performances Prévention des pannes Evolution du système d'information Réflexions sur la plate-forme de monitoring 17/07/2018

"Trop d'information tue l'information" Généralités http://www.resinfo.cnrs.fr/IMG/pdf/supervision_introduction.pdf [page10] : "Trop d'information tue l'information" => Faire attention à la pertinence des remontées d'informations Réflexions sur la plate-forme de monitoring 17/07/2018

Généralités http://www.resinfo.cnrs.fr/IMG/pdf/supervision_principes.pdf 4 phases : Collecte des données (acquisition). ciblage (ce qui sera mesuré) acquisition (comment le faire) stockage (où placer les mesures) Analyse des données recueillies. en direct (actif) en différé (passif) Action déclenchée par l’analyse. visualisation graphique (passif, pré-conditionnement) alertes (actif) réactions (actif) Pilotage (ou contrôle par l’opérateur). déclencher l’analyse (différée) renouveler mesure/analyse action sur l’objet de la mesure ou sur le système (ouverture/fermeture de ports réseaux, etc.) Réflexions sur la plate-forme de monitoring 17/07/2018

Nagios : Exemple d'utilisation http://www.resinfo.cnrs.fr/IMG/pdf/nagios.pdf Exemple d'utilisation à l'Univ Rennes 1 3 serveurs en production 1 Nagios "Serveur" pour 99 Serveurs / 625 Services 1 Nagios "Proximité" (bornes libre accès, salles,…) : 30 Serveurs / 66 Services 1 Nagios ToIP : 930 équipement téléphonique. Retour d'expérience: Utilisé depuis 2002, Aucun problèmes majeurs sur les serveurs (non redondés) Nagios uniquement pour les services, le monitoring réseau est fait par d'autres outils (CACTI, HP OpenView). Eclatement en services (Serveurs, téléphonie...) : Cloisonnement des intervenants et interventions Clarté et synthèse de l'affichage Applications développées autour de Nagios : information des utilisateurs (états des ressource MAIL/WEB/…) Actuellement à l'étude pour migrer vers Centreon (Nagios + service de configuration + graph RRD ) Réflexions sur la plate-forme de monitoring 17/07/2018

Nagios : Exemple d'utilisation http://indico.cern.ch/getFile.py/access?contribId=0&sessionId=1&resId=0&materialId=slides&confId=20228 Exemple d'utilisation au RAL Utilisé pour surveiller 900 Host / et 18000 Services Intégré à l'outil de supervision interne "Mimic" http://www.nagios.org/userprofiles/quickstats.php Autres exemples d'utilisateurs de Nagios Réflexions sur la plate-forme de monitoring 17/07/2018

Retour sur la journée monitoring Synthèse sur nagios PLAN Retour sur la journée monitoring Généralités (synthèse* des présentations) Synthèse sur nagios Exemple d'utilisation par d'autres sites Retour d'expérience et point de vue personnel Discussion autour de la plateforme de monitoring au CC * Copier/Coller Réflexions sur la plate-forme de monitoring 17/07/2018

Retour d'expérience et point de vue personnel Points positifs Produit mature et largement utilisé Système qui a fait ses preuves. Grande communauté d'utilisateurs. Documentation exhaustive. Capable de gérer un grand nombre de services simultanément. Il existe un grand nombre de sondes disponible En particulier pour le projet LCG et la grille Intégration de sondes assez facile. Il est très facile d'envoyer des données le moteur de nagios Richesse et souplesse des options de configuration On peut ajuster la quasi-totalité des paramètres S'adapte à tous les cas de figure : monitoring centralisé, distribué, passif, en utilisant ou non des agents. Réflexions sur la plate-forme de monitoring 17/07/2018

Retour d'expérience et point de vue personnel Points négatifs Non adapté à certaines tâches Monitoring réseau par SNMP Interface de visualisation (Web) austère et limités: Vue par Machines / Service, par groupes de Machines/Services Vue des problèmes en cours. PAS de passibilité de gérer des ACL pour accéder à des sous parties Gestion minimale des droits d'accès à la console. L'authentification des utilisateurs est faite par le serveur web (apache). Pas d'historisation de métrique mesurée, seul les changements d'état sont sauvegardé. La configuration peu vite devenir complexe et difficile à maintenir. Il est important de bien définir les règles d'écritures des configuration, qu'elles soient stockés en fichiers ou par IHM. Réflexions sur la plate-forme de monitoring 17/07/2018

Retour d'expérience et point de vue personnel A l'utilisation Outil parfait pour détecter rapidement des changement d'états sur des services. Utilisation des ressource système ridicules sur le serveur (Sur 1 an : CPU < 10% sur un X330 pour 21 machines et 66 services supervisé). La pertinence des erreurs remontés dépend directement de la "qualité" de la sonde. Il est nécessaire d'adapter la fréquence de notification des messages (au mois de février, 859 mails envoyés à grid-exploitation) Problèmes rencontrés Une erreur de syntaxe dans les configuration peut être difficile à détecter. Utilisation de sondes mal écrite problématique : Cas d'erreurs mal gérés, gestion des timeout, faux positifs…. Problème d'environnement Problèmes avec certaines bibliothèques PERL/Python (sondes WLCG) Problèmes avec l'environnement "lcg_env" Réflexions sur la plate-forme de monitoring 17/07/2018

Retour d'expérience et point de vue personnel Et Centreon ? (http://www.centreon.com/Product/Features.html) Projet basé sur nagios et 100 % compatible Offre un interface de configuration et de nouvelles fonctionnalités : Dashboard Génération de graphes RRD dynamiques Vue multiutilisateurs Retour d'expérience (à ma connaissance) L'IPNL a choisi ce système pour superviser son site. L'université de Rennes souhaiterais migrer vers cette solution. Inconnues Fiabilité de l'outil ? Tenue en charge ? Communauté d'utilisateurs ? Réflexions sur la plate-forme de monitoring 17/07/2018

Discussion autour de la plateforme de monitoring au CC Première ébauche d'un document de définition des besoins. Liste de fonctionnalités possibles que devrait offrir le système. Liste des contraintes liés à la mise en place de ce système. But: Délimiter le périmètre d'utilisation du système Définir ce qui doit être supervisée (et ce que ca implique!) Ce document pourrait servir de base à une étude plus poussé : Quantification de la charge de travail induite pour la réalisation, plans de déploiement, … A mon avis : La mise en place d'une plateforme de supervision implique plus de travail au niveau organisationnel qu'au niveau technique. Même si l'outil retenu est identique ! Réflexions sur la plate-forme de monitoring 17/07/2018