Mercredi 1er juin 2016 Panorama sur les outils de monitoring Cyril L’Orphelin David Bouvet.

Slides:



Advertisements
Présentations similaires
La supervision réseau L'exemple de Nagios Thierry Briche
Advertisements

PPE 04 – Situation Professionnelle 4 SODECAF – Surveillance du Réseau
Agence fédérale pour la Sécurité de la Chaîne alimentaire Un nouveau site pour l’AFSCA ? CC du 28 mai 2008 Agence fédérale pour la Sécurité de la Chaîne.
FORUM REGIONAL DE NORMALISATION DE L'UIT POUR L'AFRIQUE (Dakar, Sénégal, mars 2015) Outils et méthodes pour tester la qualité de services (QoS) de.
Service Challenge 4 – Tests de Débit Bilan pour le Tier-1 LCG-France Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3
Compte rendu Journée JOSY
Production DC2 ATLAS David Bouvet LHC Calcul 22 juillet 2004.
ATLAS Ghita Rahal CC-IN2P3 Novembre 9, /6/2006Réunion CAF2 Activités Création et externalisation d’outils de monitoring de l’état du T1 (CPU,
Journées Monitoring Grille
Surveillance - Monitoring
Présentation DU PROGICIEL NAGIOS
Intégration de BQS dans le gLite-CE. Réunion TCG Présentation des difficultés rencontrées: Installation gLite-CE et WMS –Sensibilité aux modifications.
FA.NI. Equipements Textiles Détecteurs Casse de Fil et Vitesse de Rotation Casse-mèche Monitorage des données de Filature FA.NI. S.a.s. Via Lago di Fimon,
JI Les systèmes d’autorisation et d’authentification dans AMI Fabian Lambert.
Sortir de MAUI – quelles options ? HTCondor dans un CREAM-CE Guillaume Philippon.
Mediator 9 - Un outil de développement multimédia 3AC Techno/Informatique.
Présentation de JobBoard Isabelle Schlesser, directrice de l’ADEM Nicolas Henckes, secrétaire général de l’UEL.
Monitoring: état et perspectives Cette présentation fera le point sur le travail effectué au sein du groupe de travail, créé au sein de LCG-France et EGEE.
Comment écrire un article scientifique Olivier MIMOZ DAR.
Tutoriel n°4 : Administration Technique Formation : profil Administrateur.
Opérations courantes Guillaume PHILIPPON. Sommaire Mise à jour des QWG Gestion des utilisateurs Ajout/Suppression d’un programme Préparation des « OS.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Le réseau web enit.org … Depuis 2003, l’Anienit - Association Nationale des Ingénieurs ENIT – à mis sur pied et finance un serveur web indépendant de l’école.
Chapitre 4 Gestion des disques Module S41. Plan du cours 1. Utilisation de l'outil Gestion des disques 2. Utilisation des disques de base 3. Utilisation.
CEF Traduction Automatique (TA) Portails "Données Ouvertes" Quels sont les avantages? Kimmo Rossi Commission Européenne, CNECT.G3 Gand/Gent 13/04/2016.
Cécile Barbier David Bouvet Christine Leroy L'exploitation de la grille au quotidien.
FACTORY systemes Module 5 Page 5-1 Les outils clients Wonderware FORMATION InSQL 7.0.
Projet Personnel (Epreuve 6) Projet réalisé dans le cadre de mon épreuve E6 au sein de mon alternance au conseil départemental du val de marne Arnaud PICANO.
Date : du 15/02/2016 au 18/03/2016.  AKKA est un groupe d’ingénierie et de conseil en technologies mondial.  Secteur d’activités : industriels et tertiaires.
Mardi 30 mars 2010 Technologies employées par le portail des opérations Cyril L’Orphelin, Olivier Lequeux, Pierre Veyre IN2P3/CNRS Computing Centre, Lyon,
Automates Programmables Industriels ( ITEEM 2004 ) I.T.E.E.M de BEAULIEU Enseignante : Mme RECHID CHAPITRE 7 Le Logiciel PL7 Présentation - Ergonomie Les.
CEA DSM Dapnia Sédi Septembre 2006/ IN2P3 LAPP || Journee Informatique IN2P3 et DAPNIA1 Monitoring interne aux sites Christine Leroy (CEA/DAPNIA) Sylvain.
RÉNOVATION BTS Comptabilité et Gestion 2015 CB2C : un exemple de situation professionnelle Christine Forest Stéphane Bessière Daniel Perrin Toinin.
Catalogues de fichiers de données. David Bouvet2 Problématique Possibilité de répliquer les fichiers sur divers SE  nécessité d’un catalogue de fichiers.
Plan d’essai. Etat final du raccord tuyau cold chuck Bilan: 6 gouttes au total (4+2) (idem 1 er essai)
2011/06/14 Efficacité des jobs d’Atlas Pierre Girard Réunion de travail avec Atlas CC-IN2P3, le 14 juin 2011.
Retour d'expérience sur le déploiement d'un site grille de production Pierre Girard EGEE/LCG ROC Deputy EGEE/LCG RC coordinator Centre de Calcul de l’IN2P3.
Sals vélo Titouan OUVRARD Antoine BROSSIER Benjamin RUAU.
CEA DSM Irfu Mises à jour de sécurité… … et la pratique F.SCHAER.
Supervision EC-Net AX Serveurs Web EC-BOS AX. ARCHITECTURE Les solutions EC-Net AX EC-Net AX Supervisor EC-Net AX EnerVue EC-Net AX Security  EC-Net.
Session « Pôle Infrastructure » Pierre Girard CC-IN2P3 ATELIER France-Grilles au CC-IN2P3 12 octobre 2010.
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
C. Charlot, LLR Ecole Polytechnique DC04 CMS Objectif numéro 1: préparation du traitement offline Différent des productions MC précédentes Mise en route.
Human Task Service (2008) Oscar Barrios et François Charoy Human Task Service Service de tâches dans un système de gestion de workflow Oscar Barrios
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
Com. info., 7 avril 2011 Vincent Poireau 1. Rôle de la commission informatique Faire un bilan de l’informatique Evaluer les besoins des utilisateurs Proposer.
 rechercher et coordonner l'engagement des acteurs nécessaires, Christine=> Helene,Gilles (permet de réduire les groupes de travail comme mentionné dans.
Réunion des sites LCG France- Marseille juin ACTIVITES DU GROUPE ACCOUNTING FRANCE GRILLES Cécile Barbier (LAPP)
Introduction Depuis le début des sites web les urls sont utilisé pour la navigation. Avec l’arrivée des bases de données, les urls ont prit de l’importance.
Microsoft OneNote LOGICIEL DE PRISE DE NOTES. Qu’est-ce que OneNote?  C’est un logiciel de la suite Microsoft Office depuis 2003  Il permet la prise.
Mardi 30 mars 2010 Les Outils d'Exploitation et de Surveillance Cyril L’Orphelin, Atelier technique France Grilles, 31 Mai 2010 IN2P3/CNRS Computing Centre,
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
Km3net vs Antares Besoin d’une organisation en réseau 4 fibres maximum 50 Kms 6 Kms.
Mise en place d’un cloud publique et privé Guillaume PHILIPPON.
Ghita Rahal Lyon, 17 Avril 2008 Outils d’information et de suivi pour l’utilisateur.
Activité du Groupe Monitoring LCG/SA1 fr LCG T2 T3 Face to Face meeting Mai 2009.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
Université Ferhat Abbas –Sétif 1 Centre des Systèmes et Réseaux d’Information Et de Communication, de Télé-enseignement et D’Enseignement à Distance Rapport.
TÂCHES D’ADMINISTRATION DE LA NAGIOSBOX BIOMED LE 24 Mai 2011, Christine Leroy,
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
Eric Fede : Obernai Intégration des services grille dans l'exploitation des systèmes informatiques du laboratoire.
08/02/2007 Site Grille : Ambitions 2007 Pierre Girard LCG-France Tier
Première connexion à l'ENT - comment se connecter - rentrer ses mots de passe - modifier son profil - indiquer son adresse mail.
Séminaire Novembre 2006 Zephir : Déploiement et supervision des serveurs Eole.
Surveillance des services grille par NAGIOS
Suzanne Poulat - Philippe Olivero
Windev.
Atelier régulation de la production dans un contexte grille
Package R Markdown: Un outil pour générer des pages html avec R Studio
Transcription de la présentation:

mercredi 1er juin 2016 Panorama sur les outils de monitoring Cyril L’Orphelin David Bouvet

But Monitoring : –état des machines –état des services –activités sur les services

Etat des machines Monitoring standard du CC : –SMURF –alertes RLS

Etat des services Actuellement la plupart des services ne sont pas surveillés. FTS, SRM et le portail CIC sont les seuls services à avoir un vrai monitoring

Services : outils utilisés NAGIOS –contrôle les CA, CRL, informations publiées par le BDII, gridmapfile, certificats, job-list-match –envoi de mails en cas de problème –quelques alertes sont générés dans RLS portail CIC : –intégrée en partie à l’astreinte : mail à Lagaffe sur certains pb de Lavoisier FTS –Surveillance FTS par le web: –Les pages de surveillance peuvent être restreintes a une vue "VO" –Nous manquons encore d'alertes automatiques via RLS (par exemple pour détecter un canal coincé) SRM/dCache –Surveillance dCache par le web: –Indication du trafic, de l'activité en nombre de connexions, %age d'erreurs, résultat des tests SAM, vérification de la publication, détection des problèmes (serveurs GFTP coincés, pools pleins, transferts lents...) –Le portail peut être restreint a une vue "VO". –Autres moyens de surveillance : Alertes RLS pour de nombreux pb + scripts exécutés par NGOP et envoi de mails a dcachemaster

Activités sur les services Graphes MRTG pour les jobs –limitation : pas d’alerte en cas de trou noir ou de non utilisation FTS –activité, état des jobs de transfert, statistique via la page web : SRM/dCache –indication du trafic, de l'activité en nombre de connexions, %age d'erreurs, résultat des tests SAM, vérification de la publication, détection des problèmes (serveurs GFTP coincés, pools pleins, transferts lents...) via le web

Outils en test LEMON –historique : inutilisable jusqu’en nov : instabilité, trop de bug, changement de version partielle avec incompatibilité dernière version semble plus stable –actuellement tout juste installée sans finalisation de la configuration –potentiel : a priori les sensors sont présents pour pouvoir surveiller tous les services grille très flexible pour l’ajout de nouveaux nœuds possibilité de générer des alarmes possibilité de surveiller aussi l’activité des services

Conclusion Manque crucial de monitoring et en particulier d’alerte LEMON semble être un bon outil : –couvre tous les points de monitoring : machines, services, activité –couvre tous les services grille –offre une visualisation graphique contrairement à NAGIOS –un seul point d’entrée –donne une bonne vision globale … mais manque de temps pour le configurer, le tester