Colloque LCG France14-15 mars 20071 SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)

Slides:



Advertisements
Présentations similaires
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Advertisements

Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Le noeud de grille Tier 3 LAPP.
► Notre société spécialisée dans la maintenance et le dépannage informatique vous propose ses solutions pour le maintient et la protection de votre parc.
RÉNOVATION BTS Comptabilité et Gestion 2015 Atelier situations professionnelles & PGI Cas Jupiter Média Chantal Bricard Jean-Marie Duplan.
Expérience du déploiement d’une Virtual Organisation (VO) locale Christophe DIARRA
Question de gestion 13 : Le document peut-il être vecteur de coopération ? Le document : - Dématérialisation des documents - Partage, mutualisation, sécurisation.
Présentation de Warehouse Un logiciel distribué exclusivement par Brain2tech SARL.
Développement d’application avec base de données Semaine 3 : Modifications avec Entité Framework Automne 2015.
© Logica All rights reserved Veille secteur bancaire – Avril 2012 Emetteur Samuel Le Péchoux Pôle Conseil I-SC Produit2012 : l'avènement du paiement.
Oison Outil Informatique de Saisie des Observations Naturalistes Caroline Pénil – 28 mars 2012.
UNIX AVANCE Yves PAGNOTTE – Janvier – QUELQUES RAPPELS SUR LES SYSTEMES D’EXPLOITATION 1.
Direction des systèmes d’information 1. Direction des systèmes d’information 2.
Opérations courantes Guillaume PHILIPPON. Sommaire Mise à jour des QWG Gestion des utilisateurs Ajout/Suppression d’un programme Préparation des « OS.
Journées informatique IN2P3/Dapnia, Lyon Septembre 2006 Consolidation des serveurs par virtualisation Retour d’expérience sur l’utilisation de VMware.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Article - R RISQUE ELECTRIQUE
Chapitre 4 Gestion des disques Module S41. Plan du cours 1. Utilisation de l'outil Gestion des disques 2. Utilisation des disques de base 3. Utilisation.
Chapitre 6 Gestion et analyse du système DNS Module S43 1.
FACTORY systemes Module 5 Page 5-1 Les outils clients Wonderware FORMATION InSQL 7.0.
1 Les logiciels en général sont classés en deux familles:  Logiciels de base  Logiciels d’applications (applications) 2.
Migration Plan adressage EPLE Migration Plan d'adressage EPLE.
La création des données d’exemplaire pour un exemplarisateur Sudoc.
Chapitre 7 Résolution de noms NetBIOS à l'aide du service WINS Module S43 1.
Atelier d’échange d’expériences et de capitalisation sur des projets d’électrification rurale en cours Schémas organisationnels Mardi 10 décembre 2002.
© 2016 IBM Corporation 1 IBM Datacap Nouveautés de la version 9 Stéphane Montri ECM Technical Sales
Chapitre 6 Déploiement et gestion des logiciels à l'aide d'une stratégie de groupe Module S44.
Journées "Grilles France " INFRASTRUCTURES T2-T3INFRASTRUCTURES T2-T3 PL REICHSTADT 16 octobre 2009 LES INFRASTRUCTURES DES SITES LCG-FR.
Migration du système de sauvegarde d’une infrastructure locale à un système centralisé IN2P3 101/06/2016 HEPIX Spring 2013 Muriel Gougerot (LAPP) and Remi.
Utilisation de Quattor par GRIF Michel Jouvin LAL/Orsay
LPSC, journée de lancement TIDRA B. Boutherin 1/12 Tier 3 du LPSC Grenoble Une infrastructure solide, originale et éco-responsable Des ressources importantes.
Mercredi 1er juin 2016 Panorama sur les outils de monitoring Cyril L’Orphelin David Bouvet.
La création des données d’exemplaire pour un responsable de Centre Régional.
Les réseaux sociaux Collège Jean Papon – La Pacaudière /
Jobs multicore dans WLCG Présentation en partie basée sur des présentations faites dans le cadre du groupe de travail multicore.
Formation à l’utilisation de K-Sup V5 février 2009 CRISI - COM.
Projet LCG: Infrastructure opérationnelle Pierre Girard EGEE/LCG ROC deputy EGEE/LCG RC coordinator Centre de Calcul de l’IN2P3
Eric Fede - 1 GESTION DES PRIORITES SUR LA GRILLE.
Mercredi 7 novembre 2007 Dominique Boutigny Activités et Évolution du CC-IN2P3 Réunion des Expériences 2007.
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
SOLUTION ONLINE DE GESTION POUR LES SPECIALISTES DU TOURISME SUR MESURE
Rotary, Crans-Montana. 2 Est-ce qu’un tel pays peut avoir des problèmes touristiques?
On the analysis of CMMN expressiveness: revisiting workflow patterns Renata Carvalho Hafedh Mili.
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
Formation Ouverte et A Distance Bureau des expertises techniques, des projets d'infrastructures et de la sécurité des systèmes d'information Parcours de.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
Déploiement de la solution de supervision FAN au sein de société CBI et de ses filiales au Maroc et en Afrique.
1 Cours n2 La règlementation. Plan de cours Le brevet de plongeur N2 Qu’est-ce qu’un N2 ? La règlementation Objectif du cours Ce cours vous permettra.
 rechercher et coordonner l'engagement des acteurs nécessaires, Christine=> Helene,Gilles (permet de réduire les groupes de travail comme mentionné dans.
Réunion des sites LCG France- Marseille juin ACTIVITES DU GROUPE ACCOUNTING FRANCE GRILLES Cécile Barbier (LAPP)
Avancées et des premiers résultats obtenus pour le suivi PC BENIN ATELIER REGIONAL DE VALIDATION ET CLOTURE DU PROGRAMME : ETAT DES PECHERIES ARTISANALES.
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
FORMATIONENT/SVT Saint Orens Vendredi 15 novembre 2013.
Mise en place d’un cloud publique et privé Guillaume PHILIPPON.
Les applications O.Legrand G. Seront. Les applications Chaque application a son Linux.
Ghita Rahal Lyon, 17 Avril 2008 Outils d’information et de suivi pour l’utilisateur.
Tier 2 au LAPP. Plan Historique Objectifs Infrastructures Status/métriques Avenir Conclusion.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
TÂCHES D’ADMINISTRATION DE LA NAGIOSBOX BIOMED LE 24 Mai 2011, Christine Leroy,
AUTOMATISME Chapitre 2: Le GRAFCET.
SDTICE 18/12/2006SG-STSI-SDTICE Enquête LV et TICE Enquête menée auprès des Interlocuteurs Académiques du 27 novembre au 18 décembre académies.
Réunion LCG France18-19 mai ACTIVITES DU GROUPE DE TRAVAIL ACCOUNTING LCG-FR / SA1-FR Cécile Barbier (LAPP)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
EGEE France, Marseille, 24 mars 2005 INFSO-RI Enabling Grids for E-sciencE Activité SA1 Regional Operations Centre Pierre Girard.
1DSM - IRFU / PM Compte rendu du site GRIF.
Eric Fede : Obernai Intégration des services grille dans l'exploitation des systèmes informatiques du laboratoire.
Persistance des données O.Legrand. Persistance developer.android.com/guide/topics/data/data-storage.htmll Plusieurs moyens sur le mobile: –Système de.
08/02/2007 Site Grille : Ambitions 2007 Pierre Girard LCG-France Tier
CREAM & ICE Réunion SA1-France 11 mars 2008
Transcription de la présentation:

Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)

Colloque LCG France14-15 mars Plan Collecte de données pour éventuelle détection d’incidents sur systèmes/services de grille  Monitoring des ressources  Mesure de l’activité (accounting) Actions correctives  De différent type  De différente implication

Colloque LCG France14-15 mars Le monitoring : pourquoi ? Un monitoring propre à chaque site est nécessaire : pour couvrir les spécificités du site :  Infrastructure  Organisation du hardware : Commun avec le laboratoire Dédié à la grille …  Organisation du middleware : Services propres (VO locale)  Organisation propre au site : Service dédié à la grille ou non (batch local, …) pour une meilleure réactivité : agir avant qu’un problème ne soit remonté par la grille Solutions déjà existantes ou pas

Colloque LCG France14-15 mars Monitoring des ressources Destiné en priorité aux administrateurs des sites Plusieurs outils disponibles :  Lemon  Ganglia  Nagios  Cacti  Outils « constructeurs »  … Au LAPP :  Nagios, CMU (HP), Ganglia

Colloque LCG France14-15 mars Monitoring des ressources Informations présentées :  Etat global des machines / services  Configuration système : OS, CPU, mémoire … Paramètres surveillés :  Charge CPU  Utilisation mémoire, swap  Espace disque utilisé et débits d’E/S … Types d’informations :  Vues globales  Vues agrégées : services, nœuds de calcul, stockage, … Mode de fonctionnement :  Consultations à la demande (avec ou sans historique)  Remontées d’alertes automatiques (Nagios, Lemon)

Colloque LCG France14-15 mars Ganglia au LAPP Surveillance de l’activité des systèmes grille en 2 groupes :  Machines de services : UIs, CE, RB, BDII, …  Nœuds de calcul : WN001, WN002, …

Colloque LCG France14-15 mars Ganglia pour les WN Monitoring des nœuds de calcul :

Colloque LCG France14-15 mars CMU (HP) au LAPP Pour les nœuds de calcul uniquement (valeurs instantanées)

Colloque LCG France14-15 mars Accounting Complément du monitoring :  Remontée de métriques caractérisant les services du site  Permet de définir le (re-)dimensionnement des services (ajout d’un RB, d’espace de stockage, …)  Permet de connaître le comportement de certains services et d’agir en conséquence  Donne un état de l’activité du site Destiné aux administrateurs mais aussi aux utilisateurs Surveillance de l’activité :  Des services (ex : requêtes sur le RB pour voir les jobs soumis)  Du stockage (ex : status des pools de disque)  Des nœuds de calcul (ex : comportement du scheduler)  …

Colloque LCG France14-15 mars Accounting du RB au LAPP Requêtes sur le RB pour extraire des informations du type :  Liste et états des jobs du jour  Bilan des jobs pour les n jours précédents par utilisateur

Colloque LCG France14-15 mars Accounting des WN au LAPP Outil complémentaire aux outils de grille indispensable car utilisateurs locaux et utilisateurs grille Objectifs :  Visualiser la consommation des ressources de calcul  Vérifier que les priorités et la répartition des ressources sont respectées et agir en conséquence  Faire un suivi de l’utilisation du système (mensuel, annuel)

Colloque LCG France14-15 mars Accounting des WN : principe DB MySQL Dates Utilisateurs, groupes Nombre de jobs Nombre de CPUs utilisés Temps en queue Temps de calcul … Informations TORQUE/MAUI

Colloque LCG France14-15 mars Accounting des WN : exemple

Colloque LCG France14-15 mars Gestion d’incidents : actions Redémarrage d’un service Reconfiguration d’un service :  changement de taille d’un pool DPM  modification des règles du scheduler  exclusion temporaire d’une machine en panne du job manager  … Déploiement d’un nouveau service :  ajout d’un SE  ajout d’un CE  … Intervention sur le matériel :  intégration de nouveau hardware  remplacement de matériel en panne  upgrade de matériel

Colloque LCG France14-15 mars Gestion d’incidents Actions correctives en cas de détection de problème selon possibilités :  Immédiates  Programmées Types d’intervention :  Sans incidence sur la disponibilité du système ou du service (ex : suppression d’un WN, ajout d’un RB)  Avec nécessité de publier un « scheduled downtime » sur la grille (ex : migration de CE ou de SE)

Colloque LCG France14-15 mars Questions ?