Monitoring: état et perspectives Cette présentation fera le point sur le travail effectué au sein du groupe de travail, créé au sein de LCG-France et EGEE.

Slides:



Advertisements
Présentations similaires
DUT Réseaux et Télécomm
Advertisements

« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
« ARCHEODOC, un portail dynamique pour la recherche d’information en archéologie » Véronique HUMBERT (Lattes) Blandine.
Guillaume KRUMULA présente Exposés Système et Réseaux IR3 Mardi 5 Février 2008.
Projet Alerte SMS.
Retour sur l'allocation d'espace Exemple sur une table facture (sans les tables associées) N° fact, N° Client, N° Cde, date Cde, date fact, date réglement,
Module 1 : Préparation de l'administration d'un serveur
Nouveau système de courriel à la FMSS
Activité du Groupe Monitoring LCG/SA1 fr LCG T2 T3 Face to Face meeting Mai 2009.
Ipchains TP 1 TP 2 TP 3 Installer un serveur web sur votre poste,
ATELIER REGIONAL DES NATIONS UNIES SUR LA DIFFUSION ET LA COMMUNICATION DES DONNEES (du 13 au 15 mai 2014)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Le monitoring réseau dans EGEE Guillaume.
Alice LCG Task Force Meeting 16 Oct 2008Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1/20BARBET Jean-Michel - 1/20 LCGFR Marseille Juin.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Projet LCG: Déploiement Pierre Girard EGEE/LCG ROC EGEE/LCG site deployment Centre de Calcul de l’IN2P3 LCG France Lyon, 14 décembre.
Accounting régional. Status actuel Base de données node56 : – 22GiB de données – 16 sites – 3.7TiB disponibles… Tous sites sur la base de données node56.
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Contact Sécurité du ROC français R. Rumler.
Module 3 : Création d'un domaine Windows 2000
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Modernisation du système d’information de la Fnars De nouveaux outils pour quoi faire ?
Quattor : Opérations Courantes - G. Philippon/M. Jouvin4-5/2/2009Quattor : Opérations Courantes - G. Philippon Opérations courantes.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Transition vers EGEE-III (et EGI?) Pierre.
4/13/2017 3:41 PM Intégration Visio SharePoint 2010 Application à la création de Workflows Genève -15 Avril 2010 Michel LAPLANE MVP Visio - WGroupe.
Transition EGEE SA1 FR vers Opérations France Grille
Réalisé par : Grégory CORDIER Promotion : RIE03 UE : Management Social & Humain Réalisé par : Grégory CORDIER Promotion : RIE03 UE : Management Social.
Recapitulatif des sujets abordés Frédérique Chollet Fabio Hernandez Fairouz Malek Réunion LCG-France Tier-2s & Tier-3s Paris, 20 mars 2008.
ATLAS Ghita Rahal CC-IN2P3 Novembre 9, /6/2006Réunion CAF2 Activités Création et externalisation d’outils de monitoring de l’état du T1 (CPU,
Enabling Grids for E-sciencE EGEE-III INFSO-RI Sécurité sur la Grille G. Philippon (LAL – CNRS ) Tutorial EGEE Utilisateur (DAKAR)
CMS : SPIP Formation PBC – Septembre SPIP = Système de publication Internet SPIP = Système de publication Internet SPIP = CMS = Content Management.
Mandat du Groupe -collecter les besoins des responsables des sites et de services de la région, -recenser les pratiques des sites et les outils de monitoring.
GRIF Status Michel Jouvin LAL/Orsay
Transition EGEE - EGI Jeudi 15 octobre 2009 Dominique Boutigny Guillaume Cessieux Pierrick Micout Bilan de la journée.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Cécile Barbier David Bouvet Christine Leroy L'exploitation de la grille au quotidien.
Mardi 30 mars 2010 Technologies employées par le portail des opérations Cyril L’Orphelin, Olivier Lequeux, Pierre Veyre IN2P3/CNRS Computing Centre, Lyon,
1 Le dispositif d’évaluation Présentation de XiTi Mise à disposition d’un outil d’analyse statistique : XiTi  Accessible en ligne pour le chef d’EPLE.
Développement des templates Quattor de gLite à EMI Guillaume PHILIPPON.
Mercredi 1er juin 2016 Panorama sur les outils de monitoring Cyril L’Orphelin David Bouvet.
Opérations France-Grilles : Etat des lieux Hélène Cordier/Gilles Mathieu LCG France, 30 Mai 2011.
Réunion EGEE France 11/6/2004Page 1Rolf Rumler Structure de l’exploitation d’EGEE.
Session « Pôle Infrastructure » Pierre Girard CC-IN2P3 ATELIER France-Grilles au CC-IN2P3 12 octobre 2010.
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
Conclusions (?) Fabio Hernandez Frédérique Chollet Fairouz Malek Réunion Sites LCG-France Annecy, May
Configuration des sites Intérêt de la mutualisation ! Existant avec Quattor Tendance Puppet Discussion.
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
Groupe de travail Monitoring LCG-France / SA1-FR Christine Leroy Pierre Girard Fabio Hernandez Frédérique Chollet.
Les Opérations dans la NGI et les outils et les procédures opérationnelles de la NGI H. Cordier Crédits : V.Dutruel, D.Fouossong, C. L’Orphelin.
Fabio Hernandez Lyon, 9 novembre 2006 LCG-France Tier-1 Réunion de Coordination.
Tier-2 : GRIF  CEA/IRFU  LAL  LLR  LPNHE  IPNO  APC Suivi des opérations au niveau français: quelle organisation, quels outils Hélène Cordier LCG-FR.
 rechercher et coordonner l'engagement des acteurs nécessaires, Christine=> Helene,Gilles (permet de réduire les groupes de travail comme mentionné dans.
Réunion des sites LCG France- Marseille juin ACTIVITES DU GROUPE ACCOUNTING FRANCE GRILLES Cécile Barbier (LAPP)
JI septembre 2006Frédéric Melot – Patricia Warin-Charpentier – Daniel Charnay Système de réservation PHPMyResa
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks La région France dans la grille EGEE David.
Mardi 30 mars 2010 Les Outils d'Exploitation et de Surveillance Cyril L’Orphelin, Atelier technique France Grilles, 31 Mai 2010 IN2P3/CNRS Computing Centre,
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
Procédures de sécurité dans France Grilles et EGI Réunion sécurité France Grilles Juin 2013, Clermont-Ferrand.
CNRS GRID-FR CA Sophie Nicoud
Tier 2 au LAPP. Plan Historique Objectifs Infrastructures Status/métriques Avenir Conclusion.
Activité du Groupe Monitoring LCG/SA1 fr LCG T2 T3 Face to Face meeting Mai 2009.
TÂCHES D’ADMINISTRATION DE LA NAGIOSBOX BIOMED LE 24 Mai 2011, Christine Leroy,
Réunion LCG France18-19 mai ACTIVITES DU GROUPE DE TRAVAIL ACCOUNTING LCG-FR / SA1-FR Cécile Barbier (LAPP)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
1DSM - IRFU / PM Compte rendu du site GRIF.
08/02/2007 Site Grille : Ambitions 2007 Pierre Girard LCG-France Tier
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Site Monitoring -Contexte des sites Grilles EGEE &/|| LCG -Etat des sites Francais -Le groupe de travail LCG-Fr / SA1-FR monitoring et les prochaines actions.
EGI FT 2010 European Grid Infrastructure H.Cordier Credit: C. L’Orphelin, D.Fouossong, E.Urbah, M.Pellen.
Surveillance des services grille par NAGIOS
Les opérations régionales en France au quotidien après le 20 Avril
Transcription de la présentation:

Monitoring: état et perspectives Cette présentation fera le point sur le travail effectué au sein du groupe de travail, créé au sein de LCG-France et EGEE SA1-FR et qui a rejoint la structure de la NGI France Grilles. Le système de monitoring basé sur Nagios étant aujourd'hui opérationnel au niveau de la "région", la migration des tests de SAM vers Nagios et les évolutions à venir seront évoquées. Christine Leroy 1 Réunion des sites LCG-France, CPPM Marseille June 2010

Plan: Monitoring à tiroir Monitoring Regional (Nagios + Dashboard) Monitoring des sites Monitoring des VOs LHC Monitoring EGI/WLCG 2 Regional VO Projet CE GRIF OK GRIF nagios

Réunion des sites LCG-France, CPPM Marseille June 2010 Ca y est le monitoring des sites Français est assuré par une Nagios BOX au CC: Elles surveillent les services suivant: CE CREAM-CE Central-LFC Classic-SE FTS LB Local-LFC MON MyProxy SRM Site-BDII Top-BDII VO-box VOMS WMS Les administrateurs sont: Carlos Jacques Nadia Christine Emmanuel => Un seul contact: fr-regional-monitoring-admins-lATfrance-grilles.fr Monitoring Regional: La nagios BOX (1/2) 3

Réunion des sites LCG-France, CPPM Marseille June 2010 Caractéristiques: Installée/configurée via Yum/Yaim Machine redondée via une machine virtuelle (bascule manuel: en attente de licence Vmware pour une bascule automatique) Fichiers de configurations dans un repository SVN au CC Utilisation de proxy ops/Role=lcgadmin Utilisation du myproxy de GRIF, de WMS du CERN Publication des résultats via ActiveMQ A poursuivre: Installer une deuxième nagios box sur un autre site (redondance + monitoring CC de l’extérieur): Octobre Mettre en place un broker pour les échanges entre Nagios BOX et Dashboard, et Nagios BOX et site de la NGI France: pas clair. 4 Monitoring Regional: La nagios BOX (2/2)

La récupération des enregistrements se fait à travers ActiveMQ sur un topic – Notre web Service Lavoisier est un consommateur de ActiveMq (aucun accès direct au Nagios Boxes) Un seul point d'accès à configurer On filtre tous les enregistrements par : – La criticité des tests ( liste officielle de tests à faire apparaitre) – La provenance des notifications ( Nagios cern, ou regional). Monitoring Regional: Le Dashboard (1/3) recuperation des résultats de nagios 5 Réunion des sites LCG-France, CPPM Marseille June 2010

28/04/1030/03/10 Monitoring Regional: Le Dashboard (2/3) intègre et croise les informations de différents services et outils Le but étant de détecter rapidement grâce à des vues synoptiques des problèmes sur les sites afin de créer et de suivre des tickets d’incidents directement à partir des interfaces du dashboard.

Réunion des sites LCG-France, CPPM Marseille June 20107

Monitoring Regional: Le Dashboard (3/3) Perspectives Caractéristiques: – – Version centrale régionalisée – Package en cours de distribution A poursuivre: Envoyer des alarmes aux sites: mails, flux rss Intégrer d'autres VOs : Possibilité de créer des tickets à partir des tests VO spécifiques de SAM (pour le moment seule l'information est présente pas d'actions possibles) Intégration des Nagiops Boxes spécifiques pour les VOs Etendre le dashboard à d'autres sources d'informations intéressantes (étude en cours / Unicore ou Arc ) Adapter l'outil aux besoins français 8

Réunion des sites LCG-France, CPPM Marseille June 2010 Monitoring Regional: pour les sites L’interface Nagios: peu convivial: on y accède seulement si on veut approfondir un problème détecter sur le dashboard Ouverte à dteam et atlas/fr pour le moment Possibilité de scheduler les tests pour son site ActiveMQ: Possibilité de récupérer les résultats des sondes nagios via ActivMQ: Yaim ou rediger un mode d’emploi? Dashboard: Interface convivial qui regroupe les résultats des différents outils liés aux opérations GOC DB a régionaliser pour : les sites qui veulent être visibles au niveau français mais pas EGI la certification des sites 9

Monitoring des sites: La plupart des sites utilisent nagios On essaye de partager les sondes dans un repository svn au CC: (pour le moment seul GRIF est contributeur) Les Nagios Box installées lors du dernier tutorial deviennent obsolètes: il faut un nagios de site de test pour valider la bonne collecte des résultats des sondes du Nagios Regional Réunion des sites LCG-France, CPPM Marseille June

Réunion des sites LCG-France, CPPM Marseille June 2010 Perspectives pour les sites: Monitoring à tiroirs…et à placards 11 Regional VO Projet CE GRIF OK GRIF ACTIVEMQ nagios

Monitoring des VOs LHC Les Vos doivent aussi passer à nagios pour abandoner SAM -Alice: -Atlas -CMS -LHCB En attendant les liens interessants: Dashboard des Vos avec une vue site: Les test SAM pour les VOs: Réunion des sites LCG-France, CPPM Marseille June

Monitoring EGI: Perspectives Disponibilité /fiabilité des sites : toujours avec GRIDVIEW ( ilability_and) MyEGEEPortal :Couche graphique associée à la Nagios Box: monitoring.cern.ch/myegee/ Monitoring du système d’information GSTAT2 GRIDMAP: Visualizing the "State" of the Grid”. Ils utilisent encore les tests SAM, est-ce que cet outil va perdurer ? Monitoring Réseau: deux outils sont migrés chez GARR (IT) + activité CNRS (UREC par IDG) DownCollector, Vision et historique des évènements réseaux – Tests TCP de tous les nœuds Grille déclarés dans la GOCDB – Présentation des résultats au travers d’une interface web et intégration dans Nagios perfSONAR lite, – Permet de lancer des tests à la demande : bande passante, ping, filtrage etc. – Permet de constater, ou non, des problèmes locaux Réunion des sites LCG-France, CPPM Marseille June

Conclusion Démarrage de EGI: On manque d’information Mais dans EGI-Inspire, leader of task TJRA1.5 (Integrated Operations Portal) : Cyril L’Orphelin Monitoring des sites (Nagios) Il faudrait organiser un tutorial sur les sondes régionales et ActiveMQ Partager plus Monitoring Regional(Nagios) Bascule automatique 2eme Nagios BOX Réunion des sites LCG-France, CPPM Marseille June

Liens Point de départ, le Wiki France Grille: Réunion des sites LCG-France, CPPM Marseille June