Passage de Main SYSGRID Réunion 1

Slides:



Advertisements
Présentations similaires
Retour d'expérience sur le déploiement d'un site grille de production Pierre Girard EGEE/LCG ROC Deputy EGEE/LCG RC coordinator Centre de Calcul de l’IN2P3.
Advertisements

08/02/2007 Site Grille : Ambitions 2007 Pierre Girard LCG-France Tier
05-fevrier-2007Eric Lancon1 ATLAS Bilan Planning 2007.
Evènements Opérations Octobre : Vision, Buts, Logistique, Participation et Cibles H. Cordier.
Le projet MUST Méso infrastructure de calcul et de stockage ouverte sur la grille européenne LCG/EGEE Colloque Grille Rhône-Alpes 10 janvier 2008.
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
Quattor Status Guillaume PHILIPPON. Résumé EMI 2 / 3 DPM Changement de nom de profile SPMA 3 Aquillon Stratuslab Organisation de la communauté Quattor.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Grid Service Monitoring Working Group Exemple.
Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR Marseille Juin 2010Jean-Michel BARBET Subatech 1 /22 Support de la VO Alice à.
Support opérationnel dans France Grilles : La suite (CTE26) 8 octobre 2013.
Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 1 /18 IN2P3-SUBATECH :
Messagerie Open Source à la DGCP Implémentation réalisée par IBM et Pilot Systems Sylvain Viollon.
Autrans 1 er & 2 juin /05/15. Journées prospectives LPSC – Autrans 1 er & 2 juin thèmes retenus par le CU Organisation des projets au LPSC.
Yannick Patois 1 Utilisation LCG-France Les Technical Evolution Groups et LCG-France.
Xen et l' Art de la Virtualization Antoine Nivard Responsable technique Adéquat région Ouest Responsable de Site francophone de XEN Computer.
Mandat Groupe de travail Autorité de Certification.
Déploiement du service Pack Business Entreprises
Kévin NIGAUD - Mission pour l'interdisciplinarité
“Administration” du projet : Gestion documentaire Achats
Exploitation Informatique
Formation « Administrateur ATRIUM »
Michel Jouvin LAL/Orsay
LCG-France Tier-1 & AF Réunion mensuelle de coordination
PORTEFEUILLE DE COMPETENCES
Journée du 19/01/2001 Département Support Agence de Modernisation des
Portefeuille des compétences
Opérations France Grilles - structure et fonctions
Modèle opérationnel de la grille
Réunion Opérations France Grilles – 6 juin 2017
Projets et Activités 2016 Équipe Opération.
Atelier Opérations 29 Novembre - INRA - Bordeaux
Réunion Analyse D0 France au CCIN2P3 19 janvier 2004
Projet de Plan de formation
Etat des services grid de production
12 mars 2004, Lyon Reunion CAF F.Chollet 1
Point sur avancement du service de monitoring NAGIOS
Surveillance des services grille par NAGIOS
Pierre Girard LCG-France Tier
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Consolidation des services FTS et LFC
LCG-France Tier-1 & AF Réunion mensuelle de coordination
LCG-France Tier-1 & AF Réunion mensuelle de coordination
LCG-France Tier-1 & AF Réunion mensuelle de coordination
Surveillance des services grille par NAGIOS
Etat des lieux des VO Boxes LHC
2ème coloque LCG-France
Déploiement d’un LCG CE
Etat actuel et perspectives des CEs
Consolidation des services de grille de production
CeMEB La plateforme MBB
LCG-France Tier-1 & AF Réunion mensuelle de coordination
LCG –France Tier2 & AF Réunion de Coordination – Problèmes récurrents des VOs 11 Juin- 10 Septembre Hélène CORDIER.
Suzanne Poulat - Philippe Olivero
CeMEB La plateforme MBB
Synthèse problèmes rencontrés par les expériences LHC au CC-IN2P3
CREAM-CE et SGE.
Exploitation et déploiement
TreqS TReqS 1.0.
Informations Comité des utilisateurs du mésocentre
Atelier régulation de la production dans un contexte grille
Organisation LCG-France Lien avec le computing LHC
LCG –France Tier2 & AF Réunion de Coordination – Problèmes récurrents des VOs 10 Septembre – 21 Octobre Hélène CORDIER.
Infrastructure Opérationnelle d’EGEE
Infrastructure Opérationnelle d’EGEE2
DC04 CMS Objectif Status Planning
Comité Scientifique GRIF
Chaque transparent est divisé en 3 parties : 1/Vision/ But
Intégration GRIF Michel Jouvin Comité Technique GRIF 28 Novembre 2005.
Présentation PISTE pour les partenaires raccordés en API
Transcription de la présentation:

Passage de Main SYSGRID Réunion 1 15/05/2018 02/04/2012 Passage de Main SYSGRID Réunion 1 Pierre Girard Pierre.girard@in2p3.fr

Plan Mon Planning Organisation des Sysgrid Mission et périmètre Interactions externes/internes Administration d’infrastructures grilles Principe du déploiement au CC Services grille Clients grille Services internes Les inclassables Actions 02/04/2012

Mon Planning Départ fin juillet Avril Mai Juin/Juillet Donc en théorie Absent du 9 au 16 inclus ~3 semaines Mai Absent du 11 au 18 ~4 semaines Juin/Juillet Pas d’absences prévues ~8 semaines Donc en théorie ~15 semaines mais à 50% => ~7 semaines 02/04/2012

Ce qu’il faudrait transmettre… Mon Planning Ce qu’il faudrait transmettre… Les responsabilités d’un sysgrid Les spécificités de notre déploiement grille Un certain savoir-faire 02/04/2012

Organisation des Sysgrid Mission Interfacer le centre de calcul avec les infrastructures de grilles Accès aux ressources de calcul et de stockage du CC. La gestion de ces ressources est assurée par d'autres groupes. Administrer des services de grille pour les besoins de projets de grille auxquels le CC-IN2P3 participe. les besoins internes du CC-IN2P3. Assurer un support de niveau 2 et 3 Répondre aux tickets Corrections de problèmes Changement de configuration Demande de (nouveaux) services Définir, Mettre en place et maintenir les procédures, la documentation et les outils Opérationnels D'installation et de configuration des nœuds Représenter le CC en tant qu'administrateurs de sites de grille dans les projets Assurer le suivi et anticiper les évolutions du MW de grille 02/04/2012

Organisation des Sysgrid Périmètre Délimité en premier lieu par l’appartenance au groupe « Infrastructure / Système »  Installation, configuration et maintien des services. Livraison à l’équipe "Opérations" (mise en production) qui en assure la surveillance et le support pour autant que documentation et outils soient fournis Contraint par des projets externes Outil d’installation (ex.: YAIM) Rythme des projets (ex.: update) Objectifs de disponibilité et stabilité Objectifs d’accounting Suivi de procédures externes 02/04/2012

Administration d’infrastructures grilles Interactions externes/internes Opérations Exploitation Identification des services et de leur criticité http://grid.in2p3.fr/index.php?chap=3 Monitoring Fiches recettes Elog Support Outils de suivi de la production Suivi de jobs grille Tickets Configuration Résolution de problème 02/04/2012

Administration d’infrastructures grilles Interactions externes/internes Infrastructure Système Installation de machines Définition de profiles Espace partagé (AFS) Réseau Alias (lbnamed), hostname, adresse IP Filtrage réseau Penser à rendre en cas de « decommissionning » Stockage Publication du stockage Couche cliente (UI, WN, VO box) 02/04/2012

Administration d’infrastructures grilles Interactions externes/internes Développement DBA LFC, VOMS, FTS Pas (encore) chez les sysgrid Accounting Fournir les informations pour Décisionnel et publication accounting grille Interfaçage des CEs JWGEN fourni par Sylvain Publication ? 02/04/2012

Administration d’infrastructures grilles Interactions externes/internes Direction Validation des demandes des VOs Ressources ou services Si possible via une trace (ticket) Rendre compte à Souvent en cas de problème… Via chef d’équipe/groupe si suffisamment « aware » 02/04/2012

Administration d’infrastructures grilles Interactions externes/internes Projet WLCG Daily meeting Annonces de/vers Via les opérations (Rolf) Responsable du projet au CC Moi/Renaud Recommendations https://twiki.cern.ch/twiki/bin/view/LCG/WLCGBaselineVersions Monitoring Pledges: http://wlcg-rebus.cern.ch/apps/topology/ Disponibilité: http://grid-monitoring.cern.ch/mywlcg/ 02/04/2012

Administration d’infrastructures grilles Interactions externes/internes Projet EGI-Inspire / NGI France France Grilles Direction technique: Hélène/Gilles Monitoring national https://ccnagboxli01.in2p3.fr/nagios/ Hébergement d’autres services EGI-EMI/UMD https://wiki.egi.eu/wiki/Main_Page Opérations Weekly meeting Dashboard: http://operations-portal.egi.eu/ Intégration et distribution du Middleware https://wiki.egi.eu/wiki/Middleware http://repository.egi.eu/category/umd_releases/distribution/umd_1/ Interface avec les développeurs du MW Ouverture de ticket sur GGUS pour les bugs Monitoring Pledges: http://wlcg-rebus.cern.ch/apps/topology/ Disponibilité: http://grid-monitoring.cern.ch/mywlcg/ 02/04/2012

Administration d’infrastructures grilles Principe du déploiement au CC Partie commune partagée sur AFS CA/CRL Certificats VOMS Couche cliente UI/WN GLEXEC (partiellement) Configuration des VOs Services internes pour les besoins spécifiques grille Update CRL VO tags d’Atlas Mapping (proxy => compte) glexec Etc. 3 sites IN2P3-CC (Production) WLCG T1 (97% de dispo) VOs non-LHC IN2P3-CC-T2 (Production) WLCG T2 (97% de dispo) FRANCE-GRILLES-TESTBED (Pre-production) Coeur de l’infrastructure de TestBed Utilisable pour tester des installations 02/04/2012

Administration d’infrastructures grilles Services Grille Système d’information Top BDII Site BDII Configuration “spécifique”: publication de 2 sites Héberge la publication de dCache A réinstaller en EMI-1 Computing Glite-CREAM GE Spécificités JWGEN VO Tags Redondance => En cours (Christelle) 02/04/2012

Administration d’infrastructures grilles Services Grille VO Box Installation bordélique Gsissh + renouvellement de proxy + UI AFS VO Box Atlas Plusieurs comptes Clarifier les rôles autour de la VO box Update à faire Renouvellement de proxy plus propre 02/04/2012

Administration d’infrastructures grilles Services Grille gLite-ARGUS Politique de mapping du site pour gLexec 2 machines load-balancées Certificat service (spécificité) En cours de remise en production pour WLCG A migrer en EMI-ARGUS 02/04/2012

Administration d’infrastructures grilles Services Grille EMI-WMS + EMI-LB TestBed France Grilles uniquement EMI-FTS Actuellement David (dcache/sysgrid en backup) EMI-LFC Actuellement David (sysgrid en backup) EMI-VOMS Censé reprendre la main 02/04/2012

Administration d’infrastructures grilles Client Grille gLite-WN/UI Version Tarball Spécificités introduites pour utiliser Client rfio local (HPSS masters) Client dcache (srm+dcap) local (dCache masters) Configurations globales CAs/CRLs Certificats VOMS Configurations des VOs En attente de EMI-1 tarball (validée par WLCG) gLexec A voir avec syslinux car installation specifique sur les WNs 02/04/2012

Administration d’infrastructures grilles Services Internes UCRON pour CRLs CRON pour accounting grille Cf. Julien Mécanisme de partage des VO tags (CEs) GPFS-like À base de NFS CRON MyProxy pour Nagios du CC A réinstaller complétement 02/04/2012

Administration d’infrastructures grilles Les inclassables Serveur CHIRP en pré-production pour Atlas Testé par Nabil Ghodbane Profile de VO box (atlassgm) Montage GPFS sur /sps/atlas/chirp Atlas est censé prendre la main pour la gestion et l’administration du serveur CHIRP Serveurs SQUID pour CVMFS À passer aux syslinux qui gèrent déjà l’installation de CVMFS sur les workers/interactives ? 02/04/2012

Discussions/Actions Priorités discutées en fin de réunion UI/WN Partir sur la version EMI même si elle n’est pas validée par WLCG Juste en test donc VOBOX ATLAS la plus compliquée peut être vue comme une généralisation du concept de VO box Appliquer la même installation à toutes les VOs ? Machines de service grille Prêtes à l’installation Token_forge en place de ucron Glexec/Argus 02/04/2012