Pierre Girard LCG-France Tier

Slides:



Advertisements
Présentations similaires
Production DC2 ATLAS David Bouvet LHC Calcul 22 juillet 2004.
Advertisements

Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
08/02/2007 Site Grille : Ambitions 2007 Pierre Girard LCG-France Tier
CALCUL ATLAS LCG France (CC IN2P3 Lyon) 30 Avril SOMMAIRE Data Challenge 2 (DC2) d’ATLAS Utilisation du CC IN2P3.
05-fevrier-2007Eric Lancon1 ATLAS Bilan Planning 2007.
Nombre de job slot par machine Server_priv/node. Node1 np=2 Règle de 1 core = 1 job slot = 2 Go. Sur un bi-processeur bi-core on annonce alors np=4 Pas.
Le projet MUST Méso infrastructure de calcul et de stockage ouverte sur la grille européenne LCG/EGEE Colloque Grille Rhône-Alpes 10 janvier 2008.
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
Quattor Status Guillaume PHILIPPON. Résumé EMI 2 / 3 DPM Changement de nom de profile SPMA 3 Aquillon Stratuslab Organisation de la communauté Quattor.
Evolution des services Retour sur les incidents récents: Disfonctionnements cluster SUN (répertoires disques) : – Incidents et actions réalisées Disfonctionnements.
État de la production LHC et statut de BQS Suzanne Poulat – groupe production.
Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR Marseille Juin 2010Jean-Michel BARBET Subatech 1 /22 Support de la VO Alice à.
Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 1 /18 IN2P3-SUBATECH :
MAUI Généralités Mode de fonctionnement Configuration MAUI Paramètres globaux Attributs des jobs Commandes clientes.
09/07/20151J-P Meyer GRIF-CS Les nouvelles générales Les pledges 2016 Le point sur l’Accounting et l’availability 10 ans de GRIF Le tour des VO Le tour.
Xen et l' Art de la Virtualization Antoine Nivard Responsable technique Adéquat région Ouest Responsable de Site francophone de XEN Computer.
LCG-FRANCE_19/05/09L. Poggioli1 ATLAS Activités du nuage FR Production MC Reprocessing Analyse Au quotidien Next L.Poggioli, LAL.
EGI FT 2010 European Grid Infrastructure H.Cordier Credit: C. L’Orphelin, D.Fouossong, E.Urbah, M.Pellen.
Module S41 Chapitre 11  Configuration de Windows XP Professionnel pour l'informatique mobile.
Initiation à la conception des systèmes d'informations
Michel Jouvin LAL/Orsay
Contrôles des données Application aux données d’hydrométrie
Passage de Main SYSGRID Réunion 1
Le nœud de grille de calcul de l'IPHC dans CMS
Réunion Opérations France Grilles – 6 juin 2017
L’accounting dans EGEE
Roadmap opérations Fin 2013 Visio opérations France Grilles juin 2013
GENIUS – GANGA Alternative à la CLI
Atelier Opérations 29 Novembre - INRA - Bordeaux
Réunion Analyse D0 France au CCIN2P3 19 janvier 2004
Support – info Sauvegarde des données locales des postes clients
Vue d'ensemble de l'utilisation du CCIN2P3 par les expériences LHC
Planification budgétaire Tier2s & Tier-3s Etat d’avancement
GRIF : Grille pour la Recherche en
Etat des services grid de production
12 mars 2004, Lyon Reunion CAF F.Chollet 1
Organisation Tiers CMS-France
Point sur avancement du service de monitoring NAGIOS
Intégration de BQS dans CREAM
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Consolidation des services FTS et LFC
Workshop Operations 20 Octobre 2011
Surveillance des services grille par NAGIOS
Déploiement d’un LCG CE
Réunion coordination WLCG Lyon, le 13 mars 2008
Etat actuel et perspectives des CEs
Consolidation des services de grille de production
2018/8/9 CLAP Cluster de virtualisation et de stockage distribué du LAPP Mardi 26 avril 2016 Entrez votre nom.
CeMEB La plateforme MBB
David Bouvet LCG France T2 T3 – LPNHE
Suzanne Poulat - Philippe Olivero
L’exploitation des données du collisionneur LHC: un défi pour le calcul scientifique un enjeu pour le LAPP S. Jézéquel.
CeMEB La plateforme MBB
Synthèse problèmes rencontrés par les expériences LHC au CC-IN2P3
CREAM-CE et SGE.
Exercices: Système d’Information
Atelier régulation de la production dans un contexte grille
Infrastructure Opérationnelle d’EGEE
Mésocentre de calcul et de stockage ouvert sur la grille EGEE (MUST) LAPP/ Université de Savoie / EGEE.
Logistique GIF-4105/7105 Photographie Algorithmique
Prelude 7 ERP Sales Management 05/12/2018 © Gérard Baglin,
Infrastructure Opérationnelle d’EGEE2
DC04 CMS Objectif Status Planning
Etat d'avancement: calendrier
Formation SpeechExec Enterprise Dictate
LCG – France et ALICE Bilan 2006 Planning fevrier 2007
Résumé des Actions Suite aux Réunions CB et MB
Intégration GRIF Michel Jouvin Comité Technique GRIF 28 Novembre 2005.
Michel Jouvin LAL/Orsay
Transcription de la présentation:

Pierre Girard LCG-France Tier-1 2008-01 05/07/2018 11/01/2007 Consolidation des services: Ressources de calcul et Système d’Information Pierre Girard LCG-France Tier-1 2008-01

Robustesse et load-balancing 05/07/2018 Plan Affaires courantes Interfaçage des CEs Système d’information JobManager Robustesse et load-balancing Pierre Girard / Etat des services grid de production 11/01/2007

Affaires courantes Mises à jour à effectuer Priorités 05/07/2018 Affaires courantes Mises à jour à effectuer WNs et UIs: passer de 3.1.0-x à 3.1.2-0 SL(C)4/x86_64 en cours de certification (date de release ?) Release 3.1 maintenant disponible pour de nouveaux noeuds SL3 vers SL4_32 Upgrade possible des machines de services vers matériel récent Attention aux problèmes de « low memory » ? LCG-CEs [Pierre-Emm] Implémentation du GRIS avec un BDII Optimisation de la publication des GlueClusters et des Tags des VOs Top/Site BDII Passage à SL4 déjà anticipé pour Top BDII mais détection d’un problème (openldap) avec la publication des attributs VOMS A vérifier ce point lors de la mise à jour officielle Priorités WNs/UIs BDII (cf. « Robustesse et Load-Balancing») LCG-CEs (upgrade des machines ?) Pierre Girard / Etat des services grid de production 11/01/2007

Interfaçage des CEs: Système d’information (1) 05/07/2018 Interfaçage des CEs: Système d’information (1) Nouveau lcg-info-dynamic-bqs Informations VOMS Tient compte de la réelle disponibilité des classes BQS Rappel: classes BQS A, G, et T Ne compte pas un workpoints pour une classe BQS s’il est utilisé par un job d’une autre classe BQS Moins de job slots publiés par queue Fermeture des queues Sélective (déjà en production) Automatique lors du réajustement par l’exploitation du MaxAdmissibleJobDuration MaxCPUTime(queue) > MaxAdmissibleJobDuration Possibilité d’affecter des quotas par groupe/VO Possibilité de pondérer le nombre de job slots par le nombre de CEs en concurrence sur la même ferme Dans l’optique d’une répartition logique de la charge avec un cluster de CEs A finaliser et à packager DENY à implémenter pour les information VOMS ? Pierre Girard / Etat des services grid de production 11/01/2007

Interfaçage des CEs: Système d’information (2) 05/07/2018 Interfaçage des CEs: Système d’information (2) Problème des Glue(Sub)Cluster Publication d’un GlueCluster et d’un GlueSubCluster Par CE et par queue du CE (short, medium, long, long_atlas, etc.) Chaque GlueSubCluster publie tous les tags des VOs Pbs : Redondance, pollution du SI et problème de temps de réponse du GRIS du CE Ex: ~1400 lignes de LDIF juste pour les sous-clusters de cclcgceli02 Des problèmes de publication des CEs sont de nouveau apparus Amélioration du temps de réponse avec la prochaine update du LCG-CE Evolution du M/W intéressante proposée par Steve Traylen http://indico.cern.ch/conferenceDisplay.py?confId=20225 Ajout d’un nouveau nœud : CE-ClusterPublisher Publie les clusters/sous-clusters (indép. des CEs et donc sans redondance) Centralise les VO tags et donc plus de problèmes de synchronisation des CEs partageant le même cluster Discuter avec Steve Pierre Girard / Etat des services grid de production 11/01/2007

Interfaçage des CEs: Système d’information (3) 05/07/2018 Interfaçage des CEs: Système d’information (3) Questions Certaines VOs semblent utiliser le SI en supposant des conventions de nommages qui lient les CEs, aux Clusters et aux SubClusters Pourquoi ? Peuvent-elles éviter ça ? Nous maintenons des queues dédiées pour certaines VOs alors que les VOViews permettent de factoriser les informations Peut-on arrêter ? (lcg-infosites ignorent les VOViews) MaxCPUTime(queue) est relatif à la puissance (KSi2K) affichée par le subcluster Est-ce compris et réellement utilisé ? Notre politique (Artem): on normalise en affichant une puissance de 1KSi2K et un MaxCPUTime en (KSi2K x Minute) Comment font les autres ? Pierre Girard / Etat des services grid de production 11/01/2007

Interfaçage des CEs: JobManager 05/07/2018 Interfaçage des CEs: JobManager Réactualiser le jobmanager actuel Raffiner les états BQS (Cf. Julien) La version actuelle du JobManager fonctionne mais ne tient pas compte de certains états BQS qui sont finaux, et donc la reconnaissance un job grille peut être BQS devrait peut-être mieux distinguer ces états finaux (Ambiguité car un état temporaire qui dure un certain temps devient final) Sortir la gestion des états et de leurs transitions du code du JobManager pour l’intégrer à sa configuration. Permet d’adapter son comportement en cas de changement dans BQS Partager la configuration, au moins partiellement, avec le système d’information. Se préparer à la nouvelle version de BQS avec les sous-groupes Prévu pour le 1er trimestre 2008 (Tests en cours) Qsub --voname cmsf --share prod.T1@cmsf@anastasie Pierre Girard / Etat des services grid de production 11/01/2007

Robustesse et load-balancing 05/07/2018 Robustesse et load-balancing Load-balancing: la solution anti-stress IN2P3-CC GRIF Top BDII IN2P3-CC-T2 IN2P3-LAPP Utilisation de « lbnamed » avec les BDIIs déjà validée. => 2 machines supplémentaires à prévoir Top BDII lbnamed CERN-PROD … RAL-LCG2 Validation d’une solution basée sur GPFS qui stagne faute de temps, mais certainement la priorité MAX. CE Top BDII CE Load-Balancing External Site BDII lbnamed CE CE Pierre Girard / Etat des services grid de production 11/01/2007