08/02/2007 Site Grille : Ambitions 2007 Pierre Girard LCG-France Tier-1 2007-02.

Slides:



Advertisements
Présentations similaires
Tutoriel du 7/11 au 10/11 EGEODE / CGG - équipe grille1 TP: Installation d'un site EGEE.
Advertisements

Nouvelles du CC-IN2P3 Réunion des sites-LCG France 22 novembre 2010 Dominique Boutigny.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks La région France et les sites de calcul EGEE.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Les sites de calcul EGEE en France David.
Alice LCG Task Force Meeting 16 Oct 2008Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1/20BARBET Jean-Michel - 1/20 LCGFR Marseille Juin.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Projet LCG: Déploiement Pierre Girard EGEE/LCG ROC EGEE/LCG site deployment Centre de Calcul de l’IN2P3 LCG France Lyon, 14 décembre.
LCG-France: Tier-1 au CC-IN2P3 Bilan 2005 et perspectives 2006 Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Quattor : Opérations Courantes - G. Philippon/M. Jouvin4-5/2/2009Quattor : Opérations Courantes - G. Philippon Opérations courantes.
Le noeud de grille Tier 3 LAPP.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Transition vers EGEE-III (et EGI?) Pierre.
Service Challenge 4 – Tests de Débit Bilan pour le Tier-1 LCG-France Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3
Production DC2 ATLAS David Bouvet LHC Calcul 22 juillet 2004.
Palaiseau Réunion CCIN2P3/LCG 22/07/2004 Distribution des données CMS Distribution des données et préparation de l’analyse Production MC distribuée et.
Recapitulatif des sujets abordés Frédérique Chollet Fabio Hernandez Fairouz Malek Réunion LCG-France Tier-2s & Tier-3s Paris, 20 mars 2008.
ATLAS Ghita Rahal CC-IN2P3 Novembre 9, /6/2006Réunion CAF2 Activités Création et externalisation d’outils de monitoring de l’état du T1 (CPU,
LHCb DC06 status report (LHCb Week, 13/09/06) concernant le CC : –Site currently fine / stable 3% of simulatated events 30% of reconstructed events –Site.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data management David Bouvet IN2P3-CC Clermont.
29 mars 2006J-P Meyer1 Evaluation des besoins en infrastructures et réseau  Evaluation des besoins en infrastructures  Evaluation des besoins réseau.
JI Les systèmes d’autorisation et d’authentification dans AMI Fabian Lambert.
Sortir de MAUI – quelles options ? HTCondor dans un CREAM-CE Guillaume Philippon.
BaBar France 18/01/2010 Vincent Poireau 1 Page d’aide :
Monitoring: état et perspectives Cette présentation fera le point sur le travail effectué au sein du groupe de travail, créé au sein de LCG-France et EGEE.
Gestion des Déploiements Applicatifs Orchestrer les opérations WAS SERENA SOFTWARE INC. Sylvain CAILLIAU 01/11.
Frédérique Chollet Fairouz Malek Pierre Girard Yannick Patois Réunion LCG-France, Lyon 1 er décembre 2010 Pour clore cette édition…
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Projet Personnel (Epreuve 6) Projet réalisé dans le cadre de mon épreuve E6 au sein de mon alternance au conseil départemental du val de marne Arnaud PICANO.
Formation « Administrateur ATRIUM ». 1.Un accompagnement technique par la Région Formation des « administrateurs » Support technique Evolution des fonctions.
Développement des templates Quattor de gLite à EMI Guillaume PHILIPPON.
Catalogues de fichiers de données. David Bouvet2 Problématique Possibilité de répliquer les fichiers sur divers SE  nécessité d’un catalogue de fichiers.
LPSC, journée de lancement TIDRA B. Boutherin 1/12 Tier 3 du LPSC Grenoble Une infrastructure solide, originale et éco-responsable Des ressources importantes.
Mercredi 1er juin 2016 Panorama sur les outils de monitoring Cyril L’Orphelin David Bouvet.
Retour d'expérience sur le déploiement d'un site grille de production Pierre Girard EGEE/LCG ROC Deputy EGEE/LCG RC coordinator Centre de Calcul de l’IN2P3.
Eric Fede - 1 GESTION DES PRIORITES SUR LA GRILLE.
Mercredi 7 novembre 2007 Dominique Boutigny Activités et Évolution du CC-IN2P3 Réunion des Expériences 2007.
Session « Pôle Infrastructure » Pierre Girard CC-IN2P3 ATELIER France-Grilles au CC-IN2P3 12 octobre 2010.
Conclusions (?) Fabio Hernandez Frédérique Chollet Fairouz Malek Réunion Sites LCG-France Annecy, May
EGEE is a project funded by the European Union under contract IST Initiation à l’infrastructure Tutorial Grille (LCG/EGEE)
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
Fabio Hernandez Lyon, 9 novembre 2006 LCG-France Tier-1 Réunion de Coordination.
 rechercher et coordonner l'engagement des acteurs nécessaires, Christine=> Helene,Gilles (permet de réduire les groupes de travail comme mentionné dans.
Mardi 30 mars 2010 Les Outils d'Exploitation et de Surveillance Cyril L’Orphelin, Atelier technique France Grilles, 31 Mai 2010 IN2P3/CNRS Computing Centre,
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
Ghita Rahal Lyon, 17 Avril 2008 Outils d’information et de suivi pour l’utilisateur.
Tier 2 au LAPP. Plan Historique Objectifs Infrastructures Status/métriques Avenir Conclusion.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
Communication LCG-France Colloque LCG France Mercredi 14 mars 2007.
Université Ferhat Abbas –Sétif 1 Centre des Systèmes et Réseaux d’Information Et de Communication, de Télé-enseignement et D’Enseignement à Distance Rapport.
RÉNOVATION BTS Comptabilité et Gestion 2015 CB2C & PGI Christine Forest Stéphane Bessière Daniel Perrin Toinin.
TÂCHES D’ADMINISTRATION DE LA NAGIOSBOX BIOMED LE 24 Mai 2011, Christine Leroy,
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
EGEE France, Marseille, 24 mars 2005 INFSO-RI Enabling Grids for E-sciencE Activité SA1 Regional Operations Centre Pierre Girard.
1DSM - IRFU / PM Compte rendu du site GRIF.
Eric Fede : Obernai Intégration des services grille dans l'exploitation des systèmes informatiques du laboratoire.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
CREAM & ICE Réunion SA1-France 11 mars 2008
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
Passage de Main SYSGRID Réunion 1
Etat des services grid de production
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Surveillance des services grille par NAGIOS
Consolidation des services de grille de production
Atelier régulation de la production dans un contexte grille
Infrastructure Opérationnelle d’EGEE
Infrastructure Opérationnelle d’EGEE2
Transcription de la présentation:

08/02/2007 Site Grille : Ambitions 2007 Pierre Girard LCG-France Tier

08/02/2007Pierre Girard / Site Grille : Chantiers Plan Statut du déploiement Consolidation du site T1 Administration du site Mais aussi…

08/02/2007Pierre Girard / Site Grille : Chantiers Statut du déploiement Version officielle : Update 13 Mises-à-jour : –CE: vers Retard: 2 m-à-j critiques –WN: vers (fait mais rollbacké) Retard: 2 m-à-j critiques –UI: vers (fait mais rollbacké) Retard: 2 m-à-j critiques Problèmes –Multiplication anormale des job-manager sur le CE –Gestion des priorités au sein d’une VO

08/02/2007Pierre Girard / Site Grille : Chantiers Site BDII Consolidation du site T1 (1) Site grille IN2P3-CC actuel VO Box VO LHC Computing Element Computing Element Storage Element Storage Element VOMS 4 VOs LFC Central Biomed HPSS DCACHE Storage Element SRM Gridftp XFS Stockage BQS Anastasie WN Calcul LFC Local 4 VOs LHC FTS 4 VOs LHC MonBox 4 Sites Système d’informatio n de la grille VO Box VO LHC V OBox VO LHC VO Box VO LHC Service global Service régional/fédéral Service local

08/02/2007Pierre Girard / Site Grille : Chantiers Site BDII Consolidation du site T1 (2) Site grille IN2P3-CC (1 er sem.) VO Box VO LHC Computing Element Computing Element Storage Element Storage Element VOMS 4 VOs LFC Central Biomed Storage Element SRM Gridftp DCACHE XFS LFC Local 4 VOs LHC FTS 4 VOs LHC MonBox 4 Sites Système d’informatio n de la grille VO Box VO LHC V OBox VO LHC VO Box VO LHC Service global Service régional/fédéral Service local SRM BQS Anastasie WN Calcul Computing Element Computing Element Stockage HPSS

08/02/2007Pierre Girard / Site Grille : Chantiers Site BDII Consolidation du site T1 (3) Site grille IN2P3-CC (1 er sem.) VO Box VO LHC Computing Element Computing Element Storage Element VOMS 4 VOs LFC Central Biomed Storage Element SRM DCACHE LFC Local 4 VOs LHC FTS 4 VOs LHC MonBox 4 Sites Système d’informatio n de la grille VO Box VO LHC V OBox VO LHC VO Box VO LHC Service global Service régional/fédéral Service local SRM BQS Anastasie WN Calcul Computing Element Computing Element Stockage HPSS FTS 4 VOs LHC LFC Local 2 VOs LHC

08/02/2007Pierre Girard / Site Grille : Chantiers Consolidation du site T1 (4) Résumé Changements au niveau du site + 2 CEs (1 par VO LHC) + 1 FTS (distribution des canaux) + 1 LFC (1 pour 2 VOs LHC) + 1 SE Dcache (Administré par le stockage) − 2 SE Classiques − Serveur LDAP (Auvergrid) − RLS/RMC (Biomed) Engagement d’hébergement d’un Top BDII pour la France Upgrade des machines –Vers V20Z ou mieux –Voir page d'estimation des migrationsVoir page d'estimation des migrations Machines de spare –1 CE de « spare » (pour updates ou pannes) –VMs LFC/FTS pré-installées (pour updates ou pannes) Cf. FAQ sur la mise en place des services secouru lors de l’OPUS NOIR

08/02/2007Pierre Girard / Site Grille : Chantiers Administration du site (1) Gestion du parc de machines « Grille »  Répertoriées à travers des documents ou FAQs  Ingérable avec la multiplication de machines et les changements fréquents  Inutilisable par des outils (monitoring, web, etc.)  Pas pratique pour communiquer un Lagaffe  Mettre en place un référentiel des machines Son statut (production, test, spare, etc.) Son état (in, out, unknown) Sa configuration (hardware, OS, etc.) Son ou ses profil(s) (lcg-CE, site-BDII, etc.) Son ou ses responsable(s) Et bien plus…  Fournir des outils pour que les administrateurs y enregistrent les machines (à l’installation) les changements

08/02/2007Pierre Girard / Site Grille : Chantiers Administration du site (2) Gestion de la configuration des nœuds « Grille »  Hétérogène et décentralisée  Formats YAIM, gLite…  Configurations de certains nœuds (CE, SE, BDII, WN, UI) sur AFS  Tentative de factoriser les données de configuration  Compilation du « site-info.def » par machine (LCFGng-like)  Des restes de configurations sur CVS  Inutilisable par d’autres outils  Pas pratique pour communiquer avec les autres équipes (Exploitation)  Mettre en place un référentiel structuré et homogène des configurations Pour s’affranchir du format de l’installeur utilisé Pour factoriser l’information Configuration externe (RB, Top BDII, VOs, etc.) Configuration « grille » du CC Configuration interne du CC (environnement, AFS, Dcache, etc.) Pour en disposer comme on le souhaite Génération des configurations dans le format souhaité par un installer Affichage dans un dashboard Outils de monitoring

08/02/2007Pierre Girard / Site Grille : Chantiers Administration du site (3) Administration des services « Grille »  Outils  inexistants pour les « vieux » nœuds (CE, SE, GRIS, WN, UI, etc.)  Interface hétérogène pour les autres  Un changement anodin et ponctuel requiert toujours la présence d’un expert du nœud Ex.: supprimer une queue ou une VO sur un CE  Mettre en place une interface homogène d’administration Identification des actes d’administration par noeud Implémentation spécifique au type de service, à charge de et maintenu par l’administrateur « expert »  Vers la mise en place d’une infrastructure de gestion des services Accueil d’un étudiant vénézuélien Déploiement et validation du framework standard WSDM (Web Services Distributed Management)

08/02/2007Pierre Girard / Site Grille : Chantiers Mais aussi… (1) Constitution d’une base de tests/validation –Un premier jet est déjà utilisé par Nadia pour valider les CEs, WNs et UIs –Un peu trop monolithique –A rendre plus utilisable par d’autres Validation des installations / VOs –On ne valide que la VO dteam –Utilisation de rôles/groupes VOMS (dteam ou VO local) Ex.: /dteam/France/in2p3-cc/atlas/ROLE=lcgadmin Mapping local de validation pour chaque VO

08/02/2007Pierre Girard / Site Grille : Chantiers Mais aussi… (2) Publication du CE –Nouvelle implémentation et sémantique proposées par Jeff Templon –A discuter Priorités des jobs au sein d’une VO –Solution temporaire par altération des jobs en queue –Solution BQS –Nécessite d’en savoir un peu plus sur l’organisation VOMS des Vos Suivi des jobs –Visibilité sur les jobs grille soumis chez nous –Informations à remonter pour l’exploitation grid job identifier du soumetteur

08/02/2007Pierre Girard / Site Grille : Chantiers Mais aussi… (3) CE glite –Développement en cours (Sylvain) –Planning pour un déploiement sur PPS ? SL4 –Apparemment une première release avec l’update 13 –Voir avec l’exploitation –Mise en place d’un nouveau CE ? Rationalisation du cluster de VMs –Système de réservation de slots –A mettre en oeuvre