1DSM - IRFU / PM22102008 Compte rendu du site GRIF.

Slides:



Advertisements
Présentations similaires
Services de production grille en France Gilles Mathieu IN2P3-CC France Grilles Frédérique Chollet IN2P3-LAPP LCG France Rencontres France Grilles et LCG-France,
Advertisements

Alice LCG Task Force Meeting 16 Oct 2008Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1/20BARBET Jean-Michel - 1/20 LCGFR Marseille Juin.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Projet LCG: Déploiement Pierre Girard EGEE/LCG ROC EGEE/LCG site deployment Centre de Calcul de l’IN2P3 LCG France Lyon, 14 décembre.
Accounting régional. Status actuel Base de données node56 : – 22GiB de données – 16 sites – 3.7TiB disponibles… Tous sites sur la base de données node56.
Frédérique Chollet Yannick Patois Réunion LCG-France, Nantes 19 septembre 2012 Résultats du questionnaire DPM.
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Quattor : Opérations Courantes - G. Philippon/M. Jouvin4-5/2/2009Quattor : Opérations Courantes - G. Philippon Opérations courantes.
Le noeud de grille Tier 3 LAPP.
Le Tier2 de Subatech Logiciel : Jean-Michel Barbet
19 janvier 2006J-P Meyer1 Revue du projet GRIF  Les enjeux scientifiques (J-P Meyer)  Le calcul au LHC  Les Projet EGEE et LCG  Le projet GRIF  La.
L’environnement Labo : Laboratoire de Physique des Particules d’Annecy-le vieux: LAPP (PP, Astro) Effectif du labo : 144 personnes Nombre d’IT : 76 dont.
Michel Jouvin LAL/Orsay
1 Le groupe exploitation informatique au LAL Réalisations 2010 et projets 2011 Infrastructures de la Salle Machines Grille Services centraux et réseau.
ATLAS Ghita Rahal CC-IN2P3 Novembre 9, /6/2006Réunion CAF2 Activités Création et externalisation d’outils de monitoring de l’état du T1 (CPU,
GRIF Status Michel Jouvin LAL/Orsay
Expérience du déploiement d’une Virtual Organisation (VO) locale Christophe DIARRA
Informatique Prospective. La qualité: HelpDesk au LAPP ou Pour un meilleur suivi des demandes au(x) support(s) Sylvain Garrigues.
Sortir de MAUI – quelles options ? HTCondor dans un CREAM-CE Guillaume Philippon.
PPE2 La maison des ligues BEAUPEUX CharlySOUCHET Laurent GENDREAUD QuentinGAUTHIER AntoineDERIEN Alexandre.
Monitoring: état et perspectives Cette présentation fera le point sur le travail effectué au sein du groupe de travail, créé au sein de LCG-France et EGEE.
Opérations courantes Guillaume PHILIPPON. Sommaire Mise à jour des QWG Gestion des utilisateurs Ajout/Suppression d’un programme Préparation des « OS.
Journées informatique IN2P3/Dapnia, Lyon Septembre 2006 Consolidation des serveurs par virtualisation Retour d’expérience sur l’utilisation de VMware.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Cécile Barbier David Bouvet Christine Leroy L'exploitation de la grille au quotidien.
Projet Personnel (Epreuve 6) Projet réalisé dans le cadre de mon épreuve E6 au sein de mon alternance au conseil départemental du val de marne Arnaud PICANO.
PUGNERE Denis Institut de Physique Nucléaire de Lyon Rencontres LCG-France mai 2013 – LLR Palaiseau.
Fonctionnement des sites (1 er trim.09) Frédérique Chollet Fabio Hernandez Fairouz Malek Forum trimestriel LCG-France Lyon, 6 avril 2009.
Développement des templates Quattor de gLite à EMI Guillaume PHILIPPON.
Utilisation de Quattor par GRIF Michel Jouvin LAL/Orsay
LPSC, journée de lancement TIDRA B. Boutherin 1/12 Tier 3 du LPSC Grenoble Une infrastructure solide, originale et éco-responsable Des ressources importantes.
04/06/20151J-P Meyer GRIF-10ans déjà! ( )
Mercredi 1er juin 2016 Panorama sur les outils de monitoring Cyril L’Orphelin David Bouvet.
Opérations France-Grilles : Etat des lieux Hélène Cordier/Gilles Mathieu LCG France, 30 Mai 2011.
Réunion DCIE-DiR - Assistance utilisateurs sur WAMA et RNT 3 juin 2015.
Projet LCG: Infrastructure opérationnelle Pierre Girard EGEE/LCG ROC deputy EGEE/LCG RC coordinator Centre de Calcul de l’IN2P3
1DSM - IRFU Les dessous de la Grille. 2DSM - IRFU Les Grilles : Pourquoi ? Partage transparent de l’utilisation de ressources massivement distribuées.
CEA DSM Irfu Mises à jour de sécurité… … et la pratique F.SCHAER.
25/06/20101LCG - France CPPM Marseille L’expérience CMS à GRIF LLR – E.Poly.,Palaiseau: Pascale Hennion Paulo Mora de Freitas Igor Semeniouk Philippe Busson.
Mercredi 7 novembre 2007 Dominique Boutigny Activités et Évolution du CC-IN2P3 Réunion des Expériences 2007.
Session « Pôle Infrastructure » Pierre Girard CC-IN2P3 ATELIER France-Grilles au CC-IN2P3 12 octobre 2010.
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
6-7 Octobre 2008J-P MEYER1 Conclusions du groupe de travail thématique 7 Physique subatomique: - physique des particules, - physique nucléaire, - astroparticules.
Conclusions (?) Fabio Hernandez Frédérique Chollet Fairouz Malek Réunion Sites LCG-France Annecy, May
Configuration des sites Intérêt de la mutualisation ! Existant avec Quattor Tendance Puppet Discussion.
Projet LCG: Vue d’Ensemble Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3 Rencontre IN2P3/STIC Grenoble, 25.
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
12/11/20151J-P Meyer GRIF aujourd’hui et demain ( )
1er septembre 2005J-P Meyer1 Statut du projet GRIF (Grille de Recherche d’Île de France) Rappel du projet But: Mettre en place une ressource d’analyse.
Fabio Hernandez Lyon, 9 novembre 2006 LCG-France Tier-1 Réunion de Coordination.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks La région France dans la grille EGEE David.
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
Mise en place d’un cloud publique et privé Guillaume PHILIPPON.
LCG Le T2 du LPC Pierre-Louis Reichstadt LPC Clermont-Ferrand.
Tier 2 au LAPP. Plan Historique Objectifs Infrastructures Status/métriques Avenir Conclusion.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
TÂCHES D’ADMINISTRATION DE LA NAGIOSBOX BIOMED LE 24 Mai 2011, Christine Leroy,
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
F. DERUE, Réunion des sites LCG France, LPNHE, 20 mars Historique et but 2. Projet scientifique 3. Projet technique 4. Suivi des productions.
CMS Double Chooz HESS Edelweiss Herschel ALICE Detecting radiations from the Universe. ARCHITECTURE HYPER-V À L'IRFU Journée IN2P3 IRFU 2014 | Joël Surget.
EGEE France, Marseille, 24 mars 2005 INFSO-RI Enabling Grids for E-sciencE Activité SA1 Regional Operations Centre Pierre Girard.
Eric Fede : Obernai Intégration des services grille dans l'exploitation des systèmes informatiques du laboratoire.
08/02/2007 Site Grille : Ambitions 2007 Pierre Girard LCG-France Tier
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Le Centre de Calcul de l'IN2P3 7 septembre 2010 Dominique Boutigny Un instrument informatique de pointe au service de la recherche Rencontre avec Oracle.
GRIF : Grille pour la Recherche en
GRIF-STATUS Etat du site Nos engagements vis-à-vis d’ATLAS 17/05/2010
Transcription de la présentation:

1DSM - IRFU / PM Compte rendu du site GRIF

2DSM - IRFU / PM GRIF - EGEE - LCG LPNHE 3 universités et une école 1 partenaire hébergé 6 laboratoires ~30 personnes  8,2 TEP Opérations  1,5 TEP Management  0,4 TEP Physiciens  5,4 TEP EGEE3 dont 2 SA ,5 TEP dont 10,2 TEP Opérations Une équipe soudée

3DSM - IRFU / PM GRIF et la grille française ALL VO 21,6% LCG 25,1%

4DSM - IRFU / PM Monitoring LCG

5DSM - IRFU / PM Accounting

6DSM - IRFU / PM Accounting

7DSM - IRFU / PM Configurations 9 CE, dont 2 MPI 32 bits, 1 MPI 64 bits, et 2 de test –6 CE de production fournissent SDJ –7024 slots –Torque + maui 7 SE DPM, dont 1 de test IRFU4x1GBits/s IP Bonding 7 disk servers LLR2x1Gbits/s IP Bonding 5 disk servers LAL1 Gbits/s 10GBits/s sous peu 5 disk servers APC1 Gbits/s1 disk server LPNHE1 Gbits/s3 disk servers IPNO1 GBits/s2 disk servers

8DSM - IRFU / PM Nouveautés Réseau –10Gbits/s pour liaisons inter-sites –Reste LPNHE et APC à déployer 4 WMS gLite 3.1 (3 WMS purs, 1 LB pur, 1 WMSLB) GRIF sélectionné pour fournir des seed ressources EGEE –12.75 k€ –39 CPU Cores, 4.5 TB à fournir Machines virtuelles –Xen (LAL), VmWare (LLR), KVM + VT-x (IRFU) –Tests au LAL/LLR –Production à l’IRFU LFC, MON, CE MPI (16 cœurs), VO Boxes (x2), Quattor servers (DHCP/TFTP), Nagios (x3, 2 en test), Lemon, Squid (test) Réseau para-virtualisé (820/660 Mbits/s down/up)

9DSM - IRFU / PM Evolutions Précurseur de mise à jours batch (problèmes de charge) –Torque (2.3.0) –Maui (3.2.6p20) Fourniture croissante de « core » services type WMS, mais aussi MyProxy Mise en place de closeSE pour tous les CE GRIF grâce au réseau Salles machines : –IRFU : une nouvelle salle en cours de réalisation contiendra 12 racks avec réfrigération à eau (Emerson) dont 3 racks haute densité (30kW en n+1)  –LAL 2 salles, problèmes de clim (vieille salle) : réunification ? Problèmes électriques rencontrés (harmoniques) –LLR : nouvelle salle machine à Polytechnique 2008  2012 –LPNHE : salle machine tiendra jusque fin 2010

10DSM - IRFU / PM Evolutions hardware CPU –IPNO : +320 kSI2K (20 machines) –IRFU : +672 kSI2K (42 machines) –LLR : +240 kSI2K (15 machines) –LPNHE : +253 kSI2K (14 machines) –TOTAL fin 2008 : 6,3 M.SI2K Disque –APC : +14 TB –IPNO : +24 TB –IRFU : TB –LAL : TB –LPNHE : TB –TOTAL fin 2008 : 1553 TB brut  1,2 PB utiles

11DSM - IRFU / PM Organisation et problèmes rencontrés

12DSM - IRFU / PM GRIF un Tier2 LCG distribué VO /siteAPCIPNOIRFULALLLRLPNHE ATLAS XXXX CMS Xx(CE only) X ALICE XX LHCb XXX Mutualisation des ressources, et des efforts + Le réseau à 10Gb/s permet au LAL et au LPNHE (à venir dans le VLAN GRIF) de fournir de la CPU à CMS (données à l’IRFU et au LLR)  simplification pour CMS + Redondance pour les VOBOX CMS (2VObox: IRFU et LLR) + Pour le SE Alice on pourrait avoir de la redondance au niveau du redirecteur xrootd - Mais les outils développés par les VOs ne sont pas toujours adaptés pour un site distribué (problème de nommage pour le site GRIF CMS) - La distribution des données de CMS avec plusieurs T1 pose des problèmes réseaux (les T1 étrangers ne sont pas dans le VLAN GRIF!)

13DSM - IRFU / PM Quattor Outil principal de management –Gestion centralisée de la configuration –Gestion de l’installation (pxelinux, dhcp, ks, partitionnement) Configuration reproductible –Gestion aisée de nœuds identiques (type WN) –Multiplication des nœuds compliqués (type WMS) Possibilité de retour en arrière –Update 33 au LAL… Mutualisation des compétences –Composants de middleware –Updates gLite Traçabilité

14DSM - IRFU / PM Organisation du travail Mise en place d’outils collaboratifs communs –TRAC (wiki, tentatives d’utilisation du user support) –Serveur web IRC (php) (contrainte CEA) –Mailing list technique GRIF Administration des machines –Login inter-sites (gsissh) –Login intra-site : clefs openssl + sudo Réunions mensuelles Service 24x24 7/7 !!! (1+ bénévole anonyme) Utilisation croissante de GGUS par les utilisateurs Utilisation de différents outils de monitoring –nagios (m.à.j de sécurité !) –Lemon –Smart pour les disques système

15DSM - IRFU / PM Problèmes au quotidien Charge réseau –Problèmes d’installation de machines (I/O Errors) –Problèmes de monitoring (timeouts) –Problèmes services distribués Tickets GGUS pour les nœuds de test –Downtime « infinie » interdite –Nécessité de publication pour certains tests Outils collaboratifs : manque la gestion du personnel (absences, urgences) Gestion des VO Boxes : s aux VOs obligatoires pour correction d’un problème, vérification Charge quattor –23575 révisions –16770 fichiers, dont 5716 templates –721 MO, dont 336 MO de données SVN –Temps de compilation moyen sur 4-core : 5 minutes Disques défectueux : quelles démarches ?

16DSM - IRFU / PM Pistes & Conclusions Exploration de solutions pour le réseau (SQUID, caches DNS) Nouveaux outils pour répondre aux nouveaux besoins (DNS dynamique pour nœuds redondés, IRC) Equipe soudée : un mail reste rarement sans réponse Pérennisation du personnel : –Passage de 10 à 30 personnes en 3 ans –Embauches fermes