Fonctionnement des sites (1 er trim.09) Frédérique Chollet Fabio Hernandez Fairouz Malek Forum trimestriel LCG-France Lyon, 6 avril 2009.

Slides:



Advertisements
Présentations similaires
La Grille de Calcul du LHC
Advertisements

Planification budgétaire Tier-2s Tier-3s Fairouz Malek, Fabio Hernandez, Frédérique Chollet Comité de direction 7 juillet 2008.
Alice LCG Task Force Meeting 16 Oct 2008Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1/20BARBET Jean-Michel - 1/20 LCGFR Marseille Juin.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Réunion LCG-France, 7/4/2008 C.Charlot Acc è s aux donn é es Accès à dCache Problèmes de stageout des fichiers produits sur les WNs  Aussi pour le stagein.
Calcul CMS: bilan 2008 C. Charlot / LLR LCG-DIR mars 2009.
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
CAF-13/09/2010Luc1 Squad Report T2 Période 19/06-11/09 Irena, Sabine, Emmanuel.
Le noeud de grille Tier 3 LAPP.
Palaiseau Réunion CCIN2P3/LCG 22/07/2004 Distribution des données CMS Distribution des données et préparation de l’analyse Production MC distribuée et.
Recapitulatif des sujets abordés Frédérique Chollet Fabio Hernandez Fairouz Malek Réunion LCG-France Tier-2s & Tier-3s Paris, 20 mars 2008.
Frédéric Hemmer, CERN, Département ITLa Grille de Calcul du LHC – septembre 2007 La Grille de Calcul du LHC Frédéric Hemmer Adjoint au Chef du Département.
LHCb DC06 status report (LHCb Week, 13/09/06) concernant le CC : –Site currently fine / stable 3% of simulatated events 30% of reconstructed events –Site.
9ème Forum Utilisateurs CATIA CERN Retour d‘expérience IN2P3 08 novembre 2011V. Boninchi1.
RÉNOVATION BTS Comptabilité et Gestion 2015 Atelier situations professionnelles & PGI Cas Jupiter Média Chantal Bricard Jean-Marie Duplan.
Informatique Prospective. La qualité: HelpDesk au LAPP ou Pour un meilleur suivi des demandes au(x) support(s) Sylvain Garrigues.
Monitoring: état et perspectives Cette présentation fera le point sur le travail effectué au sein du groupe de travail, créé au sein de LCG-France et EGEE.
Frédérique Chollet Fairouz Malek Pierre Girard Yannick Patois Réunion LCG-France, Lyon 1 er décembre 2010 Pour clore cette édition…
(Mon) Résumé (?) Fabio Hernandez Frédérique Chollet Fairouz Malek Réunion Sites LCG-France Marseille, 25 juin 2010.
Infrastructure LCG-France et Analyse de données Frédérique Chollet Fabio Hernandez Fairouz Malek Réunion CMS-France, IPHC Starsbourg, mai 2009.
Mathieu Walter Alexandre Perrier Réunion Correspondants Formation Cellule IAO/CAO 19 Mars 2013.
BABAR Georges Vasseur CEA Saclay, DSM/IRFU/SPP Workshop sur l’analyse des données au centre de calcul de Lyon 17 avril 2008.
Migration Plan adressage EPLE Migration Plan d'adressage EPLE.
Le projet LCG-France Introduction et Informations générales Fairouz Malek Frédérique Chollet Rencontres LCG-France Novembre 2010 – CCin2p3.
Les méthodes de tests Les grands principes pour réaliser des tests efficaces.
QUASAR QUAlité des Services informatiques pour les AsR.
Migration du système de sauvegarde d’une infrastructure locale à un système centralisé IN2P3 101/06/2016 HEPIX Spring 2013 Muriel Gougerot (LAPP) and Remi.
Enjeux, succès et défis des grilles en physique des hautes énergies Faïrouz Malek, CNRS Paris le 3 Décembre 2007.
Eric Lançon1 Calcul ATLAS en France Le CAF au PAF * CAF : Calcul Atlas France *Célèbre contrepèterie.
PLAN REGIONAL DE MOBILISATION DE L’APPRENTISSAGE Rentrée 2016.
Opérations France-Grilles : Etat des lieux Hélène Cordier/Gilles Mathieu LCG France, 30 Mai 2011.
2011/06/14 Efficacité des jobs d’Atlas Pierre Girard Réunion de travail avec Atlas CC-IN2P3, le 14 juin 2011.
LCG-France Edith Knoops CPPM. Le LHC LEP LHC > 95% UNKNOWN STUFF OUT THERE > 95% UNKNOWN STUFF OUT THERE Black hole 3.
Mercredi 7 novembre 2007 Dominique Boutigny Activités et Évolution du CC-IN2P3 Réunion des Expériences 2007.
CAF LCG-FRANCE A.Rozanov LCG France 22 Juillet SOMMAIRE Composition CAF DC2 ATLAS Demandes fin 2004.
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
6-7 Octobre 2008J-P MEYER1 Conclusions du groupe de travail thématique 7 Physique subatomique: - physique des particules, - physique nucléaire, - astroparticules.
Conclusions (?) Fabio Hernandez Frédérique Chollet Fairouz Malek Réunion Sites LCG-France Annecy, May
SOLUTION ONLINE DE GESTION POUR LES SPECIALISTES DU TOURISME SUR MESURE
Projet LCG: Vue d’Ensemble Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3 Rencontre IN2P3/STIC Grenoble, 25.
African Centre for Statistics United Nations Economic Commission for Africa STRATEGIE AFRICAINE DE MISE EN OEUVRE DU SCN 2008 Présentée par Steve Loris.
Com. info., 7 avril 2011 Vincent Poireau 1. Rôle de la commission informatique Faire un bilan de l’informatique Evaluer les besoins des utilisateurs Proposer.
Fabio Hernandez Lyon, 9 novembre 2006 LCG-France Tier-1 Réunion de Coordination.
Tier-2 : GRIF  CEA/IRFU  LAL  LLR  LPNHE  IPNO  APC Suivi des opérations au niveau français: quelle organisation, quels outils Hélène Cordier LCG-FR.
CAF-11/10/2010Luc1 Squad Report T1 Période 13/09-11/10 Irena, Sabine, Emmanuel.
 rechercher et coordonner l'engagement des acteurs nécessaires, Christine=> Helene,Gilles (permet de réduire les groupes de travail comme mentionné dans.
Réunion des sites LCG France- Marseille juin ACTIVITES DU GROUPE ACCOUNTING FRANCE GRILLES Cécile Barbier (LAPP)
Frédérique Chollet (LAPP) Fairouz Malek (LPSC) Temps forts du workshop WLCG Copenhague, Novembre Rencontres LCG-France, 26 – 28 Novemebre CC-IN2P3,
20-mars-2008Eric Lançon1 Activités ATLAS sur le nuage Français Emprunts a K. Bernardet, C. Biscarat, S. Jezequel, G. Rahal.
Mercredi 22 juin 2016 Suivi des jobs grille Colloque LCG France Mars 2007.
GPA – 19 novembre Révision du SNDE GPS mars 2016 L. Coudercy, Onema.
Ghita Rahal Lyon, 17 Avril 2008 Outils d’information et de suivi pour l’utilisateur.
Tier 2 au LAPP. Plan Historique Objectifs Infrastructures Status/métriques Avenir Conclusion.
Activité du Groupe Monitoring LCG/SA1 fr LCG T2 T3 Face to Face meeting Mai 2009.
LCG-France Tier-2s Tier-3s Frédérique Chollet Fabio Hernandez Fairouz Malek Forum trimestriel LCG-France Lyon, 2 mars 2009.
Tier2: Subatech Tier2: LPC Tier2: GRIF CEA/DAPNIA LAL LLR LPNHE IPNO Tier2: GRIF CEA/DAPNIA LAL LLR LPNHE IPNO AF: CC-IN2P3 Tier3: LAPP Tier1: CC- IN2P3.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
Communication LCG-France Colloque LCG France Mercredi 14 mars 2007.
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
1DSM - IRFU / PM Compte rendu du site GRIF.
ATLAS Analysis Challenge Résultats du Stress Test Frédérique Chollet Information disponible sur le wiki LCG-France
CALCUL ATLAS LCG France (CC IN2P3 Lyon) 30 Avril SOMMAIRE Data Challenge 2 (DC2) d’ATLAS Utilisation du CC IN2P3.
CREAM & ICE Réunion SA1-France 11 mars 2008
Réunion de Coordination – Bilan des opérations LCG Hélène CORDIER
LCG-France Tier-1 & AF Réunion mensuelle de coordination
Journées LCG-France Point IPv6
Efficacité des jobs CMS en 2010
Transcription de la présentation:

Fonctionnement des sites (1 er trim.09) Frédérique Chollet Fabio Hernandez Fairouz Malek Forum trimestriel LCG-France Lyon, 6 avril 2009

2 Contents Fonctionnement des sites au 1 er trimestre 09  Utilisation CPU / Objectifs LCG-France ○Accounting EGEE - WLCG  Capacités installées / pledges 2009 ○informations collectées auprès des sites pour le moment  Utilisation CPU / pledges ○Rapports WLCG  Disponibilité des sites ○Rapports WLCG et Gridview (OPS) ○Dashboard VOs  Métriques GGUS Aperçu des travaux en cours  au Tier-1  dans le cadre du groupe technique T2-T3

3 Contribution by LCG-France 44 countries contributed CPU resources to the LHC experiments Source: EGEE Accounting PortalEGEE Accounting Portal 3 France : 12 % in 2008

4 Contribution by LCG-France CC-IN2P3 : 8 % in 2008 Source: EGEE Accounting PortalEGEE Accounting Portal 4

5 T2 contribution : 12 % in 2008 Contribution by LCG-France Source: EGEE Accounting PortalEGEE Accounting Portal

6 Contribution by LCG-France Source: EGEE Accounting PortalEGEE Accounting Portal T1 contribution : 30 % T2 contribution : 65 % included IN2P3-CC-T2 T3 contribution : 5 % 45 % outside CC-IN2P3 T1 contribution : 30 % T2 contribution : 65 % included IN2P3-CC-T2 T3 contribution : 5 % 45 % outside CC-IN2P3

7 Installed capacities in Tier-2s [% 2009 pledges] Source LGC-France : EDMS I EDMS I CPU DISK Next upgrade (apr.09) In 2008, none of the Tier-2 sites was able to purchase in advance to honor the pledges due in April 09

8 WLCG Tier-2 Accounting monthly reports Tier-2 used CPU [% 2008 pledge] by LHC VOs April. 08-Mar.09 Sites not equally used Source : EGEE accounting portal WLCG Tier-2 reportsEGEE accounting portal WLCG Tier-2 reports Pledges fully used inc. 60% efficiency

9 Tier-1 Reliability & Availability for OPS (jan. – fev.09) Source: Reliability of WLCG Tier-1 Sites + CERNReliability of WLCG Tier-1 Sites + CERN Target 97% since jan.09 9 Target 95% since jan.09 Jan. 09 Fiabilité : Jan’09 : 97 % Fev’09 : 99 % Fiabilité : Jan’09 : 97 % Fev’09 : 99 % Disponibilité : Jan’09 : 97 % Fev’09 : 98 % Disponibilité : Jan’09 : 97 % Fev’09 : 98 % Fev. 09 Source:

10 Tier-1 Reliability & Availability for OPS (jan. – fev.09) 10 Oct. – Dec. 08 Amélioration de stabilité de SRM/ dcache Jan-Mars. 09 Source:

11 Site Availability for OPS (jan. 09) Source: WLCG Availability and Reliability ReportsWLCG Availability and Reliability Reports IPHC : 95% GRIF : 99 % CC-T2 : 96 % SUBATECH : 99 % LPC : 94 % LAPP : 94 % Source: GridviewGridview LPSC IPNL CPPM Power cut Network maintenance T3s as good as T2s Source:

12 Site availability for OPS (feb. 09) IPHC : 96 % GRIF : 100 % CC-T2 : 97 % SUBATECH : 96 % LPC : 93 % LAPP : 100 % LPSC IPNL CPPM

13 Site availability for OPS (mar. 09) IPHC GRIF CC-T2 SUBATECH LPC LAPP LPSC IPNL CPPM Cooling pb schedule downtime

14 Disponibilité des sites Alice

15 Disponibilité des sites ATLAS

16 Disponibilité des sites CMS

17 Disponibilité des sites LHCb

18 Métriques GGUS Suivi des aspects opérationnels Janvier 2009 – 60/ROCFR (1 alarm test) Par qui le ticket est-il généré ? A qui est-il destiné ? Courtesy : Hélène Cordier OTHER : vo=none, vo=void, nonlhc VOs

19 Métriques GGUS Courtesy : Hélène Cordier Février 2009 – 42/ROCFR (1 alarm test) Mars 2009 – 55/ROCFR (4 alarm tests) OTHER : vo=none, vo=void, nonlhc VOs

20 Métriques GGUS Suivi des aspects opérationnels %Team+ LHCT1/T2 January2467 February5771 March5386 AVG4575

21 Interaction avec les expériences  Réunions de coordination avec CMS, ATLAS et Alice ce trimestre Migration HPSS  Évolution majeure version HPSS (chgt mécanisme d’authentification)  Initialement prévue pour le 1er avril Amélioration du staging bande disque  Ordonnanceur des requêtes passées à HPSS par dCache  Concept validé – Mesure du gain reste à faire, prévu prochainement avec des données ATLAS Déploiement d’un prototype de ferme d’analyse interactif basé sur PROOF  Cf présentation de Dominique Séparation claire des données T1 / T2 Chantiers en cours au Tier-1 (1 er trim.09)

22 Alice : contact établi via l’Alice Task Force Déploiement d’une instance WMS dédiée à Alice au GRIF  Demande initiale (1 instance associée à chaque T1)  Choix stratégique du CC-IN2P3 de ne pas se disperser Réponse française ( déploiement au GRIF) acceptée par Alice  Service assez complexe à maintenir – Période de stabilisation  Des problèmes hard., de stabilité, de tenue en charge (aplication d’un “mega patch”)  Exigence de réactivité de la part d’Alice Déploiement pilote d’un CREAM CE à Subatech Travaux en cours (1 er trim.09) Interaction sites – expériences

23 ATLAS : contact via meeting T2-T3 Jan. 09 : Analyse détaillée des erreurs des jobs de production par site survenue en 2008  Objectif améliorer l’efficacité des sites et du nuage  Pistes évoquées à poursuivre  Suivi top 4 des erreurs les plus fréquentes  Fail-over à prévoir en cas d’arrêt dcache au CC > 1 jour Analyse – Démarrage tests fonctionnels réguliers sur l’ensemble du nuage FR  Processus d’optimisation complexe de part et d’autre  Limitation LAN, charge infrastructure de stockage observés – Travaux d’upgrade en cours  Comparaison de différents modes d’accès et protocoles  Sugestion CPPM : reprise des tests d’accès en lecture via xrootd / DPM Travaux en cours (1 er trim.09) Interaction sites – expériences

24 CMS : contacts dans les sites CMS Utilisation GGUS (problèmes grille) et savannah (problèmes CMS)  difficulté exprimée par les sites CMS quant à l’utilisation d’un outil spécifique qui ne gère pas l’envoi d’alertes à une adresse mail générique Pas de problème particulier évoqué Suivi possible via les rapports journaliers CMS  pbs de file transfert pour l’essentiel…   Pb Savannah  forked a GGUS ticket Interrogation quant aux performances d’accès aux données via rfio de la part de l’IPNL dans le cas de job CMS  Intérêt d’une mise en commun des évaluations ATLAS et CMS dans le cas de l’analyse Travaux en cours (1 er trim.09) Interaction sites – expériences

25 LHCb : contact via relais auprès d’Andrei Bannissement site sur échec SAM test spécifique  LAPP : ‘set-up software’ timeout – accès à la zone software servie par gpfs – problème résolu grâce à l’optimisation de la configuration du système de fichier (mécanisme spécifique et sophistiqué lié à gpfs)  LPC : Pb de jobs stalled - site banni depuis plusieurs mois En attente décision LHCb : Evaluation de l’utilisation de certains T2s pour l’analyse de données ?  GRIF et CPPM prêts Travaux en cours (1 er trim.09) Interaction sites – expériences

26 Nouvelle unité de normalisation de la capacité CPU  Transition HEP-SPEC06 annoncée pour le RRB d’avril   Facteur de conversion simple HEP-SPEC06 = 4 * kSI2K  Licence SPEC06 achetée par le CC disponible pour les sites Groupe Accounting animé par C.Barbier (LAPP)  Elaboration, diffusion, archivage de données statistiques comprenant les informations nominatives véhiculées par le certificat de l’utilisateur)  Rédaction d’un document de synthèse transmis à la DSI via le resp. sécurité IN2P3 et IdG Groupe Monitoring animé par C.Leroy (Irfu)  Atelier Nagios en janvier, réunion de travail trimestrielle  Poursuite des travaux de régionalisation et de mise en commun Travaux en cours (1 er trim.09)

27 A venir… Collecte automatique des capacités installées via le système d’information Evolution probable vers xrootd  Sujet chaud pour tous les sites  pour toutes les expériences ?  Même xrootd ? (natif, plug-in DPM…) Migration SL5 Transition vers la NGI française Evolution connexion WAN du LAPP What else ?