Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR-T2T3, Annecy 18-19 Mai 2009Jean-Michel BARBET Subatech 1 /18 IN2P3-SUBATECH :

Slides:



Advertisements
Présentations similaires
Alice LCG Task Force Meeting 16 Oct 2008Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1/20BARBET Jean-Michel - 1/20 LCGFR Marseille Juin.
Advertisements

EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Mc Donald’s calendrier 2007.
Le projet MUST Méso infrastructure de calcul et de stockage ouverte sur la grille européenne LCG/EGEE Colloque Grille Rhône-Alpes 10 janvier 2008.
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
Vendredi 23 mars 2007 Le CC-IN2P3 Un instrument informatique de pointe au service de la recherche.
Evolution des services Retour sur les incidents récents: Disfonctionnements cluster SUN (répertoires disques) : – Incidents et actions réalisées Disfonctionnements.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Grid Service Monitoring Working Group Exemple.
LHC Computing Grid Infrastructure de Grille à l'IPHC Yannick Patois.
Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR Marseille Juin 2010Jean-Michel BARBET Subatech 1 /22 Support de la VO Alice à.
Facilité d'Analyse au CC-IN2P3 (LAF) Renaud Vernet Journées LCG France 22 novembre 2010.
LHC Computing Grid Évolution du T2 de l'IPHC Yannick Patois.
Projet LCG-France Planning Fairouz Malek, Fabio Hernandez Responsables LCG-France Journées projets de l’ IN2P3 Paris, 5 juillet 2007.
Le système Raid 5 Table des matières Qu'est ce que le RAID ? Les objectifs Le raid 5 Les avantages et les inconvénients Les composants d’un Raid.
INFSO-RI Enabling Grids for E-sciencE L’activité EGEE au CINES Nicole Audiffren, Adeline Eynard et Gérard Gil Réunion de la fédération.
Xen et l' Art de la Virtualization Antoine Nivard Responsable technique Adéquat région Ouest Responsable de Site francophone de XEN Computer.
Perspectives Cloud dans le cadre du projet EQUIPEX CAPRI 1 décembre 2011 Dominique Boutigny.
Les besoins des entreprises en matière de maîtrise de leur S.I Les performances Métiers Le bon fonctionnement des Infrastructures Le dimensionnement des.
1PUG France : OpenEdge Management CNAF OpenEdge Management CNAF.
Salle informatique mutualisée Virtual Data – 2 juillet 2012
La Grille de Calcul du LHC La Grille de Calcul du LHC
Organisation pour l'Opération de demain Equipe Opération
Michel Jouvin LAL/Orsay
PORTEFEUILLE DE COMPETENCES
Passage de Main SYSGRID Réunion 1
LE PASSAGE À L’EURO DE L’APPLICATION ICARE
Opérations France Grilles - structure et fonctions
Modèle opérationnel de la grille
Le nœud de grille de calcul de l'IPHC dans CMS
Colloque Grille Rhône-Alpes
Réunion Analyse D0 France au CCIN2P3 19 janvier 2004
Vue d'ensemble de l'utilisation du CCIN2P3 par les expériences LHC
Un instrument informatique de pointe au service de la recherche
Planification budgétaire Tier2s & Tier-3s Etat d’avancement
GRIF : Grille pour la Recherche en
Projet « France Tier-2 » et les conséquences pour France Grilles
Etat des services grid de production
Surveillance des services grille par NAGIOS
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Surveillance des services grille par NAGIOS
Etat des lieux des VO Boxes LHC
2ème coloque LCG-France
Statut du T2 Île de France
2018/8/9 CLAP Cluster de virtualisation et de stockage distribué du LAPP Mardi 26 avril 2016 Entrez votre nom.
CeMEB La plateforme MBB
LCG-France Tier-1 & AF Réunion mensuelle de coordination
LCG –France Tier2 & AF Réunion de Coordination – Problèmes récurrents des VOs 11 Juin- 10 Septembre Hélène CORDIER.
L’exploitation des données du collisionneur LHC: un défi pour le calcul scientifique un enjeu pour le LAPP S. Jézéquel.
Le Projet GRIF Efficient Handling and processing of
CeMEB La plateforme MBB
Présentation du Service Informatique
TreqS TReqS 1.0.
Les centres d’analyse: introduction
Atelier régulation de la production dans un contexte grille
Infrastructure Opérationnelle d’EGEE
GRIF : Site EGEE au Service de la Recherche en IdF
Un cloud de production et de stockage
Représentant technique Représentant scientifique
Infrastructure Opérationnelle d’EGEE2
Représentant technique Représentant scientifique
DC04 CMS Objectif Status Planning
09 Septembre M 2 M 3 J 4 V 5 S 6 D 7 L 8 M 9 M 10 J 11 V
Comité Scientifique GRIF
LCG – France et ALICE Bilan 2006 Planning fevrier 2007
Résumé des Actions Suite aux Réunions CB et MB
Mise en place d’un Plan de Gestion des Données au GANIL
ÉPREUVE E6 PARCOURS DE PROFESSIONNALISATION Lucas Coutière BTS SIO (SLAM) – 2 ème année Lucas Coutière BTS SIO (SLAM) – 2 ème année.
Transcription de la présentation:

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 1 /18 IN2P3-SUBATECH : Tier2 Alice Le Projet “Tier2” Subatech Situation actuelle Choix techniques Quelques résultats Experiences Xrootd natif et CREAM-CE Questions à l'étude Conclusion

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 2 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 2 /18 Le Projet “Tier2” Subatech Une seule VO LHC : Alice Dates clés  Avant LCG : Participation au PDC04 Alice avec AliEn  Site IN2P3 Subatech Certifié le 20 Janvier 2006  Premiers jobs Alice (sur gLite) : 23 Mai 2006  Stockage DPM-xrootd utilisé en production : 26 Mars 2008 Financement : fonds propres et région Pays-Loire Utilisation locale à hauteur de 30% max du CPU Ressources Humaines : 1.4 ETP(*) ‏  1 CR CNRS : 0.1 ETP  4 ITA CNRS : 1.3 ETP (*) ETP = Equivalent Temps Plein

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 3 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 3 /18 Ressources Notes : Nombre de CPU indiqué = 70% du total (30% usage local) ‏KSI2K : Valeurs WLCG

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 4 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 4 /18 Choix techniques Intégration du site Grille avec les autres services opérés par le Services Informatique  Même Infrastructure, sécurité (firewall) ‏  Intégration au monitoring Nagios Local et développement de tests spécifiques Utilisation de machines virtuelles VMWare  Snapshots, clones, déplacement à chaud Distribution “relogeable” pour le middleware Quattor  Le système d'exploitation des workers, pas le middleware  Intégration progressive des autres noeuds : Site BDII, xrootd

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 5 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 5 /18 Infrastructures Salle 60-80m2 avec faux-plancher 2 unités de climatisation 2 lignes électriques avec onduleur  Double alimentation sur la majorité des équipements Contrôle environnement  Boitier APC : détection température (3 sondes), fuite liquide,...  Transmetteur téléphonique

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 6 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 6 /18 Situation Actuelle : Services Site BDII Computing Element CREAM-CE Computing Element LCG-CE Storage Element DPM-xrootd : 1 head-node 4 serveurs GPFS Baie IBM DS To 2 Serveurs GPFS 7 serveurs Dell Tiroirs MD1000 RAID6 Storage Element xrootd natif 1 manager xrootd VOBOX Alice 1 VOBOX Alice 2 Cluster Torque 260CPU Partagés Grid+Local Cluster Torque 120CPU Grid only Machine Virtuelle VMware Machine Physique

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 7 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 7 /18 Quelques Résultats Reliability/Availability EGEE :  2008 : Reliability : 94.7 Availability : 94.7  2009 : Reliability : 98.0 Availability : 98.0

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 8 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 8 /18 Quelques Résultats Part “Done Jobs” Subatech dans Alice en 2008 : 4%

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 9 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 9 /18 Quelques Résultats “Done Jobs” Subatech en 2008 dans LCG-FR : 21.6 %

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 10 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 10 /18 Sites Français 2008 Activité de production MC en 2008

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 11 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 11 /18 Sites Français 2009

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 12 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 12 /18 Sites Français 2009 en KSI2K‏

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 13 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 13 /18 DPM-xrootd Disponible Novembre ère installation : Avril 2007, Prêt en Mars 2008 Participation à la rédaction de la documentation Utilisé en production en Juin 2008  Mode Cible pour la production MC : OK  Mode Analyse : forte charge MySQL constatée lors de travaux de “merging” impliquant de nombreux accès.  De nombreux accès font gonfler les tables qui conservent l'historique des requêtes (nettoyage nécessaire) ‏

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 14 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 14 /18 DPM-xrootd 90% plein suite production en décembre 2008

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 15 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 15 /18 xrootd natif Premier cluster xrootd natif de test : Août 2008 Test des versions successives et du packaging RPM : Septembre 2008  En collaboration avec F.Furano  Test débit : 400Mbits/s avec un seul server/manager Installation du stockage actuel (~100To) :  1 manager et 4 serveurs installés via Quattor  Serveurs: Dell tiroirs MD1000 soit 24To RAID6

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 16 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 16 /18 Xrootd natif En production depuis le 11 Mai 2009  Jusqu'à présent (14/05) le traffic réseau maximum a atteint 12Mo/s pour l'ensemble et 2.5Mo/s par serveur.

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 17 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 17 /18 Experience CREAM-CE Premiers tests Nov 2008 Nécessite une 2nde VOBOX  crée par clonage le 1er Avril 2009 Cluster distinct constitué de 120 cores En production depuis le 16/04

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 18 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 18 /18 Questions à l'étude Le partage d'un cluster avec les locaux  Permet aux utilisateurs locaux de profiter des périodes de creux de la production. Fair-share Maui réglé à 70%/30%  Mais il faut s'accorder sur l'OS et l'architecture  Des problèmes récents ont permis de prendre conscience des risques pour la sécurité de ce choix L'interprétation du “Job efficiency”  Enquête en Juin 2008 pour tenter d'expliquer certaines différences systématiques entre les sites au niveau de la métrique “Job Efficiency”.  Ces différences se sont estompées avec la production actuelle  Néanmoins, la surveillance et la compréhension de cette métrique sont indispensables

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 19 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 19 /18 Questions à l'étude Comment comprendre ce qui se passe ?  Le “site manager” qui suit se qui se passe sur son site doit pouvoir interpréter les incidents de production afin de savoir si c'est le site qui est en cause  Il nous faut répertorier les différents tableaux de bord et sites de monitoring permettant d'analyser la situation Rappel : T1/T2 ALICE Tutorial: Services Management before the real data taking CERN 26 et 27 Mai 2009

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 20 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 20 /18 Boite à Outils pour un site Alice Documentation : Monitoring MonaLisa : Souscription aux alertes MonaLisa Alice LCG Task Force Meeting WLCG Daily Operations Meeting Alice Dashboard :

Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 21 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 21 /18 Conclusion Se concentrer sur une seule VO LHC a permis de s'investir et de chercher à offrir le meilleur service possible, Les autres groupes de recherche du laboratoire ont bénéficié de l'augmentation des ressources de calcul La participation au projet LCG a demandé un effort supplémentaire très significatif au Service Informatique mais a permis aux ASRs de découvrir de nouvelles technologies et de progresser.