Facilité d'Analyse au CC-IN2P3 (LAF) Renaud Vernet Journées LCG France 22 novembre 2010.

Slides:



Advertisements
Présentations similaires
Le projet MUST Méso infrastructure de calcul et de stockage ouverte sur la grille européenne LCG/EGEE Colloque Grille Rhône-Alpes 10 janvier 2008.
Advertisements

Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
RÉPONSE AU CAHIER DES CHARGES DE LA SOCIÉTÉ SONICS ACOUSTICS.
1 Logiciels Libres Planète en fête 6-7 Juillet 2007.
Alice LCG Task Force Meeting 16 Oct 2008 BARBET Jean-Michel - 1 /20 LCGFR-T2T3, Annecy Mai 2009Jean-Michel BARBET Subatech 1 /18 IN2P3-SUBATECH :
Outils et scénarios d’édition collaborative en Haute École Étienne Vandeput Projet HETICE © CRIFA - ULg.
Présentation LabPlus v3. Solution novatrice en Technologies de l’information Solution novatrice en Technologies de l’information Application pour la Gestion.
OpenArticles : Libérez votre savoir ! Mise en place d'un service libre et gratuit de dépôt et d'accès aux articles scientifiques David Larlet – Janvier.
1 Administration ESCO-Portail Les environnements numériques de travail Administration du socle de l'ENT Les applications.
Développement d'applications Web avec le framework PHP Symfony 2 Mathieu Peltier (Mercator Océan - CNRS) (UMS 831, Observatoire Midi-Pyrénées)
Logiciel Assistant Gestion d’Événement Rémi Papillie (Chef d’équipe) Maxime Brodeur Xavier Pajani Gabriel Rolland David St-Jean.
FORMATION PRODIGE Aspects techniques Christophe BOCQUET (CPII/DOO)
ALICE February/March exercise summary Latchezar Betev WLCG Collaboration Workshop 22 April 2008.
Module 14 : Installation et configuration des services Terminal Server.
Nouveautés Version 4.1 et mai 2017.
Les commandes externes
L’activation des réseaux informatique des lycées
Expérience de l’Université de Boumerdes
LE NOUVEAU PHYLOGENE LYON le 08 décembre 2008
Dossier Médical Personnel
Google analytics.
Publication site AROEVEN
Présentation de l’activité de conseil
E. Malengreau, Assistante pédagogique QAP-Polytech
Ecriture collaborative d’une dissertation en classe
Séminaire Novembre 2006 Zephir : Déploiement et supervision des serveurs Eole.
Devenir d’AFS et remplacement progressif
Séminaire EOLE Dijon octobre 2010
Fedora 26 Quelles nouveautés ? License CC-BY-SA.
Frédéric Galleazzi EN/ACE/INT
Le nœud de grille de calcul de l'IPHC dans CMS
Présentation J GUIRANDE.
Support – info Sauvegarde des données locales des postes clients
Workshop Opération , Bordeaux , 07 Novembre 2016
Surveillance des services grille par NAGIOS
Etat des lieux des VO Boxes LHC
Réunion coordination WLCG Lyon, le 13 mars 2008
Statut du T2 Île de France
Etat actuel et perspectives des CEs
Intégration des services grid à l'exploitation
Projet de « cellule Europe mutualisée »
1ers pas des utilisateurs migrés
Jobs ATLAS sur la grille
Vie et mort des comptes utilisateurs
La grille de calcul EGEE
Les centres d’analyse: introduction
Résumé de la réunion PAF-CAF 12/04/2010
L’hébergement de fournisseurs d'identités par RENATER
Integrated Business intelligence
Modélisation objet avec UML
Module 13 : Implémentation de la protection contre les sinistres
Par François Guay-Fleurent et Martin Lahaie Congrès de l’AQIFGA
Déploiement Windows 10 Forum du CEG 2017 Polyvalence Qualité
CAS AFPA Sprint n°1.
Réalisé Par : Ahmed Ben Dahmen Slimen Ouni Chahed Ben Slama
JDepend - Analyse de la qualité du code Java -
Représentant technique Représentant scientifique
Infrastructure Opérationnelle d’EGEE2
Elles contiennent des informations autre que géométriques
Michel Jouvin Comité des utilisateurs 14 Mai 2007
Etude de cas collaborative à distance IDCE(r)
Michel Jouvin LAL/Orsay
DC04 CMS Objectif Status Planning
Chaque transparent est divisé en 3 parties : 1/Vision/ But
LCG – France et ALICE Bilan 2006 Planning fevrier 2007
Exploitation de vos données
AP. Bernardes /SSO injecteurs, K. Boonroy/HSE-OHS, G. Cumer/EN-ACE, H
Parcours vers l’adoption d’une méthode de prestation DevOps (Opérations de développement) Applications offertes sur le marché et applications de SPC.
L’harmonisation de la gestion différenciée
Transcription de la présentation:

Facilité d'Analyse au CC-IN2P3 (LAF) Renaud Vernet Journées LCG France 22 novembre 2010

22/11/2010 R. Vernet - Journées LCG France 2/2/ LAF et PROOF î LAF : Lyon Analysis Facility  Cluster PROOF actuellement dédié à l'analyse pour communauté française des expériences LHC î PROOF : Parallel ROOt Facility q Service fourni par ROOT, basé sur xrootd, permettant analyse +/- finale sur N workers parallèles  Sessions interactives : alternative intéressante à la GRID q Compilation en-ligne du code necessaires a l'analyse (proof archives) 3 Chargement de librairies pre-compilees possible q Connection possible depuis laptop personnel 3 Mais compte au CC requis q Contraintes:  Accès aux données par xrootd 3 Code analyse basé sur TSelector (evt par evt)

22/11/2010 R. Vernet - Journées LCG France 3/3/ Concept de PROOF

22/11/2010 R. Vernet - Journées LCG France 4/4/ Plus en détail..

22/11/2010 R. Vernet - Journées LCG France 5/5/ Configuration actuelle de LAF machine interactiv e (ccali)

22/11/2010 R. Vernet - Journées LCG France 6/6/ Configuration actuelle de LAF maste r worker s PROOF 16 Dell PEM610 * 16 cores 2.53GHz... machine interactiv e (ccali) Nouvelles machines LAF PROOF

22/11/2010 R. Vernet - Journées LCG France 7/7/ Configuration actuelle de LAF maste r worker s PROOF 16 Dell PEM610 * 16 cores 2.53GHz... machine interactiv e (ccali) 2*1 Gb/s Sun Fire X TB storage 2*1 Gb/s xrootd storage xrootd redirector (ATLAS) 100 TB storage Nouvelles machines LAF PROOF

22/11/2010 R. Vernet - Journées LCG France 8/8/ Configuration actuelle de LAF xrootd storage 10 Gb/s 3 Dell EqualLogic PS 6010xv 16 blades x 600GB SAS 15krpm RAID5 20 TB eff. storage maste r worker s PROOF 16 Dell PEM610 * 16 cores 2.53GHz... machine interactiv e (ccali) 2*1 Gb/s Sun Fire X TB storage 2*1 Gb/s xrootd storage xrootd redirector (ATLAS) 100 TB storage Performances disques décevantes → seront mis sous forme d'une unité logique a haute connectivité (en cours...) Nouvelle baie de disques Nouvelles machines LAF PROOF

22/11/2010 R. Vernet - Journées LCG France 9/9/ Configuration actuelle de LAF xrootd storage 10 Gb/s 3 Dell EqualLogic PS 6010xv 16 blades x 600GB SAS 15krpm RAID5 20 TB eff. storage maste r worker s PROOF 16 Dell PEM610 * 16 cores 2.53GHz... machine interactiv e (ccali) 2*1 Gb/s Sun Fire X TB storage 2*1 Gb/s xrootd storage xrootd redirector (ATLAS) 100 TB storage Performances disques décevantes → seront mis sous forme d'une unité logique a haute connectivité (en cours...) Nouvelle baie de disques Nouvelles machines LAF PROOF

22/11/2010 R. Vernet - Journées LCG France 10/ Dernières nouvelles î Changement matériel depuis dernière réunion  Achat de CPUs et baie de disques dédiés à l'analyse interactive  Mise à jour de la documentation q q Sections dédiées : ALICE & ATLAS î Création d'une liste de diffusion pour utilisateurs  î Forum utilisateurs q  Très peu utilisé... î Interface xhelp pour tickets q Celle-ci est utilisée !

22/11/2010 R. Vernet - Journées LCG France 11/ Niveau de service & gestion des incidents î Au niveau système q Service (monit) assurant le fonctionnement des démons PROOF/xrootd q Vérification régulière et relance automatique î Alertes NAGIOS q Sondes testant connexion simple utilisateur : q Connexion OK 3 → RAS  Connexion OK mais certains workers tombés (warning) 3 → Notification lafmaster et sysadmins q Connexion impossible (critique) 3 → Intervention rapide nécessaire  → recettes a appliquer pour exploitation/astreint : relance des démons

22/11/2010 R. Vernet - Journées LCG France 12/ Utilisation de LAF î LAF peu populaire î En moyenne quelques dizaines de connections par jour (hors week-ends) Connections depuis Octobre

22/11/2010 R. Vernet - Journées LCG France 13/ Problèmes en cours î ALICE q Installation des modules spécifiques a l'expérience 3 Cf plus loin î ATLAS q RAS î Commun q “workers still sending”  Sessions qui ne finissent pas (1-2 workers ne terminent pas leur tâche) 3 Peut arriver sur n'importe quel noeud 3 Probabilité augmente avec taille du dataset  Ticket soumis sur ROOTTalk : En cours

22/11/2010 R. Vernet - Journées LCG France 14/ Mise en production  LAF possède à présent q SL5 q Machines plus performantes, plus de machines q Service de relance automatique des démons q Alertes Nagios pour lafmaster, exploitation & astreint î → meilleures garanties de fonctionnement/accessibilité q Forum, mailing list, support tickets î → meilleure aide aux utilisateurs î Les problèmes en cours ne sont a priori pas dépendants du CC î → Mise en production officielle prévue dans les jours qui viennent (objectif = cette semaine)

22/11/2010 R. Vernet - Journées LCG France 15/ Amélioration apportées pour ALICE î Synchronisation des packages ALICE avec l'espace software GRID du CC q mêmes packages AliEn, ROOT, AliRoot que pour les jobs GRID q possible chargement direct des librairies 3 (= compilation des packages sur PROOF pas nécessaire)  Accès direct aux données sur GRID possible q Mais pas de rapatriement automatique, les données restent distantes q Peu rapide, mais utile pour tests î Reconstruction des données brutes possibles

22/11/2010 R. Vernet - Journées LCG France 16/ Perspectives côté ALICE î Le déploiement de la solution AAF (Alice Analysis Facility) serait un gain substantiel î Inclusion de LAF dans le 'nuage' des AAF q Partage datasets, staging automatique etc. î Mais échec de l'installation au CC q Support de l'expérience requis mais demande d'ouverture de LAF a la collaboration (pas uniquement labos français) 3 Son utilisation resterait néanmoins en grande partie française q Discussions en cours î Tutoriel pour communauté ALICE prévu début décembre

22/11/2010 R. Vernet - Journées LCG France 17/ Conclusions î Nouveau cluster q OS, perf, # CPU î Problèmes techniques sur nouveaux disques q → mise en place d'une alternative en cours î Ajouts services de surveillance et sondes Nagios q Montrent que l'accessibilite du service ~ 100%  Outils présents pour poser ses questions, exprimer son mécontentement etc. î → Mise en production imminente  Nombre d'utilisateurs étonamment faible  Problèmes de performances, d'utilisation ??? q Trop peu de retour des utilisateurs :(