Réunion coordination WLCG Lyon, le 13 mars 2008

Slides:



Advertisements
Présentations similaires
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
Advertisements

Interactivité et Lingo Interactivité - spécifier le déroulement en fonction des actions de l’usager Ex: Déroulement si l’usager clique Choix dans une liste.
INFSO-RI Enabling Grids for E-sciencE Statistiques d'usage d'un site de la grille LCG/EGEE Emmanuel Medernach, IN2P3 LPC.
9/24/2016 ItrainOnline MMTK DÉPANNAGE SANS FIL Préparé par Alberto Escudero-Pascual.
Subversion. 2 Subversion : Pour Quoi Faire ? Problèmes de la gestion du code dans un projet – La durée de vie du projet peut être longue : besoin de gérer.
Yannick Patois 1 Utilisation LCG-France Les Technical Evolution Groups et LCG-France.
Migration LGA, Windows 2008 ● Pré-requis ● Postes clients ● Serveurs.
Un logiciel libre de détection du plagiat plagiat RMLLRMLL’08, Rémi BACHELETRémi BACHELET Présentation sous licence Creative Commons, selon les conditions.
ALICE February/March exercise summary Latchezar Betev WLCG Collaboration Workshop 22 April 2008.
Les commandes externes
Cycle 3 Cycle 4 Pilotage du robot mBot Site scratch :
<Acronyme du Projet> <Titre>
DropBox Projet App’Ifa.
Un Algorithme , c'est Quoi ?
Détection des erreurs.
Qu'est-ce que POSIX? Une librairie en langage C
Le Cycle de vie d’un logiciel
NuFW, un parefeu authentifiant
Page 4-3 Le programme InSQL Configure
LA QUALITE LE PRODUIT EST TOUJOURS UN SUPPORT DE SERVICES
Plans d’expériences: Plans factoriels
Virtualisation d’applications mobiles dans un réseau de Cloudlets
Workshop Opération , Bordeaux , 07 Novembre 2016
Projet Ville de Lyon Annuaire des associations
GRIF : Grille pour la Recherche en
Intégration de BQS dans CREAM
Pierre Girard LCG-France Tier
Pierre Girard LCG-France Tier
Fonctionnement de la grille
Activités présentes et à venir
Etat des lieux des VO Boxes LHC
Déploiement d’un LCG CE
Statut du T2 Île de France
Windows Deployment Services.
Jobs ATLAS sur la grille
Mise en place d’une stratégie de groupe
Équations - Inéquations
CREAM-CE et SGE.
La plateforme InteropSanté - GAZELLE
Atelier régulation de la production dans un contexte grille
Cours 30.
Mesure de la dilatation du temps de vie des muons cosmiques
Short distance Exposure (Mask Aligner)
Phase de préparation avec le commanditaire
Sommaire : Projet Table tactile Projet Système d’arrosage automatique.
Cyberattaques dans la pratique
Proposition d’une Bonne Pratique pour la gestion de la Mobilité Enseignant
conclure la transaction Ignite session de réflexion nº 11
Module 13 : Implémentation de la protection contre les sinistres
Mésocentre de calcul et de stockage ouvert sur la grille EGEE (MUST) LAPP/ Université de Savoie / EGEE.
Les Contenus en Orientation Scolaire et Professionnelle (COSP)
Zeendoc et les logiciels comptables
Comprendre le fonctionnement d’un réseau
REDUCTION DES CHARGES A TRAVERS L’USAGE DE NOUVEAUX
Infrastructure Opérationnelle d’EGEE2
Elles contiennent des informations autre que géométriques
Michel Jouvin Comité des utilisateurs 14 Mai 2007
DC04 CMS Objectif Status Planning
Les Contenus en Orientation Scolaire et Professionnelle (COSP)
Chaque transparent est divisé en 3 parties : 1/Vision/ But
Design, innovation et créativité
Test de performances. Test de performances:  Un test de performance est un test dont l'objectif est de déterminer la performance d'un système informatique.
UGVBA Descriptions Programmations Les plus UGVLOG+
Les réseaux informatiques
IBM Software Cincom Systems Réduire d'environ 20 % le délai de mise sur le marché avec IBM WebSphere Liberty Profile Le besoin: L'équipe d'ingénieurs de.
I. Aouichak, I. Elfeki, Y. Raingeaud, J.-C. Le Bunetel
Parcours adapté L’évaluation au service des apprentissages
Role-Based Access Control (RBAC) Les permissions d’administration
Libramont – 29 juillet Intro faite par Emmanuel Grosjean (5 à 10 min) - contexte général et création du référentiel - Présentation brève du collectif.
Gestion des destinataires (recipients)
Transcription de la présentation:

Réunion coordination WLCG Lyon, le 13 mars 2008 sreynaud@in2p3.fr mardi 31 juillet 2018 Tests glexec/BQS Réunion coordination WLCG Lyon, le 13 mars 2008 sreynaud@in2p3.fr

Contraintes de déploiement de glexec Conclusion et discussion Plan Rappel du contexte Tests avec BQS Description Résultats Contraintes de déploiement de glexec Conclusion et discussion

solution choisie au niveau du projet Rappel du contexte problème lorsque 2 jobs pilotes soumis avec un même proxy tournent sur une même machine, les "user jobs" de 2 utilisateurs différents ont les mêmes droits d'accès sur leurs fichiers (y compris leur proxy!). solution choisie au niveau du projet les jobs pilotes s'engagent à appeler glexec pour chaque "user job" les sites doivent déployer glexec => nécessité de vérifier le comportement de BQS en cas de changement d'utilisateur Unix

Rappel du contexte

Description des tests (1/2) Référence calcul pendant T minutes Test 1 job change d'UID, fork et attend la fin du fils fils calcule T minutes Test 2 job change d'UID, fork et attend T minutes fils fork et se termine petit-fils calcule T minutes Test 3: idem test 2 + … petit-fils change de process group ID avant de calculer Test 4: idem test 2 + … petit-fils crée une nouvelle session avant de calculer Test 5 job fork et attend T minutes fils fork et se termine petit-fils change d'UID et calcule T minutes

Description des tests (2/2) Sleep 30" au début de chaque test Durée du calcul 1 minute 2 minutes jusqu'à ce que BQS tue le job (environ 5 min.) jusqu'à ce que le user tue le job (qdel) 2 jobs simultanés d'un même utilisateur pendant 2 minutes job de référence + chacun des tests test 2 + test 3 test 4 + test 5

Comportement attendu pour tous les tests Résultats des tests Comportement attendu pour tous les tests Détection du dépassement de CPU et kill par BQS Kill par l'utilisateur via qdel Comptabilité sous-estimée d'une 15aine de secondes dès que le calcul est effectué par un processus fils de 1 Un cas d'erreur détecté pour job de référence + test 5: comptabilité sous-estimée de plus de 30" 0:19:48 au lieu de 0:43:38 (en temps normalisé) non reproductible

Contraintes de déploiement Version déployée glexec 0.5.23-3 http://eticssoft.web.cern.ch/eticssoft/repository/org.glite/org.glite.security.glexec/0.5.23/slc4_ia32_gcc346/glite-security-glexec-0.5.23-3.slc4.i386.rpm gLite-WN 3.1 /afs/in2p3.fr/system/@sys/usr/local/grid/glite/3.1.4-1/WN/ /afs/in2p3.fr/system/@sys/usr/local/grid/glite/3.1.4-1/WN-glexec/ http://glitesoft.cern.ch/EGEE/gLite/R3.1/glite-WN/sl4/i386

Contraintes de déploiement binaires glexec et glexec_fork setuid bit pas dans n'importe quel volume (sinon fonction seteuid() échoue) compte local glexec:glexec (pour des raisons de sécurité) /etc/ld.so.conf (car LD_LIBRARY_PATH perdu en route…) des chemins en dur /opt/glite/etc/glexec.conf (pour des raisons de sécurité) /usr/lib/libgridsite* /etc/grid-security: mêmes besoins que pour un CE grid-mapfile, gridmapdir, vomsdir… attention aux permissions sur les fichiers de configuration ! lcas-glexec.db, lcmaps-glexec.db, ban_users.db, grid-mapfile…

Conclusion et discussion support de glexec par BQS perte d'une partie de la consommation CPU avec les conditions de test suivantes: 2 jobs pilotes d'une même VO sur même machine 1 job pilote appelle glexec dans le processus principal 1 job pilote appelle glexec dans un processus fils de 1 2 jobs utilisateur avec le même proxy + une condition non identifiée… (bug non reproductible) déploiement de glexec sur les workers déployer les packages sur AFS ne suffit pas OK ?