LCG –France Tier2 & AF Réunion de Coordination – Problèmes récurrents des VOs 10 Septembre – 21 Octobre Hélène CORDIER
Résumé : Bilan de des problèmes récurrents Depuis la dernière réunion le 10 Septembre - et leur statut Pas de nouveaux incidents > 1 semaine ou récurrents Fermés [Atlas, exploitation] installation Athena http://cctools2/elog/problemes-VO/121: La procédure d’installation automatisée est en place depuis le 20/10/09 [LHCb, dcache] test d’accès aux données http://cctools2/elog/problemes-VO/117: Tests satisfaisants, suite à réorganisation des fichiers et allocation d’espace pour space-tokens LHCb en Juillet. [Cms] pb on dcache pool ccdcatsn70 http://cctools2/elog/problemes-VO/113: Machine retirée de production en Septembre) Jeudi 10 Septembre 2009
Détails -- Bilan de des problèmes récurrents Améliorations sur moyen terme – actions en cours Atlas, Cms prestaging et tape family: Ordonnanceur des requêtes dcache / implementation de HPSS6.2: http://cctools2/elog/problemes-VO/114 : En attente des résultats du scénario à tester en Novembre [CMS] [Atlas, dcache] : demande de dump régulier de la DB de dcache pour comparer mensuellement avec les fichiers présents dans pnfs http://cctools2/elog/problemes-VO/119 (ouvert le 11 août, incohérences constatées depuis mi-juin): vu avec le CAF 12 octobre pour mise en place de dump total et mensuel sur /pnfs [Atlas, HPSS] : demande de communication des listes de fichiers contenus sur bandes bloquées http://cctools2/elog/problemes-VO/103 (ouvert le 28 juillet) [AP] script développé par PEB, en attente de procédure d’utilisation; à l’ordre du jour de la prochaine réunion exploitation-HPSS, vu avec NL le 22/10/09 Stand by – en attente de mise à jour, très basse priorité ou unsolvable. [Atlas, dcache] : demande similaire vis-à vis de dcache http://cctools2/elog/problemes-VO/108 (ouvert le 9 septembre) , doit confirmer la demande auprès des administrateurs dcache. [Atlas, exploitation] configuration de la vobox cclcgatlas 04 : http://cctools2/elog/problemes-VO/116 (ouvert le 07 Juillet, pb existant depuis fevrier 2009) : workaround trouvé [AP] Soulever le point du contact expert Atlas nécessaire au CAF par le support-atlas ? En attente d’update [AP] Développer une sonde nagios par Nagiosmaster pour remplissage de /var done [All, initialement CMS, exploitation] CMS spécifiques tests échouent 1/2 :mapping sur pool de comptes : http://cctools2/elog/problemes-VO/98 [AP] basse priorité sur PG, l’incident étant clos. Generic robotic hardware failure http://cctools2/elog/problemes-VO/64 : incident fermé work-around : la version du micro-code n’est pas à jour. Jeudi 10 Septembre 2009