CAF-11/10/2010Luc1 Squad Report T1 Période 13/09-11/10 Irena, Sabine, Emmanuel.

Présentations similaires

Présentation au sujet: "CAF-11/10/2010Luc1 Squad Report T1 Période 13/09-11/10 Irena, Sabine, Emmanuel."— Transcription de la présentation:

1 CAF-11/10/2010Luc1 Squad Report T1 Période 13/09-11/10 Irena, Sabine, Emmanuel

2 CAF-11/10/2010Luc2 Jobs de Production par nuage Total 5.6M jobs (période précédente 1 mois 8M) France 13% (précédente 15%)

3 CAF-11/10/2010Luc3 Efficacités par nuage France 80.5% Dernière période 91%

4 CAF-11/10/2010Luc4 Lyon Dominé par pb de release (tous nuages) Efficacité T1 70.5% (90% période précédente)

5 CAF-11/10/2010Luc5 Vobox 02 (Ghita) Basics –Rôle FR OK –Proxy créé –Fichiers rapatriés Cron, factory –Installation factory (Ghita) Reste à tester –Mise en route des Renew proxy OK (Pierre, Ghita) –Mise en route des Submit en cours (Ghita, LP) Uniformiser/finaliser utilisation des 3 vo box

6 CAF-11/10/2010Luc6 Problèmes (1) Soumission de pilotes –Proxy expiré / Nouvelle procédure (Pierre) Ajustement des ressources T2/T1 –Difficile à converger Kernel security pb + CC downtime for maintenance –18/10 cloud set to « brokeroff » Linux kernel security problem (T1+T2) + CC Scheduled maintenance downtime scheduled after the weekend –21/10 cloud set to « offline» (LFC down) – Cloud back to production 22 : LFC back in production => analysis queues back online 22 : vobox not accessible from outside, proxy to renew 23 : SRM back in production => T2 production queues back online 23-24 : transfer stuck due to dcache scan : whole cloud paralyzed, some datasets transfered by hand to unblock the situation

7 CAF-11/10/2010Luc7 Problèmes (2) 27/09 Files missing/lost à Lyon 30/09 Transferts de Lyon vers vers FZK & T2s 01/10 Unacessible files in Lyon (unavailability of a pool server) 04/10 Instabilité à Lyon (LFC glitch) 06/10 Transfer errors from CC 08/10 LFC down tout le nuage en erreur –DB servers could not be access due to a network problem –Switch failure in our Oracle cluster. (This leads FTS lost connection to DB & transfers failed) 9/10 Lyon Disk servers Transfer errors from IN2P3- CC_DATADISK and IN2P3-CC_MCDISK 10/10 gridftp_copy_wait: Connection timed out (eg vers LAL and LAPP)

Télécharger ppt "CAF-11/10/2010Luc1 Squad Report T1 Période 13/09-11/10 Irena, Sabine, Emmanuel."

Présentations similaires

Annonces Google