Palaiseau Réunion CCIN2P3/LCG 22/07/2004 Distribution des données CMS Distribution des données et préparation de l’analyse Production MC distribuée et données centralisées au CERN accès pour site Tier cas des données de LHC Besoin distribution en vue analyse pour TDR physique (fin 2005) analyse hors CERN définition des données à transférer vers chaque Tier en cours d’élaboration total CMS ~60TB suivant contributions au TDR Planning court terme Réutiliser PHEDEX le système de distribution des datasets utilisés lors de DC04 distribution déjà en cours pour INFN, PIC, FNAL CCIN2P3 prévu fin semaine prochaine
Palaiseau Réunion CCIN2P3/LCG 22/07/2004 Infrastructure nécessaire Organisation Site (SE) eneregistré dans CMS BDII Certificats et enregistrement dans CMS VO Installation software CMS User Interface LCG2-UI Client Oracle Agent de transfert à adapter Storage Element Accès direct à HPSS besoin disk pour flexibilité import des données et analyse actuellement accès /sps disk sous le SE Premiers tests du SE HPSS enabled effectués Local catalog Réutilisation du catalogue mySQL de DC04
Palaiseau Réunion CCIN2P3/LCG 22/07/2004 Datasets CMS Un example: hg03_hzz_4e_m140 Total Hits+MCInfo+Digi+Assoc = 12GB pour 10k évts Digitisation info seulement = 6.8GB pour 10k évts DST = 1.5GB pour 10k évts Structure en fichiers fichiers Hits: ~430MB/1000évts fichiers Digi: ~445MB/1000évts fichiers MCInfo: ~45MB/1000évts Fichiers Assoc: ~250MB/1000évts Fichiers DST: ~150MB/1000évts Fichiers META + Events: taille négligeable Stockage Tous fichiers dans HPSS Fichiers META et Events sur disk en permanence Fichiers data sur disk lors de l’utilisation
Palaiseau Réunion CCIN2P3/LCG 22/07/2004 Conclusion: besoins 2004 Très court terme: infrastructure de transfert dans l’immédiat, utilisation SE setup optimisé par la suite A l’automne: analyse des données software CMS accès données pour ~10-30 utilisateurs PRS CMS relecture principalement DST mais aussi Digis/McInfo essentiellement besoin disk sous le SE et cache HPSS