Electrons de bas pT et dans les jets Frédéric Derue Laboratoire de Physique Nucléaire et de Hautes Energies de Paris, IN2P3-CNRS; Université Pierre et Marie Curie-Paris6; Université Denis Diderot-Paris7 Travail effectué principalement par F. Derue, A. Kaczmarska (LPNHE) J. Cochran (Iowa SU) Une aide toujours importante de D. Zerwas (LAL) motivations algorithme performances étiquetage des jets de b (voir présentation de Henri) reconstruction du J/y utilisation avec les données CTB comparaison softe/egamma une remarque finale conclusion
motivations électrons dans les jets désintégrations semi-leptoniques de hadrons B (b→e), en cascades (b→c→e), en t avec cascade b→t→e étiquetage des jets de b avec des électrons mous électrons de bas pT : J/e+e- physique du B intercalibration in-situ à basse énergie du calorimètre électromagnétique comparaison egamma / softe gagner en efficacité là où egamma ne l’est pas (vers quel pT, le crack ?) minimiser les doublons
algorithme L’algorithme utilise une trace comme graine de départ. Cette trace est extrapolée jusque le 2nd compartiment du LArEM. Autour de ce point un cluster 5*5 est construit. NB: seules les traces de bonne qualité (coupures standard) sont utilisées. Les variables décrivant la forme de la gerbe sont calculées par rapport à la cellule la plus chaude trouvée dans une petite fenêtre (~3 cellules en eta) autour de l’extrapolation. Dans le 1er compartiment on se réfère à la position extrapolée …. les variables de forme de gerbe ont le même sens que pour egamma mais la valeur peut être un peu différente les variables discriminantes utilisées sont différentes de egamma Entre DC1 et Rome l’algorithme n’a pas changé (~première implémentation) Entre Rome et CSC la partie identification est identique, la partie de clusterisation a été modifiée/simplifiée. L’algorithme était optimisé pour l’étiquetage des jets de b. Le travail de ces derniers mois vise à le rendre plus facilement utilisable comme source de nouveaux candidats électrons à basse énergie et plus facilement comparable à l’algorithme standard.
variables discriminantes pions paramètre d’impact transverse fraction de TR hits electrons différence en entre la gerbe et le point d’impact E/p E3/E E1/E largeur dans le 1ercompar-timent ~E(3*7)/E(7*7) On notera que le calorimètre hadronique n’est pas utilisé, car il a une trop grosse granularité Des variables a priori importantes de l’identification standard ne sont pas là (structure fine de la gerbe dans les strips etc…) : peut être important .. mais pas urgent
performances J/ WH (Hbb) ttH (Hbb) résultats DC1 issus de ATL-PHYS-PUB-2006-001 et ATL-PHYS-PUB-2006-004 e-id (J/)= 80% R (bbX)= 1050 ± 50 Pion rejection J/ permet d'obtenir un rapport S/B ~2 après sélection dans une fenetre de masse et fit sur un vertex des paires e-id (WH120)= 80% R (WH)= 245 ± 17 WH (Hbb) ttH (Hbb) préalable à l'utilisation des soft-électrons pour faire de l'étiquetage des jets de b e-id (ttH)= 80% R (ttH)= 208 ± 11 Efficacité d'identification des électrons Les performances obtenues avec les données Rome sur le WH sont similaires et sont obtenues aussi bien au niveau CBNT que AOD résultats DC1 issus de ATL-PHYS-PUB-2006-001 et ATL-PHYS-PUB-2006-004
performances suivant le type de jet résultats DC1 issus de ATL-PHYS-PUB-2006-001 e-id (WH120)= 80% R (u-jets)= 561 ± 35 WH (Huu) Pion rejection WH (Hcc) e-id (WH120)= 80% R (c-jets)= 508± 54 La différence de performances est due au paramètre d’impact transverse WH (Hbb) e-id (WH120)= 80% R (b-jets)= 245±17 Efficacité d'identification des électrons Le lot de données à partir duquel les PDFs sont créés va influencer les performances Il est difficile de trouver des PDFs universelles (pT,h, densité du jet) résultats DC1 issus de ATL-PHYS-PUB-2006-001 et ATL-PHYS-PUB-2006-004
performances suivant la luminosité e-id (WH120)= 80% R (pas de pile-up)= 561 ± 35 WH (Huu) Pion rejection La différence de performances est due au TRT WH (Huu) e-id (WH120)= 80% R (basse lumi)= 420± 21 e-id (WH120)= 80% R (high lumi)= 133±5 WH (Huu) basse lumi haute lumi Efficacité d'identification des électrons La variable issue du TRT, la plus discriminante de l’algorithme, est aussi la plus sensible au pile-up résultats DC1 issus de ATL-PHYS-PUB-2006-001 et ATL-PHYS-PUB-2006-004
performances suivant la méthode statistique On compare ici les performances obtenues avec un maximum de vraissemblance et un réseau de neurones e-id (WH120)= 80% R (NN)= 1245 ± 114 Pion rejection WH (Huu) le lot de bruit de fond utilisé pour entrainer le NN est dominé par des H→uu. le NN est donc optimisé pour ce lot …. e-id (WH120)= 80% R (likelihood)= 561± 35 pour le lot H→cc le gain est d’environ 70% pour le lot H→bb le gain est d’environ 10% sauf à haute lumi (~40%) WH (Huu) Le NN est intéressant mais à manier avec précautions au début car il est très dépendant du lot de données Efficacité d'identification des électrons Une identification basée sur des coupures va être mise en œuvre. Plus simple d’utili-sation la réjection obtenue est nettement moins bonne car les variables sont corrélées résultats DC1 issus de ATL-PHYS-PUB-2006-001 et ATL-PHYS-PUB-2006-004
performances DC1 vs Rome On compare ici les résultats DC1 (rec=7.8.0) et Rome (rec=11.0.3) WH (Huu) DC1 e-id (WH120uu)= 80% R (DC1)= 561 ± 35 Rp(Rome) = 654 ± 68 Pion rejection WH (Huu) Rome e-id (WH120bb)= 80% R (DC1)= 245 ± 17 Rp (Rome) = 223 ± 11 WH (Hbb) DC1 WH (Hbb) Rome de petits changements sur la création des PDFs expliquent les différences ex: dans Rome il n’y a plus de candidats avec E/p<0.7 Efficacité d'identification des électrons Les performances peuvent être améliorées en optimisant les PDFs par intervalle de h (il faut pas mal de stat) et en pT (il faut beaucoup de stat !) résultats DC1 issus de ATL-PHYS-PUB-2006-001 et ATL-PHYS-PUB-2006-004
application aux J/y (détecteur interne) La reconstruction des J/y est basée sur l’identification des soft-électrons, une paire de candidats (paramètres ajustés à un même vertex ….). Dans DC1 les études ont été faites dans des kumacs privées. Pour Rome une classe d’analyse AOD Jpsiee.cxx vient d’être incorporée à BphysExamples dans 11.2.0 (“bonne” version attendue pour 12.0.0) DC1 Rome les corrections de Bremsstrahlung ne sont pas prises en compte <m0> (MeV) LMeVR (MeV) DC1 -31.6±1.5 129.4±1.9 42.0±1.3 Rome -46.4±4.9 135.1±7.8 37.0±2.8 Les résultats “ID” sont en accord avec des analyses du groupe de physique du B, mais utilise une vraie identification des électrons. Dans les études DC1 il y avait 10 fois plus de stat + du bruit de fond
application aux J/y (avec le LArEM) Pour reconstruire la masse invariante on utilise le détecteur interne pour la direction en eta et le LArEM pour l’énergie. DC1 Rome <m0> (MeV) LMeVR (MeV) DC1 28.0±4.7 255.6±5.1 218.0±4.1 Rome 88.6±14.2 243.4±12.0 212.0±16.2 Il y a un décalage dans la position reconstruite du pic, déjà présent dans DC1 et qui s’est aggravé dans les résultats “Rome”.
reconstruction de l'énergie Dans les études DC1 les corrections sur l’énergie n’étaient pas appliquées dans ATHENA. Certaines ont été ajoutées dans les kumacs privées. Pour les études Rome, depuis les versions 11.0.X les corrections “longitudinal weights + out of cone” sont appliquées dans ATHENA. Mais elles ont été optimisées à plus haute énergie (~50 GeV) électrons E=25 GeV électrons de J/ <Erec/Etrue> ~ 0.98 <Erec/Etrue> ~ 1.05 Pour les études CSC (y compris la calibration) il devient urgent de travailler – vraiment – sur les corrections d’énergie … à basse énergie
application au test en faisceau combiné 2004 L’algorithme a aussi été testé avec les données du test en faisceau combiné 2004 Les résultats montrés ici concernent des données électrons de 9 GeV L’algorithme (via l’utilisation du LArEM) permet une nette amélio- ration des performances par rapport à l’utilisation seule du TRT Les comparaisons data/MC ont été faites par d’autres groupes avec des Simulations soit du seul détecteur Interne, soit du seul LArEM Les résultats du groupe CERN qui regarde les performances du TRT diffèrent de nos résultats d’environ 30% sur l’eff (pion) …. Utilisation seule du TRT Efficacité d'identification des pions Algorithme « soft électrons » Efficacité d'identification des électrons Les premières analyses ont montré que la création du cluster – suite à l’extrapolation de la trace – était trop sensible au désalignement calo-ID. La partie clusterisation de l’algorithme a été simplifiée pour plus de robustesse.
comparaison egamma/softe : application au tt Utilisation d’événements top en dileptons. Environ 3500 événements ont été reconstruits avec la version 11.0.3 ce qui donne ~3000 électrons issus d’un W La normalisation est le nombre de vrais électrons. NB: d’habitude pour egamma la normalisation est le nombre de vrais électrons donnant une trace, pour softe c’est le nombre d’électrons donnant une trace de bonne qualité plus un nombre suffisants de coups dans le TRT spectre en pT des électrons pT (MeV) e (id-électrons) e (id-électrons) softe (1948 candidats) egamma (1875 candidats) pT (MeV) pT (MeV) La comparaison n’est pas si simple que ca… Mis à part le gain pour pT<20 GeV (pour peu d’électrons), c’est surtout la comparaison à grand pT dont il faudrait s’assurer L’efficacité n’est pas vraiment plate ni en h ni en pT … à investiguer …
comparaison egamma/softe : application au tt Utilisation d’événements top en dileptons. Environ 3500 événements ont été reconstruits avec la version 11.0.3 ce qui donne ~1200 électrons issus d’une désintégration semileptonique de b, donc des électrons dans des jets spectre en pT des électrons pT (MeV) egamma (44 candidats) e (id-électrons) e (id-électrons) softe (462 candidats) pT (MeV) pT (MeV) Là aussi on s’assure simplement que egamma n’est pas fait pour trouver les électrons dans des jets
comparaison egamma/softe : application au J/y Utilisation de ~18000 événements J/y. spectre en pT des électrons pT (MeV) egamma (614 candidats) softe (15741 candidats) e (id-électrons) e (id-électrons) pT (MeV) pT (MeV) On n’apprend rien dont on ne se doutait déjà : softe fonctionne pour le J/y Mais ce lot n’est pas approprié pour une comparaison des deux algorithmes
difficultés d’utilisation En dehors des auteurs (F.D, Anna Kaczmarska) il y a peu/pas de (bons) résultats montrés avec l’algorithme de reconstruction des électrons de bas pT. Dans DC1 : premières implémentations, seule version vraiment bonne a été la 7.8.0 Dans Rome : … on vient de finaliser la validation sur la version 11.0.3/41 Les données “Rome” ont été simulées avec 9.0.4 impliquant un problème dans le TRT rendant la variable non discriminante (donc plus grand taux de faux candidats) Seules des données WH et J/y ont été resimulées pour des études de performances Les données Rome ont été reconstruites (10.0.1) avec ipatRec pour qui ~10% des électrons n’ont pas de hits de haut seuil dans le TRT…. Les études de performances sont faites avec xKalman Dans Rome (rec=10.0.1), la lecture des PDFs des softe n’est pas bonne. Les variables étant correctes on peut tout de même faire l’identification soi-même. Si vous avez des difficultés avec l’algorithme ne faites pas comme certains ! Envoyez moi un mail plutôt que de vous plaindre dans des meetings où je ne vais pas. Essayez de regarder les variables discriminantes et d’avoir des chiffres de performances (efficacité, réjection). Dites moi où sont les CBNT (plus rapide que les AOD…), je regarderai par moi-même
Conclusion Technique depuis DC1 beaucoup d’efforts pour maintenir/tester le package à chaque release, et essayer de comprendre les changements de performance…. peu de changements en ce qui concerne l’identification (les PDFs étaient des fonctions “smoothées” issues d’histos, maintenant on garde juste les histos) la partie clusterisation a été simplifiée, est plus robuste (cf. études en test en faisceau), et permet l’appel des corrections d’énergie standard les performances sont testées au niveau CBNT/ESD et AOD les premières études de comparaison egamma/softe peuvent débuter mais sur quel lot de données ? (H4e ?) Entre des versions de reconstruction stables DC1 (7.8.0) et Rome (11.0.X) les performances ont pas changé. La qualité de la reconstruction de l’énergie est toujours très médiocre. Physique peu / pas de vraies études autre que les performances application à la physique du B et à la calibration (sujet non couvert) avec les “premières” données l’algorithme pourrait être utilisé pour la recherche du J/y et pour le cross-check du b-tagging …