H→ QUELQUES ETUDES STATISTIQUES Tatiana Cervero
Significance avec HFITTER Génération de 500 toy MC avec signal+bruit. Premier fit dans l’hypothèse qu’on a signal+bruit → L(S+B). Deuxième fit dans l’hypothèse qu’on a que de bruit de fond → L(B). Et on calcule la significance; significance 500 toy MC
Plus de catégories → significance plus grande. Dans la même catégorie, si on ajoute des variables → significance plus grande. On refera la plupart des études derniers, avec plus de toys pour avoir une détermination plus précise. LUMINOSITE’ de 10fb -1 : 355 événements de signal, événements de bruit de fond Fit variablesCatégories Higgs mass fixed Significance [σ] Higgs mass fixe Significance [σ] ATLAS CSC NOTE M γγ ± M γγ,pT,cosθ*-2.616±1.239 M γγ η2.681± M γγ,pT,cosθ*η3.597±1.102 M γγ η,Conversions2.635± M γγ,pT,cosθ*η,Conversions3.366±1.129 EFFETS DE VARIABLES DISCRIMINANTES ET DES CATEGORIES
L’estimateur N S /σ(N S ) On génère toys avec seulement du fond. On fit avec une PDF signal+fond, et masse fixe a 120GeV On calcule la distribution N S /σ(N S ) On compte le numéro de toys qui ont N S /σ(N S ) >3 et donc on évalue la probabilité d’une fluctuation du fond> 3σ. N S /σ(N S ) Probabilite’ experimentale (Preliminary study of in Higgs→γγ, Iro et al. ) Prob. Exper. (nous) Prob. Theor. 3σ(0.13±0.01)%(0.15±0.04)%0.13%
On veut connaître l’effet sur la significance de chercher la masse de l’Higgs dans tout la fenêtre GeV On répète le fit sur les samples de fond pour des masses fixes entre 110 et 150 GeV Pour chaque sample on prend le valeur maximum de N S /σ(N S ) entre 1, 5, 9, …81 fits a masses différentes. On obtient une distribution N S /σ(N S ) plus déplacée vers valeurs positives a l’augmenter du nombre de fits. Lookelsewhere effect I A comprendre… N S /σ(N S )
A partir de ces distributions on calcule la probabilité d’avoir une fluctuation > 3 en fonction du numéro des fits. On voit que ça va converger (le fits deviennent de plus en plus corrèles): le fait d’ajouter plus fits ne fera pas varier notre significance. Pour une seule masse fixe: prob(>3σ)=0.15% → P=99.87% (prob<3σ) → significance = 3.01σ Si on fait le ‘scan’ de masse entre GeV, prob (>3σ)=1.9% → p=98.1% → significance = 2.06σ Lookelsewhere effect II Numero de fits Probabilite’
LA METHODE DU ΔNLL = logL(B)-logL(S+B) On calcule la médiane de la distribution signal+bruit. Dans la distribution de bruit, probabilité de trouver des valeurs plus grands que cette médiane : 1-p=0.6% → p=99.4%. à l’aide des tables statistiques→ significance=2.5σ Mass fixed Mass floating Médiane de la distribution signal+bruit. Dans la distribution de bruit, probabilité de trouver des valeurs plus grands que cette médiane : 1-p=1.84% →p=98.2%. à l’aide des tables statistiques→ significance=2.1σ Sample signal+fond Sample fond ΔNLL a.u. Le lookelsewhere effect fait diminuer la significance de ~0.5 ! Sample signal+fond Sample fond
Conclusions On a reproduit les résultats de la note CSC sur la significance avec HFitter, en regardant l’effet des variables discriminantes et de catégories. On a estime la significance avec des différentes méthodes: -ΔNLL distribution; - On a utilise différents méthodes pour évaluer le lookelsewhere effect. TOUTES LES RESULTAS MONTRES SONT EN EFFETS TRES PRELIMINAIRES.