H→gg: QUELQUES ETUDES STATISTIQUES Tatiana Cervero Reunión au LPNHE du 27/05/2008
Introduction Mon travail de stage est dans le cadre de l’analyse statistique pour le processus H->γγ. J’ai commencé par des calculs de la significance statistique à fin de maîtriser le programme Hfitter. J’ai donc utilisé Hfitter pour: - évaluer le Lookelsewhere effect selon la méthode de Iro,Guillaume et Louis. - refaire la méthode «de Yaquan» (ΔNLL) pour calculer la significance.
L’estimateur NS/σ(NS) On génère 10000 toys avec seulement du fond. On fit avec une PDF signal+fond, et masse fixe 120 GeV. On calcule la distribution NS/σ(NS) On compte le nombre de toys qui ont NS/σ(NS) >3 et donc on évalue la probabilité d’une fluctuation du fond >3σ. NS/σ(NS) Probabilité experimental (Preliminary study in Higgs→γγ, Iro et al.) Prob. Exper. (nous) Prob. Theor. 3σ (0.13±0.01)% (0.15±0.04)% 0.13%
Lookelsewhere effect I On veut connaître l’effet sur la significance de chercher la masse de l’Higgs dans tout la fenêtre 110-150 GeV On fait le fit sur les 10000 samples où on a généré que du fond pour des masses fixes entre 110 et 150 GeV On prend le valeur maximum de NS/σ(NS) entre 1, 5, 9, …81 fits a masses différentes. On obtient une distribution NS/σ(NS) plus déplacée vers valeurs positives quand on augmente le nombre de fits. NS/σ(NS)
Lookelsewhere effect II A partir de ces distributions on calcule la probabilité d’avoir une fluctuation >3s en fonction du nombre des fits. ça doit converger (le fits deviennent de plus en plus corrèles): le fait d’ajouter plus fits ne fera pas varier notre significance. Probabilité Pas encore saturé Nombre de fits Pour une seule masse fixe: prob(>3σ)=0.15% → P=99.87% (prob<3σ) → significance = 3.01σ Si on fait le ‘scan’ de masse entre 110-150 GeV, prob(>3σ)=4.26% →p=95.74% → significance = 1.72σ Les résultats sont cohérents avec ceux de Iro Pas encore saturation -> on veut ajouter d’autres points.
LA METHODE DU ΔNLL = logL(B)-logL(S+B) Mass fixed Mass floating a.u. a.u. signal+bruit signal+bruit bruit bruit ΔNLL ΔNLL Médiane de la distribution signal+bruit. Dans la distribution de bruit, probabilité de trouver des valeurs plus grands que cette médiane : 1-p=1.84% → p=98.2%. → significance=2.1σ On calcule la médiane de la distribution signal+bruit. Dans la distribution de bruit, probabilité de trouver des valeurs plus grands que cette médiane : 1-p=0.6% → p=99.4%. → significance=2.5σ Le lookelsewhere effect fait diminuer la significance seulement de ~0.5s!
Problème de la masse floating Distribution de la valeur fitte pour la masse dans le cas « masse floating »: signal+bruit Toujours proche de la valeur initial bruit Dans le cas du bruit, le fit n’est pas sensible au paramètre de masse, qui est un paramètre de la pdf du signal.
A faire Terminer l’étude du Lookelsewhere effect. On fit pour des masses fixées entre 110-150 GeV avec une différence entre elles de 0.1 → on obtiens un maximum de 401 fits et on espère trouver la saturation. Améliorer le méthode pour la masse floating. Un scan du paramètre de masse est probablement nécessaire. Et puis, à voir…