1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )
2 Plan de la présentation Introduction: effets du détecteur, convolution et déconvolution Problèmes en pratique: soustraction du background, simulation imparfaite de la matrice de transfert … Ingrédients pour la procédure d’unfolding Modèle pour tester la méthode Méthode itérative pour l’unfolding; choix des paramètres Résultats Modèle simple pour tester la méthode Test où on connaît les données « générées » (avant convolution) Exemple avec des données expérimentales Discussion - Conclusion
3 Introduction: effets du détecteur, convolution et déconvolution Convolution: Exemple matrice de transfert (MC) A ij i j Convolution: Déconvolution? Doit faire appel à une méthode de régularisation.
4 Introduction: effets du détecteur, convolution et déconvolution Références:
5 Problèmes pratiques: fluctuations dues à la soustraction du background Un unfolding “standard” pourrait introduire un biais dans des régions précises du spectre Il faut tenir compte des erreurs des points! Folding Unfolding
6 Problèmes pratiques: simulation imparfaite de la matrice de transfert Simulation du détecteur (convolution): erreur systématique Les structures nouvelles dans les données: doivent aussi être corrigées pour les effets du détecteur peuvent affecter la normalisation du MC Normalisation standard:
7 Problèmes pratiques: simulation imparfaite de la matrice de transfert Les structures nouvelles dans les données: peuvent affecter la normalisation du MC Nouvelle structure (pas dans le MC) MC - normalisation standard MC - normalisation souhaitée Normalisation souhaitée:
8 Ingrédients pour la procédure d’unfolding: une fonction de régularisation Utilisée pour comparer (bin par bin) les données expérimentales et la simulation MC Permet d’effectuer un traitement différent des fluctuations et des vraies structures nouvelles dans les données Dépend de la déviation données – MC, de leurs erreurs et d’un paramètre λ (facteur d’échelle) Rôle de régularisation dynamique des fluctuations D’autres fonctions ont été étudiées
9 Modèle pour tester la méthode Modèle matrice de transfert: Pour la convolution Matrice fluctuée utilisée pour la déconvolution Spectre “connu” (~MC reconstruit) Spectre “connu” au niveau généré (~MC généré) Effet de résolution Transfert systématique des événements
10 Modèle pour tester la méthode Spectre “connu” au niveau généré (~MC généré) Spectre “connu” (~MC reconstruit) Spectre “connu” au niveau généré (~MC généré) + Biais Données Biais Données - Spectre “connu” (~MC reconstruit) Données- Spectre “connu” au niveau généré (~MC généré)
11 Ingrédients pour la procédure d’unfolding: la procédure de normalisation du MC Première estimation du nombre d’événements dans les données, simulés par le MC: Une meilleure estimation: La même méthode au niveau spectre corrigé/MC généré # ev. données, dans le bin k # ev. Fluctuation bruit de fond, dans le bin k ITERATIONS
12 Ingrédients pour la procédure d’unfolding: la procédure de normalisation du MC 50 itérations (au plus) Amélioration relative de la normalisation: (NE données – NE DsMC )/NE données Le nombre d’itérations joue un rôle seulement dans la région instable La taille de la région instable dépend de l’amplitude des fluctuations du bruit de fond λNλN Choix λ N Etude à faire directement sur les données! StableInstable
13 Ingrédients pour la procédure d’unfolding: un pas de la méthode d’unfolding A ij i j Convolution (folding): Matrice de déconvolution (unfolding): Par construction: Déconvolution (unfolding): comparer données et spectre MC reconstruit Équation générale Seulement approximative pour les spectres autres que MC Fluctuation bruit de fond MC généréDifférence significative (unfoldée) Différence non significative (figée)
14 Ingrédients pour la procédure d’unfolding: 1 er pas de la méthode d’unfolding Choix: (toute différence entre spectres paraît non significative) Spectre “connu” (~MC reconstruit) Spectre “connu” au niveau généré (~MC généré) + Biais Données Biais Données - Spectre “connu” (~MC reconstruit) Données- Spectre “connu” au niveau généré (~MC généré) Spectre corrigé Spectre corrigé - Spectre “connu” au niveau généré (~MC généré)
15 Ingrédients pour la procédure d’unfolding: Comparer le spectre corrigé et MC généré: Estimation des fluctuations du background: structures non significatives, avec des erreurs grandes Améliorer la matrice de transfert: utiliser les structures significatives La matrice de convolution (folding), décrivant le détecteur reste la même. Seulement le spectre MC généré est amélioré. Procédure de normalisation
16 La méthode itérative d’unfolding Un 1 er unfolding avec: une valeur grande pour λ L (les fluctuations dues à la soustraction du bruit de fond doivent rester inchangées) 1) Estimation des fluctuations du bruit de fond (λ S ) 2) Amélioration de la matrice de transfert et donc de la matrice de probabilité d’unfolding (λ M ) 3) Unfolding amélioré (λ U ) Quand arrêter les itérations? Comparaison du MC reconstruit avec les données Étudier le nombre d’itérations nécessaires, avec des toys Choix des paramètres λ S, λ U et λ M avec un modèle pour les données. En général on peut renoncer aux paramètres λ U et λ M, en mettant leur valeur à zéro (unfolding&modification maximale).
17 Résultat des itérations: Nouvelles structures Données - Spectre “connu” (~MC initial reconstruit) Données – MC final reconstruit Estimation des fluctuations
18 Résultat des itérations: Spectre corrigé Spectre “connu” (~MC reconstruit) Spectre “connu” au niveau généré (~MC initial généré) + Biais Données Spectre corrigé - Spectre “connu” au niveau généré (~MC initial généré) Biais Données - Spectre “connu” (~MC initial reconstruit) Données- Spectre “connu” au niveau généré (~MC initial généré)
19 Exemple précédent simplifié: Effets de la matrice de transfert réduits Biais plus lisse, sans structures Pas de « creux » dans le spectre Pas de fluctuations supplémentaires importantes (bruit de fond faible) Statistique réduite par un facteur 20 Exemple simple pour l’utilisation de la méthode Données - MC initial reconstruit Enveloppe d’erreurs des données Données - MC final reconstruit (après une itération)
20 Exemple simple pour l’utilisation de la méthode Méthode d’unfolding simplifiée: Normalisation standard pour le MC Pas d’estimation des fluctuations restantes 1 er unfolding avec λ = λ L ( = 1.5, justifié par une étude (voir suite)) Une itération avec λ U = λ M =0 Effet du 2 ème unfolding Enveloppe d’erreurs des données Effet du 1 er unfolding
21 Utiliser (données – MC reconstruit) comme biais par rapport au MC généré, pour construire des données « générées » (toys) Convolution avec A ij (Ne pas) Fluctuer les données convoluées Déconvolution avec la matrice A’ ij (A ij fluctuée) Comparer le résultat avec les données « générées » Test où on connaît les données générées (avant convolution) Données - Spectre “connu” (~MC initial reconstruit) Données- MC final reconstruit Enveloppe d’erreurs des données Pas de fluctuation des données: tester des effets systématiques Données - Spectre “connu” (~MC initial reconstruit) Données- MC final reconstruit Enveloppe d’erreurs des données Avec des fluctuations statistiques des données: tester la stabilité
22 Mesure du biais après unfolding (sans fluctuations statistiques des données convoluées) Un test où on connaît les données « générées » (avant convolution) Résultat - données générées (1 er pas) Résultat - données générées (2ème pas) Enveloppe d’erreurs des données Mesure du biais après unfolding (sans fluctuations statistiques des données convoluées) dans des bins larges Le 1 er unfolding donne un bon résultat λ L = 1.5 : biais très faible et corrélations réduites par rapport au cas λ L = 0
23 Erreurs diagonales après le 1 er unfolding: plus grandes dans le cas non trivial (moins de corrélations entre les bins) Un test où on connaît les données « générées » (avant convolution) Erreurs 1 er unfolding λ L = 0 Erreurs 1 er unfolding λ L = 1.5 Erreurs des données
24 Exemple avec des données expérimentales
25 Discussion Étudié mais pas discuté: NBinsDonnées NBinsRésultat (rebinning dans la procédure d’unfolding ou après) Effet du rebinning sur les corrélations Traitement des bins avec un nombre négatif d’événements (données) Bins vides dans le MC Prévenir l’existence des bins négatifs dans le MC généré
26 Conclusion Nouvelle méthode générale pour l’unfolding des données binnées On peut traiter des problèmes qui n’avaient pas été considéré auparavant Procédure de régularisation dynamique, bin par bin à chaque étape, avec moins de biais par rapport aux méthodes proposées auparavant Cette méthode permet de garder un certain contrôle des corrélations des bins du spectre déconvolué
27 Backup
28 Ingrédients pour la procédure d’unfolding: une fonction de régularisation Utilisée pour comparer (bin par bin) les données expérimentales et la simulation MC Permet d’effectuer un traitement différent des fluctuations et des vraies structures dans les données Rôle de régularisation dynamique des fluctuations On utilise: f 3
29 Ingrédients pour la procédure d’unfolding: la procédure de normalisation du MC 30 itérations (au plus) 50 itérations (au plus) 200 itérations (au plus) Amélioration relative de la normalisation: (NE données - NE DsMC )/NE données λNλN λNλN λNλN Choix λ N Bruit de fond X 0.5 Bruit de fond X 2Bruit de fond X 4 Etude à faire directement sur les données!
30 Choix des paramètres λ S, λ U et λ M avec un modèle pour les données χ 2 généré optimum χ 2 reconstruit N pas optimum λ S =3 λ S =5 λ S =7 Mauvais χ 2 généré λ U et λ M peuvent être mis à zéro Plus difficiles à distinguer, mais peuvent être testées sur les données Une comparaison locale des spectres est toujours plus précise!