1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv:0907.3791)

Slides:



Advertisements
Présentations similaires
Introduction aux statistiques Intervalles de confiance
Advertisements

LES NOMBRES PREMIERS ET COMPOSÉS
Le moteur
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
La Méthode de Simplexe Standardisation
Classe : …………… Nom : …………………………………… Date : ………………..
Test statistique : principe
Les numéros
Est Ouest Sud 11 1 Nord 1 Individuel 20 joueurs 15 rondes - 30 étuis (arc-en-ciel) Laval Du Breuil Adstock, Québec I-20-15ACBLScore S0515 RondeNE
Est Ouest Sud 11 1 Nord 1 Laval Du Breuil, Adstock, Québec I-17-17ACBLScore S0417 Allez à 1 Est Allez à 4 Sud Allez à 3 Est Allez à 2 Ouest RndNE
Est Ouest Sud 11 1 Nord 1 RondeNE SO
Est Ouest Sud 11 1 Nord 1 Individuel 15 ou 16 joueurs 15 rondes - 30 étuis Laval Du Breuil Adstock, Québec I-16-15ACBLScore S0415 RndNE
Les Prepositions.
Les 3 dimensio ns de la morale et de léthique (activité)
Evénements W,Z au LHC: Mesures et applications N.Besson, M.Boonekamp
Validation de la marée dans le modèle HYCOM du Golfe Normand-BretonLPG – 30/11/ Validation de la marée dans le modèle HYCOM du Golfe Normand-Breton.
1. Les caractéristiques de dispersion. 11. Utilité.
Architecture de réseaux
A Pyramid Approach to Subpixel Registration Based on Intensity
SYMETRIE CENTRALE OU SYMETRIE PAR RAPPORT A UN POINT.
ESIEE Paris © Denis BUREAU I N Initiation à la programmation avec le langage Java.
Analyse de la variance à un facteur
1 Analyse de la variance multivariée Michel Tenenhaus.
1 Théorie des Graphes Cycle Eulérien. 2 Rappels de définitions On dit qu'une chaîne est un chemin passant par toutes les arêtes du graphe. On dit qu'un.
Quelques données phytos Morcille Réunion SAAM 20 Septembre 2010.
CALENDRIER PLAYBOY 2020 Cliquez pour avancer.
Application des algorithmes génétiques
Dynamique dopinions sur réseaux Amblard F.*, Deffuant G.* *C emagref-LISC.
Modélisation d'environnements forestiers
1 SERVICE PUBLIC DE LEMPLOI REGION ILE DE France Tableau de bord Juillet- Août 2007.
Réseaux de neurones.
La Saint-Valentin Par Matt Maxwell.
BERGOT Guillaume HAVEZ Maxime. Présentation Problématique Endogène Exogènes Résultats Bilan Présentation du contexte Problématique Mise en place du modèle.
BERGOT Guillaume HAVEZ Maxime. Présentation Problématique Endogène Exogènes Résultats Bilan Présentation du contexte Problématique Mise en place du modèle.
Journées de Rencontre Jeune Chercheurs
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Notre calendrier français MARS 2014
Annexe 1 VISITE SUR
3ème partie: les filtres
C'est pour bientôt.....
Veuillez trouver ci-joint
Les Nombres! de 0 à 20.
Échantillonnage (STT-2000) Section 2 Tirage de Bernoulli (plan BE). Version: 4 septembre 2003.
ASI 3 Méthodes numériques pour l’ingénieur
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Modèle pédagogique d’un système d’apprentissage (SA)
* Source : Étude sur la consommation de la Commission européenne, indicateur de GfK Anticipations.
10 paires -. 9 séries de 3 étuis ( n° 1 à 27 ) 9 positions à jouer 5 tables Réalisé par M..Chardon.
CALENDRIER-PLAYBOY 2020.
1. Présentation générale du système
Seconde partie - cours n°3 Théorie des tests
9 paires séries de 3 étuis ( n° 1 à 27 )
Projet de stage d’année IIR4 sous le thème:
Quel est l’intérêt d’utiliser le diagramme de Gantt dans la démarche de projet A partir d’un exemple concret, nous allons pouvoir exploiter plusieurs parties.
Chimiometrie (Chemometrics)
Les Chiffres Prêts?
Médiathèque de Chauffailles du 3 au 28 mars 2009.
Relevez le numéro de votre logo préféré et adressez-le à : En cas d’hésitation, vous pouvez choisir jusqu’à 3 logos. Seront pris.
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Université de Sherbrooke
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
Transcription de la présentation:

1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )

2 Plan de la présentation Introduction: effets du détecteur, convolution et déconvolution Problèmes en pratique: soustraction du background, simulation imparfaite de la matrice de transfert … Ingrédients pour la procédure d’unfolding Modèle pour tester la méthode Méthode itérative pour l’unfolding; choix des paramètres Résultats Modèle simple pour tester la méthode Test où on connaît les données « générées » (avant convolution) Exemple avec des données expérimentales Discussion - Conclusion

3 Introduction: effets du détecteur, convolution et déconvolution Convolution: Exemple matrice de transfert (MC) A ij i j Convolution: Déconvolution? Doit faire appel à une méthode de régularisation.

4 Introduction: effets du détecteur, convolution et déconvolution Références:

5 Problèmes pratiques: fluctuations dues à la soustraction du background Un unfolding “standard” pourrait introduire un biais dans des régions précises du spectre Il faut tenir compte des erreurs des points! Folding Unfolding

6 Problèmes pratiques: simulation imparfaite de la matrice de transfert Simulation du détecteur (convolution): erreur systématique Les structures nouvelles dans les données: doivent aussi être corrigées pour les effets du détecteur peuvent affecter la normalisation du MC Normalisation standard:

7 Problèmes pratiques: simulation imparfaite de la matrice de transfert Les structures nouvelles dans les données: peuvent affecter la normalisation du MC Nouvelle structure (pas dans le MC) MC - normalisation standard MC - normalisation souhaitée Normalisation souhaitée:

8 Ingrédients pour la procédure d’unfolding: une fonction de régularisation Utilisée pour comparer (bin par bin) les données expérimentales et la simulation MC Permet d’effectuer un traitement différent des fluctuations et des vraies structures nouvelles dans les données Dépend de la déviation données – MC, de leurs erreurs et d’un paramètre λ (facteur d’échelle) Rôle de régularisation dynamique des fluctuations D’autres fonctions ont été étudiées

9 Modèle pour tester la méthode Modèle matrice de transfert: Pour la convolution Matrice fluctuée utilisée pour la déconvolution Spectre “connu” (~MC reconstruit) Spectre “connu” au niveau généré (~MC généré) Effet de résolution Transfert systématique des événements

10 Modèle pour tester la méthode Spectre “connu” au niveau généré (~MC généré) Spectre “connu” (~MC reconstruit) Spectre “connu” au niveau généré (~MC généré) + Biais Données Biais Données - Spectre “connu” (~MC reconstruit) Données- Spectre “connu” au niveau généré (~MC généré)

11 Ingrédients pour la procédure d’unfolding: la procédure de normalisation du MC Première estimation du nombre d’événements dans les données, simulés par le MC: Une meilleure estimation: La même méthode au niveau spectre corrigé/MC généré # ev. données, dans le bin k # ev. Fluctuation bruit de fond, dans le bin k ITERATIONS

12 Ingrédients pour la procédure d’unfolding: la procédure de normalisation du MC 50 itérations (au plus) Amélioration relative de la normalisation: (NE données – NE DsMC )/NE données Le nombre d’itérations joue un rôle seulement dans la région instable La taille de la région instable dépend de l’amplitude des fluctuations du bruit de fond λNλN Choix λ N Etude à faire directement sur les données! StableInstable

13 Ingrédients pour la procédure d’unfolding: un pas de la méthode d’unfolding A ij i j Convolution (folding): Matrice de déconvolution (unfolding): Par construction: Déconvolution (unfolding): comparer données et spectre MC reconstruit Équation générale Seulement approximative pour les spectres autres que MC Fluctuation bruit de fond MC généréDifférence significative (unfoldée) Différence non significative (figée)

14 Ingrédients pour la procédure d’unfolding: 1 er pas de la méthode d’unfolding Choix: (toute différence entre spectres paraît non significative) Spectre “connu” (~MC reconstruit) Spectre “connu” au niveau généré (~MC généré) + Biais Données Biais Données - Spectre “connu” (~MC reconstruit) Données- Spectre “connu” au niveau généré (~MC généré) Spectre corrigé Spectre corrigé - Spectre “connu” au niveau généré (~MC généré)

15 Ingrédients pour la procédure d’unfolding: Comparer le spectre corrigé et MC généré: Estimation des fluctuations du background: structures non significatives, avec des erreurs grandes Améliorer la matrice de transfert: utiliser les structures significatives La matrice de convolution (folding), décrivant le détecteur reste la même. Seulement le spectre MC généré est amélioré. Procédure de normalisation

16 La méthode itérative d’unfolding Un 1 er unfolding avec: une valeur grande pour λ L (les fluctuations dues à la soustraction du bruit de fond doivent rester inchangées) 1) Estimation des fluctuations du bruit de fond (λ S ) 2) Amélioration de la matrice de transfert et donc de la matrice de probabilité d’unfolding (λ M ) 3) Unfolding amélioré (λ U ) Quand arrêter les itérations? Comparaison du MC reconstruit avec les données Étudier le nombre d’itérations nécessaires, avec des toys Choix des paramètres λ S, λ U et λ M avec un modèle pour les données. En général on peut renoncer aux paramètres λ U et λ M, en mettant leur valeur à zéro (unfolding&modification maximale).

17 Résultat des itérations: Nouvelles structures Données - Spectre “connu” (~MC initial reconstruit) Données – MC final reconstruit Estimation des fluctuations

18 Résultat des itérations: Spectre corrigé Spectre “connu” (~MC reconstruit) Spectre “connu” au niveau généré (~MC initial généré) + Biais Données Spectre corrigé - Spectre “connu” au niveau généré (~MC initial généré) Biais Données - Spectre “connu” (~MC initial reconstruit) Données- Spectre “connu” au niveau généré (~MC initial généré)

19 Exemple précédent simplifié: Effets de la matrice de transfert réduits Biais plus lisse, sans structures Pas de « creux » dans le spectre Pas de fluctuations supplémentaires importantes (bruit de fond faible) Statistique réduite par un facteur 20 Exemple simple pour l’utilisation de la méthode Données - MC initial reconstruit Enveloppe d’erreurs des données Données - MC final reconstruit (après une itération)

20 Exemple simple pour l’utilisation de la méthode Méthode d’unfolding simplifiée: Normalisation standard pour le MC Pas d’estimation des fluctuations restantes 1 er unfolding avec λ = λ L ( = 1.5, justifié par une étude (voir suite)) Une itération avec λ U = λ M =0 Effet du 2 ème unfolding Enveloppe d’erreurs des données Effet du 1 er unfolding

21 Utiliser (données – MC reconstruit) comme biais par rapport au MC généré, pour construire des données « générées » (toys) Convolution avec A ij (Ne pas) Fluctuer les données convoluées Déconvolution avec la matrice A’ ij (A ij fluctuée) Comparer le résultat avec les données « générées » Test où on connaît les données générées (avant convolution) Données - Spectre “connu” (~MC initial reconstruit) Données- MC final reconstruit Enveloppe d’erreurs des données Pas de fluctuation des données: tester des effets systématiques Données - Spectre “connu” (~MC initial reconstruit) Données- MC final reconstruit Enveloppe d’erreurs des données Avec des fluctuations statistiques des données: tester la stabilité

22 Mesure du biais après unfolding (sans fluctuations statistiques des données convoluées) Un test où on connaît les données « générées » (avant convolution) Résultat - données générées (1 er pas) Résultat - données générées (2ème pas) Enveloppe d’erreurs des données Mesure du biais après unfolding (sans fluctuations statistiques des données convoluées) dans des bins larges Le 1 er unfolding donne un bon résultat λ L = 1.5 : biais très faible et corrélations réduites par rapport au cas λ L = 0

23 Erreurs diagonales après le 1 er unfolding: plus grandes dans le cas non trivial (moins de corrélations entre les bins) Un test où on connaît les données « générées » (avant convolution) Erreurs 1 er unfolding λ L = 0 Erreurs 1 er unfolding λ L = 1.5 Erreurs des données

24 Exemple avec des données expérimentales

25 Discussion Étudié mais pas discuté: NBinsDonnées  NBinsRésultat (rebinning dans la procédure d’unfolding ou après) Effet du rebinning sur les corrélations Traitement des bins avec un nombre négatif d’événements (données) Bins vides dans le MC Prévenir l’existence des bins négatifs dans le MC généré

26 Conclusion Nouvelle méthode générale pour l’unfolding des données binnées On peut traiter des problèmes qui n’avaient pas été considéré auparavant Procédure de régularisation dynamique, bin par bin à chaque étape, avec moins de biais par rapport aux méthodes proposées auparavant Cette méthode permet de garder un certain contrôle des corrélations des bins du spectre déconvolué

27 Backup

28 Ingrédients pour la procédure d’unfolding: une fonction de régularisation Utilisée pour comparer (bin par bin) les données expérimentales et la simulation MC Permet d’effectuer un traitement différent des fluctuations et des vraies structures dans les données Rôle de régularisation dynamique des fluctuations On utilise: f 3

29 Ingrédients pour la procédure d’unfolding: la procédure de normalisation du MC 30 itérations (au plus) 50 itérations (au plus) 200 itérations (au plus) Amélioration relative de la normalisation: (NE données - NE DsMC )/NE données λNλN λNλN λNλN Choix λ N Bruit de fond X 0.5 Bruit de fond X 2Bruit de fond X 4 Etude à faire directement sur les données!

30 Choix des paramètres λ S, λ U et λ M avec un modèle pour les données χ 2 généré optimum χ 2 reconstruit N pas optimum λ S =3 λ S =5 λ S =7 Mauvais χ 2 généré λ U et λ M peuvent être mis à zéro Plus difficiles à distinguer, mais peuvent être testées sur les données Une comparaison locale des spectres est toujours plus précise!