Soutenance stage licence mercredi 16 juillet Identification des électrons non isolés dans Atlas Olivier Ali Stage de Licence École Normale Supérieure de Cachan Laboratoire de Physique Nucléaire et de Hautes Énergies, Paris, IN 2 P 3 -CNRS et Universités Paris 6 et Paris 7 1) Le problème de la masse des particules élémentaires 2) Identification des électrons dans l'expérience Atlas 3) Travail personnel 4) Conclusion
Soutenance stage licence mercredi 16 juillet La masse des particules élémentaires Modèle Standard de la Physique des Particules 12 particules élémentaires 4 interactions La masse des particules élémentaires comment les particules acquièrent une masse ? pourquoi sont elles différentes ? mécanisme de Higgs donne la masse aux particules via l'existence d'une nouvelle particule “le boson de Higgs” Large Hadron Collider (CERN, Genève) collisionneur proton-proton de 27 km de circonférence va fonctionner à partir de 2007 Energie 10 (14 TeV) et collisions 100 (toutes les 25 ns) / collisionneurs actuels espoir de créer des bosons de Higgs !
Soutenance stage licence mercredi 16 juillet L'expérience Atlas au CERN en 2007 Atlas (Air Toroïdal Lhc Apparatus System) 1800 chercheurs et ingénieurs, 30 pays construction/utilisation 20 ans coût : 300 millions d'euros Le détecteur : point d'interaction : collisions p-p trajectographe traces chargées capacité a identifier des électrons calorimètres arrêt des particules, mesure du dépôt d'énergie et identification e,photon,pions 7000 tonnes 44 m de longueur 25 m de hauteur 20 m de diamètre
Soutenance stage licence mercredi 16 juillet Détection des électrons dans Atlas Données simulées du boson de Higgs: H bb b e dans 11% des cas, important d'identifier l'électron Algorithme d'identification développé au LPNHE a chaque trace du détecteur interne associe une gerbe électromagnétique ensemble de neuf variables décrivant la trace et la forme de la gerbe permet de séparer les traces de pions (bruit de fond ) et les traces d'électrons (signal) Fraction d'énergie dans les parties du calorimètre avant arrière Largeur - impulsion - hits de haute energie du à des électrons
Soutenance stage licence mercredi 16 juillet Étude des distributions des variables Mise en route du stage : initiation aux outils graphiques et d'analyse (Fortran) Fonction de densité de probabilité « probabilité » d'être un électron ou un pion conservation des densités de probabilité ? Moyen « corps » des histogrammes d'une part les valeurs singulières d'autre part plus de 24 sous-classes pour chaque trace Résultats obtenus a permis de trouver des “bugs” dans les initialisations des variables dans le programme de reconstruction d'Atlas découpage proposé est basé sur l'association d'une trace et d'un amas et non pas sur un découpage purement technique reste 14 sous-classes pour chaque trace Fraction d'énergie déposée dans la partie avant du calorimetre Électron s Pions
Soutenance stage licence mercredi 16 juillet Quantifier le pouvoir séparateur des variables Pour chacune des variables on calcule sa séparation : avec X pion (X elec ) la ” densité de probabilité” associée à l'hypothèse pion (électron) Résultats obtenus séparations entre 0.6 et 0.04 les variables les plus “discriminantes” sont celles provenant du trajectographe et celles combinant les deux détecteurs l'asymétrie de la gerbe =0.04 et n'apporte rien aux performances cette variable sera abandonnée !!! Sans asymetrie Avec asymetrie
Soutenance stage licence mercredi 16 juillet Signal e Pions XPA Amelioration des outils statistiques L'algorithme construit une fonction discriminante pour chaque trace en faisant le produit sur les 9 variables des densités de probabilité X : X PA = X(électrons)/( X(pions)+ X(électrons)) en coupant sur X PA : efficacité d'identification des électrons et réjection des pions cette fonction tend vers 0 pour les pions et vers 1 pour les électrons X PA ne prend pas en compte les corrélations entre les variables ! implique présence de bruit de fond sous le signal
Soutenance stage licence mercredi 16 juillet Corrélations entre les variables Matrice de corrélation : pour chaque couple de variable on a construit un histogramme 2D on calcule le coefficient de corrélation correspondant Résultats obtenus les corrélations restent faibles (<40%) les variables du trajectographe ne sont pas corrélées avec celles du calorimètre certaines variables montrent une même corrélation pour les électrons et les pions certaines variables montrent de grande corrélations pour les électrons mais pas pour les pions malgré des corrélations globalement faibles peut-on améliorer les performances de l'algorithme en les prenant en compte ? (elec) =30% (pion) =40% (elec) =-20% (pion) = 0% Asymetrie vs largeur de la gerbe E dans partie avant vs E/p
Soutenance stage licence mercredi 16 juillet Méthode de Fisher (1) Principe de la méthode : X PA combine des projections 1D de chaque variable Fisher détermine un axe de projection à N dimensions tel que la séparation des N variables x soit maximale sur cet axe.... calcul des moyennes de chaque variable pour les distributions électrons et pions somme des matrices de covariance pour les électrons et les pions variable de Fisher X FI = f x à la place de X PA calcul des coefficients de Fisher inversion de cette matrice (9 9)
Soutenance stage licence mercredi 16 juillet Méthode de Fisher (2) Résultats obtenus Fisher produit des performances moins bonnes s'il n'y a pas de corrélations c'est compris mais n'était pas attendu au début du stage ! utilisation plus difficile que prévu pour un ensemble de 3 variables corrélées représentant le développement latéral de la gerbe dans la partie avant du calorimètre performances similaires a celles obtenues avec le rapport de vraisemblance permet de remplacer ces 3 variables par une seule combinaison de cette variable unique avec les 6 autresvariables impliquera sans doute d'avoir X PA avec moins de bruit de fond sous le signal Fisher Rapport de vraissemblance
Soutenance stage licence mercredi 16 juillet Conclusion Résultats obtenus Étude des distributions des variables discriminantes a permis de trouver des erreurs dans le programme d'identification la variable de séparation développement d'une méthode permettant de comparer le pouvoir discriminant des variables utilisées par l'algorithme l'une des variables (asymétrie) sera abandonnée corrélations entre les variables première fois que ces coefficients sont calculés utilisation de la méthode de Fisher est moins prometteuse qu'espérée au début du stage mais permet de réduire le nombre de variables Stage en physique des particules dans Atlas découverte des problèmes et des enjeux majeurs de la physique des particules actuels (recherche du boson de Higgs) outils graphiques et d'analyses utilises couramment travail en collaboration au sein d'une équipe de recherche analyse statistique sur des lots de données simulées approche originale pour optimiser un algorithme d'identification d'électrons
Soutenance stage licence mercredi 16 juillet Les variables discriminantes e pi # de coups de rayonnement de transition Différence entre la position de la gerbe et du point d'impact Isolation de la gerbe Fraction de E dans le 1er sampling Largeur de la gerbe Et(calo)/pt Paramètre d'impact transverse Fraction de E dans le 3e sampling
Soutenance stage licence mercredi 16 juillet Fisher : validation de la methode (1) Generation de evenements de signal et bruit de fond gaussiennes Gx(-1,1) et Gy(0.5,2) pour le signal gaussiennes Gx(-5,3) et Gy(2,2.5) pour le bruit de fond correlation X-Y nulles ou 0.9 pour le signal et -0.7 pour le bruit de fond Bruit de fond sous le signal du aux correlations Fisher Vraissemblance
Soutenance stage licence mercredi 16 juillet Fisher : validation de la methode (2) Resultats obtenus sans correlation avec correlation Fisher Fisher Vraissemblance Vraissemblance Le Fisher ne peut etre applique s'il n'y a pas de correlation Le Fisher donne des performances au moins aussi bonnes que le rapport de vraissemblance + remplace 2 variables correlees par une seule