Calculs sur réseau en Chromodynamique Quantique Jaume Carbonell Groupe de travail “Infrastructure du calcul intensif”, CC-IN2P3, 15 sep Un paradigme de calcul intensif haute performance
Menu -La QCD et sa résolution -Articulation MEGA/MESO/MINI centres de calcul -Et tout cela pourquoi?
Dans la longue « saga des poupées gigognes » que l’on nous raconte depuis des décennies à propos de la structure de la matière Molécules formées d’atomes, Atomes formés d’un noyau et des e, Noyaux formés de protons et neutrons, Protons et neutrons formés de quarks… la Nature a fini par nous jouer un sacré tour de passe-passe Jusqu’à maintenant la masse des objets composés était – à de petites perturbations près - la somme des masses de leurs composants atome d’HM H =m p +m e + o( ) noyau de deuteriumM d =m p +m n + o(0.001) Or il se trouve, e.g., que le proton est « formé » de 3 quarks, mais… - la masse des trois quarks est de 10 MeV …alors que le proton en pèse 940 MeV - les « composantes » du proton n’existent pas isolément …un peu comme les pôles qui « forment » un dipôle magnétique Ce sont les briques qui font la maison ou c’est la maison qui fait les briques ? Les notions mêmes de « masse » et « composant » en prennent un coup ! La théorie qui décrit ce monde étrange est la Chromodynamique Quantique (QCD) ou théorie des quarks et des gluons (Gross, Politzer, Wilczek prix Nobel 2004)
Les ingrédients de la QCD sont donc les « quarks »: 6 types, chacun de 3 « couleurs », chacune ayant 4 composantes les « gluons »: 8 types, chacun ayant 4 composantes Mathématiquement ces objets physiques sont représentés par des « champs », i.e. des opérateurs définis en chaque point de l’espace-temps Leur « dynamique » est régie par la « Théorie Quantique des champs » (QFT) qui permet – en principe – de connaître leur valeur en chaque point x. Or en pratique ceci est impossible! On n’aborde donc pas la QFT par les équations du mouvement, mais par une formulation due a Feynman, qui se ramène à des calculs de valeurs moyennes des “champs”. e.g. “propagateur” d’un quark (quantité la plus utile !) amplitude pour qu’une particule créée en y, s’annihile en x
Une propagation qui n’est pas pas très calme Det(M) tient compte des « boucles de quark-antiquark » générées à partir de gluons Un calcul qui inhibe ce processus est dit « quenched’
L T V= L 3 x T d U µ (Go) S(x,0) (Go) Sur chaque site: 4 matrices U µ de SU(3) (gluons) 3 x 4 x N f « champs » complexes q c fs (quarks) Ce calcul n’est possible qu’en discrétisant l’espace-temps (LQCD) 1. R 4 devient un réseau (« lattice ») de V= L 3 x T sites 3. M(x,y) devient une matrice complexe de dim d=Vx3x4 dont il faut calculer Det et inverse !!! 4. L’intégrale sur U µ devient une somme sur N ensembles dits « configurations de jauge », tirés suivant une loi de probabilité (Monte Carlo) Un projet inenvisageable sans HPC à haute dose…et stockage massif avec N 5000 Quelques tailles typiques
Les étapes d’un calcul QCD sur réseau I. Générer N configurations de jauge U µ (x), i.e. les champs de gluons, II. “Propager” les quarks dans ce “fonds” de gluons, i.e. calculer M -1 ↔ M xy [U] S yz = xz III. Calculer les observables - masses - constantes de désintégration - facteurs de forme - …. Ce qui se ramène à de « simples » manipulations algébriques avec S Comment s’articulent les MEGA/MESO/MINI centres de calcul ?
I. Générer N configurations de jauge U µ (x) De loin, la partie la plus difficile et la plus coûteuse de LQCD à cause de Det(M) Technique utilisée; Hybrid Monte Carlo (HMC) qui nécessite beaucoup de M -1 Configurations générées dans des MEGA centres par des ordinateurs dédiés e.g. pour ETMC (European Twisted Mass Collaboration APENext (Roma) BlueGene P (Juelich) Mare Nostrum (Barcelona) La France a acheté en APE, installées à Roma, utilisées pour des petits réseaux. Depuis cet été, IDRIS dispose d’une BlueGene/P utilisée pour L=32,48,… ce qui donne à la France les moyens de calcul pour faire ce travail Coût caractéristique d’une conf (L=48): 1 h. avec CPU’s (MPI) Le MESO centre CCIN2P3 participe de façon essentielle au stockage et mise en commun des confs U(x) L T Giga se comptent par milliers (différentes masses de quarks, mailles de réseau…) HPSS/SRB au service de la communauté française et collaborateurs
II. Calcul des propagateurs de quarks … pour chaque conf ! On est ramené à la résolution d’un système linéaire de taille conséquente Pour L=24 les calculs se font presque tous au CC-IN2P3 (1 calcul = 2-3 jours CPU) ramener les confs par SRB (ou rfcp) résoudre les systèmes linéaires (12 par quark) stocker les propagateurs S par SRB (du scratch de la machine distante au HPSS) L T Giga/quark ….. se comptent aussi par milliers Pour L=32 (6 jours CPU) les classes de batch du CC-IN2P3 ont dû être rallongées pour ce travail Pour L=48 actuellement pas possible au CC-IN2P3 Le CC-IN2P3 participe de façon essentielle au calcul et au stockage des propagateurs. Nous avons actuellement 300 Tera sur HPSS (Confs+Propas) M -1 ↔ M xy [U] S yz = xz
Opérateur de Dirac-Wilson: que du vide ! Identite sur la diagonale + Matrice SU(3) en 8 sites off-diagonal
III. Calcul des observables Les calculs consistent en des contractions de Wick et se ramènent à de simples manipulations algébriques des propagateurs S(x) Ils ne nécessitent pas des runs très longs (une conf 2 h CPU) Les difficultés viennent : - de la taille des propagateurs (pour L=32 et un Nucleon:15 Giga) - du fait qu’il faut moyenner sur plusieurs centaines de propagateurs, Le fait de pouvoir disposer dans un MESO centre comme le CC-IN2P3 à la fois - d’un stockage massif avec un accès rapide (comme HPSS) - et d’une puissance de calcul raisonnable le rend indispensable pour mener à bien ce type de calculs L’analyse statistique des résultats (moyennes, calcul d’erreurs, fits,…) se fait localement en utilisant les moyens des MINI centres (i.e. la plupart des laboratoires!)
Exemple: Analyse du « corrélateur temporel » C(t) d’une particule formée par trois quarks. Obtenu en moyennant sur 400 « configurations de jauge » des contractions de propagateurs de quarks, sommées sur les variables d’espace t
Exemple d’un calcul de M N en fonction de la masse des quarks ( m 2 π ) qui le composent Si m q =0 la masse des objets qui nous entourent - la seule jusqu’à nouvel ordre - ne s’en apercevrait presque pas. L’origine de la « masse » n’est pas le Higgs…. mais la « glue » Remarques: - si m π =valeur physique, N est pile à sa place - aucun paramètre ajusté ! - petitesse des barres d’erreur Et tout cela pourquoi ?
D’autres exemple de la collaboration ETMC Laboratoires francais: Grenoble (LPSC), Orsay (LPT), Saclay (SPhN)
Observables qui concernent la structure interne des particules (PDF,GPD) Facteurs de Forme JLab
Conclusion Historiquement, la LQCD s’est développée en synérgie avec le calcul haute performance. Non seulement elle lui doit sa viabilité mais elle a contribué à définir l’architecture même des ordinateurs. La saga APE (APEcento/APEmille/APEnext) a été bâtie (Roma/Orsay) pour résoudre QCD. BlueGene/P résulte d’une collaboration angloaméricaine (QCDOC) avec IBM Synérgie qui se poursuit, tant au niveau national (ANR PetaQCD) qu’européen (PRACE) Les MEGA centres sont reservés aux calculs les plus lourds Leur puissance définit en fait leurs ambitions…. ainsi que celle des pays qui en disposent L’articulation avec les MESO centres se fait tout naturellement. Elle est essentielle: - pour une partie plus « lègère » mais indispensable des calculs - en ce qui concerne le stockage et mise en commun des données (CCIN2P3) - pour permettre l’accès à un nombre - important ! - des membres d’une collaboration