La grille de calcul EGEE Le CERN et le projet LHC La grille de calcul EGEE LAPP – 26 octobre 2007
Le projet LHC du CERN CERN : Le projet LHC : Large Hadron Collider C’est le plus grand centre de physique des particules du monde 20 pays européens membres + 28 pays qui sont impliqués dans les projets Le projet LHC : Large Hadron Collider Plus grand accélerateur de particules : deux faisceaux de particules circulent en sens opposés collisions proton/proton 27 km de circonférence Nombre de collisions : 40 millions de paquets de particules de croisent pendant une seconde ce qui va génerer 1 milliard de collisions proton/proton par seconde Pour chaque seconde, seuls les 100 événements les plus intéressants sont enregistrés soit environ 1Go/seconde Energie d’une collision : les collisions ont lieu entre deux protons de 7 TeV un moustique en vol = 1TeV MAIS : un proton est mille milliards de fois plus petit qu’un moustique !!! ( toute l’énergie est concentrée en un tout petit point )
cette nouvelle infrastructure s’appelle la grille de calcul Le défi informatique du LHC : Les moyens informatiques de calcul et de stockage nécessaires pour supporter l’expérience du LHC sont colossaux Malgré les évolutions de l’électronique et du matériel informatique, il n’existe pas de structure capable de fournir de telles puissances. De plus, les personnes qui collaborent aux expériences du LHC travaillent dans des universités et des laboratoires répartis partout dans le monde… Construire une infrastructure de travail commune et accessible par tout le monde en regroupant et en partageant des fermes de calcul et de stockage installées dans les universités et les laboratoires cette nouvelle infrastructure s’appelle la grille de calcul La grille construite en Europe s’appelle EGEE (Enable Grid for E-Science ) Le projet LCG ( LHC Grid Computing ) est la grille pour le LHC
Le flux de données du LHC 330.000 CPUs de type Pentium IV 3GHz Moyens informatiques nécessaires Simulation Acquisition Puissance de calcul Geant4 Online 330.000 CPUs de type Pentium IV 3GHz 400 Mo/s ( = ½ CD par seconde ) Quantité de données Concorde (15 Km) Ballon (30 Km) Pile de CDs avec 1 an de données LHC (~ 20 Km) Mt. Blanc (4.8 Km) Données brutes 15 Petaoctets par an = 15000000 Go Reconstruction + 1/10 stockés - catalogués gérés - distribués Données traitées Besoin total (Po) : Analyse 2007 2008 2009 2010 51 168 258 402 Nombre d’événements par seconde : W e : 15 Z e+e- : 1.5 Higgs : H : 0.00001 ( ~ 300 événements / an ) Comment faire ???
Tremblements de terre tsunami Projet financé par l’Europe pour la communauté scientifique Sciences de la Terre Initiateur Interface utilisateur Physique des particules Tremblements de terre tsunami Biomedical Réseaux – web Génomique – malaria grippe aviaire Aujourd’hui : 56 Petaoctets et 41363 CPUs 51 pays et 244 sites 15% par rapport à la demande 2010 au LAPP : Projet MUST 2006-2008 128 CPUs ( ~ 300 Ghz ) 10 Teraoctets de stockage ( = 10.000 Go) Mutualisation des ressources la grille Fin 2007 : 398 CPU et 20 To de stockage
Geant est co-financé par la Comission Européenne L’infrastructure réseau : Geant est co-financé par la Comission Européenne
La grille en temps réel … Il est possible de surveiller l’activité de la grille depuis n’importe quel PC : Application Google Earth : http://gridportal.hep.ph.ic.ac.uk/rtm/
Que font les informaticiens dans le projet LHC ? Infrastructure informatique : gestion comptes informatiques matériel informatique – machines réseaux haut débit sécurité outils de communications construction d’un environnement de travail commun Logiciel : outils de développement communs, outils de sauvegarde ( 2000 personnes développent un même logiciel ) base de données traçage de toutes les actions 2 activités de développement : ONLINE : acquisition de données en direct (électronique) tri des données sauvegarde des données OFFLINE : outils d’analyse des données simulation numériques des interactions (GEANT4) temps réel + construction de la grille logiciels, outils, réseaux, … installation des fermes de calcul