L’informatique au CERN ”Du papier au web......du web à la Grille” François BRIARD IT-AIS-HR Présentation du lundi 23 août 2004 CERN, Genève
1. L’informatique au CERN: 6 catégories 2. Informatique administrative: du papier au web… 3. Défis informatiques du LHC: …du web à la Grille Plan de la présentation
Département IT 1. Environnement informatique général 2. Services d’informatique administrative 3. Informatique pour la physique et l’ingénierie 4. Consolidation, coordination et standardisation 5. Applications de physique 6. Conception et opération des accélérateurs L’informatique au CERN: en 6 catégories
1. L’informatique au CERN: 6 catégories 2. Informatique administrative: du papier au web… 3. Défis informatiques du LHC: …du web à la Grille Plan de la présentation
Services d’Informatique Administrative les domaines couverts
1. Couvrir tous les domaines d’applications par une offre logicielle cohérente 2. Couvrir tout le cycle de vie des applications informatiques - Analyse - Conception - Tests - Support - Maintenance Services d’Informatique Administrative notre mission “Du papier au web”
Services d’Informatique Administrative le public concerné - Tout individu au CERN - Secrétariats de Département et d’expérience - Services administratifs (HR, FI, SG…) - Autres services du CERN (IT, SC…) - Management - Instituts extérieurs - Compagnies extérieures - Autorités (Etats Membres, CH, FR) Plus de 12’000 utilisateurs AIS
Matériel: homogène - 1 seul SGBD: Oracle - 1 seule plateforme: Sun - 1 seul système d’exploitation: Solaris (Unix) Applications: hétérogène - “Best of breed” (meilleur du marché) - Développements internes Services d’Informatique Administrative l’infrastructure
Services d’Informatique Administrative environnement applicatif hétérogène Applications du marché
Exemple 1. EDH: Electronic Document Handling Gestion Electronique de Documents - remplace tous les formulaires administratifs - couvre tous les domaines - plus d’1’600’000 documents à ce jour - gère le flux décisionnel (workflow) Services d’Informatique Administrative démonstrations
Exemple 2. e-RT: e-Recruitment Toolkit Outil de Recrutement Electronique - libre accès du monde entier - plus de 4’000 candidats enregistrés en 2004 et plus de 12’000 candidatures reçues - gestion électronique de la communication - distribution interne instantanée (au lieu de dizaines de milliers de pages) Services d’Informatique Administrative démonstrations
1.L’informatique au CERN: 6 catégories 2. Informatique administrative: du papier au web… 3. Défis informatiques du LHC: …du web à la Grille (basé sur une présentation de François Grey) Plan de la présentation
- 40 millions de collisions/sec - Après filtre, encore 100 collisions/sec - Plus d’1MB de données par collision taux d’enregistrement > 1 GB/sec collisions enregistrées/an > 10 PB/an de données Les données générées par le LHC 1 Megabyte (1MB) Une photo digitale 1 Gigabyte (1GB) = 1000MB 5Gb = 1 film DVD 1 Terabyte (1TB) = 1000GB Production annuelle mondiale de livres 1 Petabyte (1PB) = 1000TB Production annuelle d’1 expérience LHC 1 Exabyte (1EB) = 1000 PB 3EB = production annuelle mondiale d’informations CMSLHCbATLASALICE
Chaque année, le LHC générera l’équivalent de 20 millions de CD Les données générées par le LHC en 1 an Où les expériences vont-elles stocker ces données? Concorde (15 Km) Ballon (30 Km) Pile de CD avec 1 an de données du LHC (~ 20 Km) Mont-Blanc (4.8 Km)
L’analyse des données du LHC requiert une puissance de calcul équivalente à 100’000 processeurs de PC les plus récents Le traitement des données générées par le LHC Où les expériences vont-elles trouver la puissance de calcul nécessaire?
- Haut débit basé sur une technologie “universelle” fiable - Plus de 1000 PCs double processeurs - Plus d’1 Petabyte de données sur disque et bandes La puissance de calcul et la capacité de stockage disponibles au CERN Loin d’être suffisant!
Les centres de calcul, isolés par le passé, seront connectés, unifiant les ressources informatiques du monde de la physique des particules à travers le monde > le web met en commun de l’information répartie en des millions de lieux différents > la Grille met en commun de la puissance de calcul et de l’espace de stockage distribué à travers le monde La solution au manque de puissance de calcul: la Grille En Europe: 267 instituts 4603 utilisateurs Ailleurs dans le monde: 208 instituts 1632 utilisateurs
5 grandes idées 1. Partage mondial de ressources Question de confiance, domaines administratifs différents, Organisations virtuelles, accès 24/24 7/7… 2. Accès sécurisé Règles bien définies, authentification, autorisation, comptabilisation, nouveaux standards 3. Utilisation efficace des ressources Plus que de la récupération de cycles intergiciel (middleware), files d’attentes… 4. Abolition de la distance 56Kb/s il y a 10 ans >> 155Mb/s (x 3000!) >> 10 Gb/s 5. Normes ouvertes OGSA (Open Grid Standard Architecture), web services, boîte à outils Globus (protocoles et services) Sur quels principes repose la Grille?
Les projets de Grille à travers le monde NASA Information Power Grid DOE Science Grid NSF National Virtual Observatory NSF GriPhyN DOE Particle Physics Data Grid NSF TeraGrid DOE ASCI Grid DOE Earth Systems Grid DARPA CoABS Grid NEESGrid DOH BIRN NSF iVDGL UK e-Science Grid Netherlands – VLAM, PolderGrid Germany – UNICORE, Grid proposal France – Grid funding approved Italy – INFN Grid Eire – Grid proposals Switzerland - Network/Grid proposal Hungary – DemoGrid, Grid proposal Norway, Sweden - NorduGrid DataGrid (CERN,...) EuroGrid (Unicore) DataTag (CERN,…) Astrophysical Virtual Observatory GRIP (Globus/Unicore) GRIA (Industrial applications) GridLab (Cactus Toolkit) CrossGrid (Infrastructure Components) EGSO (Solar Physics) Le développement des Grilles a été initié par la communauté scientifique universitaire et de recherche, mais les industriels s’y intéressent aussi.
Les défis posés au CERN - Partager des données entre >7000 scientifiques d’origines diverses - Relier de grands centres de calculs, pas juste des PCs - S’assurer que toutes les données soient accessibles partout et tout le temps - Assurer une croissance rapide tout en restant fiable pour plus d’une décennie -Intégrer les nombreuses politiques et règles des différents centres - Assurer la sécurité des données: il y a plus que de l’argent en jeu! - Fonctionner en 2007
Les domaines d’applications possibles des Grilles Médecine/Santé (imagerie, diagnostique et traitement) Bioinformatique (étude du génôme humain et compréhension des maladies génétiques) Nanotechnologie (conception de nouveaux matériaux à l’échelle atomique) Ingénierie (optimisation de conception, simulation, analyse de risque et accès et contrôle d’instruments à distance) Environnement et ressources naturelles (prévision météorologique, observation de la Terre, modélisation et prédiction de systèmes complexes)
Les projets de Grille au CERN Projets CERN: LHC Computing Grid (LCG) Projets financé UE géré par le CERN: Enabling Grids for E-Science in Europe (EGEE) + autres Projets financés par l’industrie : CERN openlab for DataGrid applications
Pour en savoir plus… ais.cern.chwww.gridcafe.org Journée portes ouvertes le 16 octobre 2004