Grille de calcul et E-Science Farida Fassi Master de Physique Informatique Rabat, Maroc 24-27 May 2010.

Slides:



Advertisements
Présentations similaires
Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
Advertisements

Introduction aux Grilles de Calcul
30/03/2017 Formation Plan 1.
ATLAS Data Challenges. Les Data Challenges (DC) en français Challenges des Données ont pour but de Valider: –le modèle dorganisation et dutilisation des.
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
CAPRI 9 juin 2011 Cloud Académique Production Recherche Innovation Comité de Pilotage France-Grilles.
FORUM REGIONAL DE NORMALISATION DE L'UIT POUR L'AFRIQUE (Dakar, Sénégal, mars 2015) Outils et méthodes pour tester la qualité de services (QoS) de.
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.
La Grille de Calcul du LHC Visite de Bernard Le Solleu
L’Online Executive Master in Management Organisé par Proposé en partenariat par.
Enabling Grids for E-sciencE EGEE-III INFSO-RI Sécurité sur la Grille G. Philippon (LAL – CNRS ) Tutorial EGEE Utilisateur (DAKAR)
JI Les systèmes d’autorisation et d’authentification dans AMI Fabian Lambert.
DE LA COLLISION A LA PUBLICATION. CE QUI S'EST PASSE.
1 TECHNOLOGIE EN SEGPA Objets techniques instrumentés, didactisés et maquettisés que préconisent les nouveaux programmes Stage 10SEGDES2 du 14 et 15 décembre.
Roger Boll, avril 2006 Equipe de Biologie des Populations en Interaction Institut National de la Recherche Agronomique UMR 1112 : Réponses des Organismes.
Mediator 9 - Un outil de développement multimédia 3AC Techno/Informatique.
Stratégie: éléments généraux. France Grilles Est un Groupement d’Intérêt Scientifique… – créé en 2010 par 8 partenaires (CEA, CNRS,CPU, INRA, INRIA, INSERM,
V- Identification des ordinateurs sur le réseau??? ? ? ? ?
Vers la gestion globale des risques au travers de l’ISO : 2009 CLUSEL Sophie OMNES Air France – KLM Novembre 2011.
Tunis, le 13 Décembre 2004 RESULTATS PRELIMINAIRES DE L’ETUDE SUR L’INTERNATIONALISATION DES SERVICES DES CENTRES TECHNIQUES TUNISIENS Silvia Grandi (IPI)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Session “Site Administrator” Pierre Girard.
Parcours CODAGE & ALGORITHMIQUE Cycle 3 – Ecole primaire & Collège est une plateforme de formation interactive des personnels de l'éducation.
Comment faire un site Web ITC-ILO, 19 Avril 2010.
Mathilde Guiné – Outils-Réseaux - Rencontre “Le projet associatif, un mode d'Emplois” - 30 novembre 2007, Perpignan Pratiques et outils collaboratifs -
1 Les logiciels en général sont classés en deux familles:  Logiciels de base  Logiciels d’applications (applications) 2.
INTRODUCTION L‘entre-deux guerres marque le début de l’ère industrielle pour les pays du sud Dans les années 50-60, les formes du processus d’industrialisation.
Formation « Administrateur ATRIUM ». 1.Un accompagnement technique par la Région Formation des « administrateurs » Support technique Evolution des fonctions.
StratusLab is co-funded by the European Community’s Seventh Framework Programme (Capacities) Grant Agreement INFSO-RI La technologie « cloud » M.
1 Journées Scientifiques novembre 2003 MoMaS EDF Electricité de France Multi Domaines Simulation Multi Domaines Laurent Loth - Andra.
LPSC, journée de lancement TIDRA B. Boutherin 1/12 Tier 3 du LPSC Grenoble Une infrastructure solide, originale et éco-responsable Des ressources importantes.
Préparation des études sur les premières données de l’expérience Atlas : reconstruction des leptons du boson Z° Anne Cournol Stage de Master 1, sciences.
Jobs multicore dans WLCG Présentation en partie basée sur des présentations faites dans le cadre du groupe de travail multicore.
LCG-France Edith Knoops CPPM. Le LHC LEP LHC > 95% UNKNOWN STUFF OUT THERE > 95% UNKNOWN STUFF OUT THERE Black hole 3.
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
6-7 Octobre 2008J-P MEYER1 Conclusions du groupe de travail thématique 7 Physique subatomique: - physique des particules, - physique nucléaire, - astroparticules.
Projet LCG: Vue d’Ensemble Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3 Rencontre IN2P3/STIC Grenoble, 25.
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
JOURNÉE CALCUL ET SIMULATION DE L'UNIVERSITÉ PARIS SUD Organisée par le Groupe de Travail Informatique Scientifique de Paris Sud.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
France Grilles: plan stratégique Conseil de Groupement 13/6/2012 V. Breton La grandeur des actions humaines se mesure à l’inspiration qui les fait naître.
Livre blanc sur les grilles de production Travail national de prospective animé par Guy Wormser Véronique Donzeau-Gouge Michel Daydé.
Présentation au conseil scientifique. Une e-infrastructure dédiée au traitement des données Infrastructure distribuée, par les utilisateurs, pour les.
Grilles de recherche Veronique Donzeau-Gouge. 2 objectifs Renforcer la présence du CNRS dans ce domaine en liaison avec : L’Institut ST2I L’INRIA, Les.
 rechercher et coordonner l'engagement des acteurs nécessaires, Christine=> Helene,Gilles (permet de réduire les groupes de travail comme mentionné dans.
PROJET FIN D’ÉTUDE 4 ÈME ANNÉE OPTION : INGÉNIERIE DES SYSTÈMES AUTOMATISÉ ET CONTRÔLE QUALITÉ « SYSTÈME DE CONTRÔLE ET DE COMMANDE D’ACCÈS À DISTANCE.
Resource allocation: what can we learn from HPC? 20 janvier 2011 Vincent Breton Crédit: Catherine Le Louarn.
Compétences: Capacité d’analyse et de recherche Présentation/Discussion Adjoints des commissions des finances - WAAPAC.
Présenté par  Samira BELHORMA  Imane ZEHHAF. Introduction I. Définitions II. Quand et comment évaluer une compétence? III. Le contexte d’évaluation.
INFSO-RI Enabling Grids for E-sciencE Technologie de la grille C. Loomis (LAL-Orsay) EGEE Tutorial (Marseille) 3-4 octobre 2006.
Système Intégré de Gestion de l’Etat Civil PROJET SIGIEC 1.
Séminaire Nouveaux Programmes de technologie Paris Diderot 24 mars 2016 Présentation des ressources pour le cycle 3. Lycée Diderot le 24 mars Samuel.
Ghita Rahal Lyon, 17 Avril 2008 Outils d’information et de suivi pour l’utilisateur.
Tier 2 au LAPP. Plan Historique Objectifs Infrastructures Status/métriques Avenir Conclusion.
Equipe Projets Grille Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 28 mai 2004.
Tutoriel MATLAB-SIMULINK Projet UNIT 2009 Partenariat : Ecole des Mines d’Alès Ecole des Mines de Saint Etienne Université de Nice Sophia-Antipolis.
Le Volet Accessibilité dans le projet « Refonte Site Web » de la Cité des Sciences et de l’Industrie Présenté par Mme Si Merabet – Abdelhadi Fatima Zohra.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
Communication LCG-France Colloque LCG France Mercredi 14 mars 2007.
Université Ferhat Abbas –Sétif 1 Centre des Systèmes et Réseaux d’Information Et de Communication, de Télé-enseignement et D’Enseignement à Distance Rapport.
Stratégie vers la communauté de recherche en informatique V. Breton.
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
Eric Fede : Obernai Intégration des services grille dans l'exploitation des systèmes informatiques du laboratoire.
F. Genova et groupe de travail « Données » Prospective IDG, 6/10/2008 Groupe de travail transverse « Grilles de Données »
Le Centre de Calcul de l'IN2P3 7 septembre 2010 Dominique Boutigny Un instrument informatique de pointe au service de la recherche Rencontre avec Oracle.
INFSO-RI Enabling Grids for E-sciencE Les enjeux des nouvelles applications C. Loomis (LAL-Orsay) Journées Informatiques (Lyon-Valpré)
Grille de calcul et E-Science
La grille de calcul EGEE
Introduction à la Grille
Transcription de la présentation:

Grille de calcul et E-Science Farida Fassi Master de Physique Informatique Rabat, Maroc May 2010

Plan  Introduction: C'est quoi la grille de calcul?  Motivation scientifique  Incitation à la grille et ses composantes  Les projets: WLCG, EGEE et EGI  Applications  Qui l'utilise et pourquoi ?  Physique des particules  Bio-informatique  Sciences de la terre  …. 2

C'est quoi la grille de calcul? (1) Historique : Le nom de “Grille” a été choisi par analogie avec le réseau électrique (electric power grid) (Foster and Kesselman 1998)  Vision : brancher un ordinateur pour obtenir de la puissance de calcul comme brancher un grille pain pour avoir de l'électricité  Le concept était déjà présent avec le calcul distribué.  Différence clé : la grille réalise cette vision à une échelle globale.

C'est quoi la grille de calcul? (2)  Approche pour la distribution de la puissance informatique le réseau Internet et la haute-performance  Partage transparent de l'utilisation de ressources massivement distribuées par des utilisateurs de différentes disciplines  « A computational grid is a hardware and software infrastructure that provides dependable, consistent, pervasive and inexpensive access to high computation capabilities » (The Grid, I.Foster and C.Kesselman 1998)

 Simulations numériques  Grande précision  Phénomènes physiques complexes  Importants besoins  Efficacité d’interaction  Exploitation des résultats  Puissance de calcul  Espace de stockage  Applications distribuées sur plusieurs noeuds  Données partagées  Propriétés attendues  Transparence  Localisation, transfert, etc. Plus d’infos sur: B esoins scientifique

CMSLHCbATLAS ALICE 1 Megabyte (1MB) A digital photo 1 Gigabyte (1GB) = 1000MB A DVD movie 1 Terabyte (1TB) = 1000GB World annual book production 1 Petabyte (1PB) = 1000TB Annual production of one LHC experiment 1 Exabyte (1EB) = 1000 PB World annual information production CD stack with 1 year LHC data! (~ 20 Km)  Les sciences de HEP sont devenues très gourmandes en données:  Simulations toujours plus détaillées  Sciences expérimentales utilisant des détecteurs toujours plus sensibles  Beaucoup de données produites  Grandes collaborations internationales Ex. Experiences de Large Hadron Collider (LHC) au CERN ~10 petabytes/an (~10 Million GBytes) Besoins scientifique: Exemple Physique de Particules (HEP)

La « Vision Grille »  Chercheurs répartis géographiquement, partageant des données et des moyens de calcul  Ressources et Services informatiques interconnectés sur le réseau  Instruments scientifiques produisant de gros volumes de données  Le but de la Vision Grille est de rassembler ces trois éléments pour fournir des solutions

La solution: Grille de calcul?  Grille de calcul, solution aux très grande puissance de calcul et d’une capacité de stockage de l’ordre du Peta Octet  Caractéristiques importantes de la Grille  Fédérer des ressources distribuées  CPU, stockage, algorithmes, expertises  Accès sécurisé entre des domaines différents  Confiance entre les administrateurs de système,  développeurs des applications, utilisateurs,...  Accès transparent à « toutes » les ressources  On se connecte à la grille une seule fois  Les aspects de calcul distribué sont cachés.  Ressources distribuées de manière sécurisée de façon que les utilisateurs peuvent collaborer de manière transparente au sein d'Organisations Virtuelles (VO)

What is e-Science ? E-Science (enhanced Science) refers to scientific activities that are carried out by using Resources distributed across Internet “E-Science is about global collaboration in key areas of science, and the next generation Of infrastructure that will enable it” John Taylor, Director of Research Councils. Office of Science and Technology * The use of distributed resources is both a necessity and an added value * More effective when associated to a global collaboration than at the individual level E-Science is supported by e-Infrastructures: new generation of research infrastructures Based on information and communication technologies

TEMPLATE SLIDE SHOW

Différentes grilles pour des besoins divers  Il n'y a pas encore une unique grille comme pour le web  Mais il y a plusieurs grilles pour diverses applications  Le mot « grille » est utilisé pour décrire différents types de calcul distribué:  grille d'entreprise au sein d'une entreprise  grille publique: mise à disposition de votre PC ex. : des millions de PC Utilisation des cycles processeurs  Recherche de signaux extra-terrestres  DECRYPTHON: Etablir la carte des protéines du vivant  Nous allons nous focaliser sur les grilles scientifiques qui relient les centres de calcul des laboratoires de recherche et des universités.

Plus sur les types de grilles Grille des supercalculateurs ▫ Cher, procédure d'allocation lourde, bien adapté aux ▫ applications fortement parallèles ▫ ressources coordonnées par un projet, utilisateurs connus Grille institutionnelle ▫ LCG, WLCG, EGEE, EGI ▫ Moins cher, allocations faites par les propriétaires, ▫ accueille des applications variées ▫ intergiciel commun, applications stables Grille des « desktops » ▫ Bénévole (BOINC, ▫ ressources mise à disposition d'un projet, utilisateurs inconnus ▫ Beaucoup moins cher, ressources des bénévoles, ▫ transfert de données minimum

Fonctionnalités de base  Authentification par certificat: Proxy  Organisation Virtuelle : VO  Gestion de tâches (jobs) – sous Linux (SL)  Gestion des données – copie, catalogues,...  Monitoring des sites et des services  Le middleware « glite » fournit cela Le middleware « glite » fournit cela

Organisations Virtuelles (1)  Utilisateurs et ressources sont regroupés en Organisations Virtuelles:  un groupe de personnes de différents instituts travaillant dans un but commun  partageant des ressources communes distribuées (ordinateurs, fichiers de données, instruments scientifiques, codes, etc)  Ressources virtuelles partagées de calcul et de données  accès à des ressources hors de leur instituts pour les membres de la VO  Les fournisseurs de ressources négocient avec les VO

Organisations Virtuelles (2)  Ressources et personnes distribuées  Reliées par les réseaux, des structures administratives  Partageant des ressources, buts communs  Dynamique et tolérant à la panne

Les composants de la Grille  Le calcul sur la Grille nécessite:  Un réseau:  Connectivité entre les sites pour la distribution des données:  transferts de Tiers à Tiers (voir présentation LHC)  Du stockage pour:  déposer des données, les relire, les effacer  La puissance de calcul pour traiter les données.  En outre, il nécessite  La mise en place d’une couche logicielle pour uniformiser et « abstraire » les ressources  Du monitoring pour connaître l’état d’utilisation des ressources  Du monitoring et des tests pour connaître l’état de fonctionnement du système à tout moment. 17

18 RESEAU Réseau: épine dorsale de la grille  Sans un réseau haute performance, pas de grille ! LHC Optical Private Network (LHCOPN)  Réservé pour l'acheminement des données du T0 vers les T1 et pour l'échange entre les T1  Fibres optiques fournies et gérées par les réseaux nationaux académiques et de recherche  Bandwidth: 10 Gbps par lien  100/200 Gbps par lien en 2013

La qualité du réseau est primordiale pour le fonctionnement des grilles de calcul Importance du réseau On espérant que le Maroc peut avoir le 10 Gbps par lien!

Réseau au Maroc  Utilisé en Physique des Hautes Energies, essentiellement pour ATLAS:  Outre disciplines scientifiques RUPHE: -Universités: Rabat, Marrakech, Casablanca, Oujda, Tétouan -CNESTEN Réseau relié: MARWAN Etat actuel: ~34Mbps! RESEAU

 Ambitious plans again underway to better-connect African continent, both East & West.  Potential increase in capacity 1000X: to multi-Terabit/s range.  Seacom, EASSy, TEAMS, MainOne already in production  Spurred by the World Cup: Outlook is some of these will succeed For a more comprehensive map (with terrestrial fiber): Espoire: New African Undersea Cables to Europe, India, Middle East

Worldwide LCG Collaboration (WLCG) But : développer, mettre en place et maintenir un environnement de calcul et de stockage distribués pour les données des 4 expériences du LHC  Ressources fournies par les pays participants aux expériences  Architecture de partage des ressources, des logiciels, des données et des services entre des équipes réparties géographiquement  Plus de détails dans les présentations postériori LHC Computing Grid

WLCG : architecture  Ensemble de services et d'applications tournant sur l'infrastructure de grille fournit par EGI (Europe et AsiePacifique), NorduGrid (pays nordiques) et Open Science Grid (USA) L'interopération entre grilles fonctionne

EGEE- Enabling Grids for E-sciencE  Une série de projets européens, financé par la Commission Européenne  Objectifs principaux infrastructure de grille de service cohérente, robuste et sécurisée  Amélioration et continuation de l'intergiciel  attirer de nouveaux utilisateurs de l'industrie et des sciences  s'assurer qu'ils reçoivent une formation et un support de qualité  Construire une grille de production a grande échelle  Pour les sciences et technologie international  Pour promouvoir la coopération international dans la création y utilisation de l’infrastructure  Reliée à y basée sur les initiatives national, régionales et internationales

Le project EGI  EGI : European Grid Infrastructure  Suite du projet EGEE (Enabling Grids for EsciencE),  Il vise à pérenniser la grille européenne (a débuté en avril 2010)  S'appuie sur les NGI (National Grid Initiative)  Structure  plus de 250 centres de calcul dans plus de  48 pays, fédérés en grilles régionales  CPUs, > 5 Petabytes de stockage

EGEE/EGI : applications  Physique des particules  Bioinformatique  Industrie  Astronomie  Chimie  Observation de la Terre  Géophysique  Biodiversité  Nanotechnologie  Modélisation climatique

Application: Besoins en Astroparticules  Besoins « standards »:  Besoin de puissance CPU  Besoin d’accès intensifs (images)  Besoins de grosses production de Monte-Carlos  Besoins « spécifiques »  Pétaoctets de données existantes et inexploitées par manque de ressources informatiques.  Besoin de mise à disposition et partage de données par une large communauté  Fusion de données hétérogènes  Utilisation d’archives de données.

Application: besoins en biomédicales egee.org/fileadmin/documents/UseCases/MedicalDataManagement.html Besoins de capacités importantes pour traiter toutes les données correspondant à leur domaine de recherche. ▫ Stockages et bases de données en croissance exponentielle et distribuées sur plusieurs sources ▫ CPU pour traiter les données avec des algorithmes de plus en plus complexes et de la modélisation. La Grille fournit les ressources à la demande ▫ Un environnement de stockage sûr et accessible ▫ Du CPU à la demande ▫ Un environnement collaboratif. ▫ Une intégration de ressources diverses dans une infrastructure commune

Application: besions en WISDOM GRIDS EUROPEAN PROJECTS  WISDOM (World-wide In Silico Docking On Malaria) (  Développer de nouveaux médicaments «in silico»  Coûts réduits  Développement accéléré  p.ex. Malaria, grippe aviaire...  Trois « data challenge »  Wisdom-I  1M molécules, 1 TO  Grippe aviaire  300 k molécules, 750 GO  Wisdom-II  125 M molécules, 2 TO

Exemple: Découverte de nouveaux médicaments  Développement pharmaceutique:  Plus de 10 ans pour le développement d’un médicaments  Budgets >100M$  Concentration sur les maladies les plus fréquentes  Néglige les maladies rares et émergentes.  Développements informatiques:  De plus en plus de librairies et bases de données de structures 3D de molécules  De plus en plus de bibliothèques de composants chimiques  Reste à faire la sélection et le match (docking) Cette selection virtuelle utilise la Grille pour accélérer les processus de recherche et minimiser les coûts

Liens  Projets grille :         Traitement d'incident   Activité sur la grille   