Cette présentation… … fait partie d’une série de 3 :

Slides:



Advertisements
Présentations similaires
le cloud d’Orange au service du succès des start-ups innovantes
Advertisements

1 HPC pour les opérations. Sommaire Quelques rappels sur Windows Compute Cluster Server Déploiement de Compute Cluster Administration de Compute cluster.
3/26/2017 7:29 PM Taxonomie et gouvernance Organiser le patrimoine informationnel des entreprises © 2006 Microsoft Corporation. All rights reserved. This.
Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
PLAN du COURS Introduction Structure des Systèmes Informatiques
Intégration du système de production LHCb sur la DataGRID V. Garonne, CPPM, Marseille Réunion DataGRID France, 13 fv fév
Grille Régionale Rhône-Alpes Institut des Grilles du CNRS Yonny CARDENAS CC-IN2P3 Réunion du groupe de travail grilles Projet CIRA Grenoble, le 2 Juin.
Recherche de similarité de séquences à grande échelle S. Penel, P. Calvat, Y. Cardenas LBBE, CCIN2P3 Calculs BLAST intensifs sur la plateforme TIDRA -
Introduction aux Grilles de Calcul
Architecture de grille générique, multi-
ATLAS Data Challenges. Les Data Challenges (DC) en français Challenges des Données ont pour but de Valider: –le modèle dorganisation et dutilisation des.
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
France Grilles: plan stratégique version du 15 Novembre 2012.
Services de production grille en France Gilles Mathieu IN2P3-CC France Grilles Frédérique Chollet IN2P3-LAPP LCG France Rencontres France Grilles et LCG-France,
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
CAPRI 9 juin 2011 Cloud Académique Production Recherche Innovation Comité de Pilotage France-Grilles.
Gestion de données : Besoins de la VO Biomed Sorina Pop Laboratoire Creatis Université de Lyon, CREATIS; CNRS UMR5220; Inserm U1044; INSA-Lyon; Université.
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Contact Sécurité du ROC français R. Rumler.
Module 3 : Création d'un domaine Windows 2000
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.
Le noeud de grille Tier 3 LAPP.
Plan de viabilité de France Grilles Hélène Cordier, Gilles Mathieu CTE-15 – mardi 12 juin 2012.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Transition vers EGEE-III (et EGI?) Pierre.
L’authentification Kerberos
21/02/2003DEA DISIC 1 Grid Computing Programming the grid: Distributed Software Components, P2P and Grid Web Services for Scientific Applications Tarak.
Recapitulatif des sujets abordés Frédérique Chollet Fabio Hernandez Fairouz Malek Réunion LCG-France Tier-2s & Tier-3s Paris, 20 mars 2008.
Sample Image 3ème rencontre EGEODE – Villefranche-sur-Mer – 29 May 2009 g-Eclipse avec EGEODE
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Data management David Bouvet IN2P3-CC Clermont.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Sécurité sur le GRID Ahmed Beriache (CGG)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs David Bouvet IN2P3-CC.
EGEODE 08/11/2006 Équipe GRID1 EGEODE EGEODE. 08/11/2006 Équipe GRID2 Plan  La géophysique sur la Grille : EGEODE  Partenariat académique  Comment.
Enabling Grids for E-sciencE EGEE-III INFSO-RI Sécurité sur la Grille G. Philippon (LAL – CNRS ) Tutorial EGEE Utilisateur (DAKAR)
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Quelques commandes de la grille David Bouvet.
Hébergement d’une infrastructure de Cloud Expérience d’un laboratoire Guillaume Philippon.
Dominique Boutigny Une infrastructure informatique au service des chercheurs et des industriels rhônalpins Journée de lancement de l’initiative TIDRA Traitement.
Retour d'expérience de l'utilisation du cloud comme infrastructure de service Guillaume PHILIPPON.
Projet StratusLab Technologies Cloud et Virtualisation M. Airaj (CNRS/LAL), C. Loomis (CNRS/LAL) LCG-France, CPPM Marseille Juin 2010 The StratusLab.
Stratégie: éléments généraux. France Grilles Est un Groupement d’Intérêt Scientifique… – créé en 2010 par 8 partenaires (CEA, CNRS,CPU, INRA, INRIA, INSERM,
Mardi 31 mai 2016 JJS (Java Job Submission) Soumission de jobs sur grille Pascal Calvat Centre de calcul.
EGEE is a project funded by the European Union under contract IST Job Soumission Eric Fede CPPM Grid Tutorial, Novembre
EGEE is a project funded by the European Union under contract IST Job Soumission N.Lajili Seminaire Grille-21 Novembre
Stratégie vers les utilisateurs G. Romier. Les utilisateurs 2 environ 750 utilisateurs « nationaux » regroupés en organisations virtuelles (VO) 89 Organisations.
Roadmap opérations Revue fin 2013 Planification 2014 Visio opérations – décembre 2013.
Cécile Barbier David Bouvet Christine Leroy L'exploitation de la grille au quotidien.
Bilan 2012, perspectives 2013 Conseil de Groupement – 21/2/2013 V. Breton La grandeur des actions humaines se mesure à l’inspiration qui les fait naître.
Opérations France-Grilles : Etat des lieux Hélène Cordier/Gilles Mathieu LCG France, 30 Mai 2011.
Réunion EGEE France 11/6/2004Page 1Rolf Rumler Structure de l’exploitation d’EGEE.
Les missions des opérations CTE9 – 13/12/2011 Gilles Mathieu.
Grid au LAL Michel Jouvin LAL / IN2P3
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
Réunion du 4 Février 2015 du Conseil de Groupement.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Soumission de jobs C. Loomis / M. Jouvin.
Projet LCG: Vue d’Ensemble Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3 Rencontre IN2P3/STIC Grenoble, 25.
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
EGEE is a project funded by the European Union under contract INFSO-RI Copyright (c) Members of the EGEE Collaboration Infrastructure Overview.
France Grilles: plan stratégique Conseil de Groupement 13/6/2012 V. Breton La grandeur des actions humaines se mesure à l’inspiration qui les fait naître.
Présentation au conseil scientifique. Une e-infrastructure dédiée au traitement des données Infrastructure distribuée, par les utilisateurs, pour les.
Réunion des sites LCG France- Marseille juin ACTIVITES DU GROUPE ACCOUNTING FRANCE GRILLES Cécile Barbier (LAPP)
Resource allocation: what can we learn from HPC? 20 janvier 2011 Vincent Breton Crédit: Catherine Le Louarn.
Besoins opérationnels de France Grilles : Le coût des opérations Gilles Mathieu, Hélène Cordier Atelier Opérations 29 Novembre - INRA - Bordeaux.
EGEE induction course, 22/03/2005 INFSO-RI Enabling Grids for E-sciencE Infrastructure Overview Pierre Girard French ROC deputy.
La stratégie opérationnelle de France- Grilles Hélène Cordier, Gilles Mathieu Contact: La stratégie opérationnelle.
Réunion LCG France18-19 mai ACTIVITES DU GROUPE DE TRAVAIL ACCOUNTING LCG-FR / SA1-FR Cécile Barbier (LAPP)
Stratégie technique G. Mathieu – V. Breton. Stratégie vers les fournisseurs de services et de ressources France Grilles2 Jouer le rôle central dans le.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Monitoring dans EGEE Frederic Schaer ( Judit.
INFSO-RI Enabling Grids for E-sciencE Data management Daniel Jouvenot IN2P3-LAL ORSAY - 02/02/2007.
Fonctionnement de la grille
France Grilles Formation DIRAC janvier 2018.
Transcription de la présentation:

Les grilles et le Cloud Computing PARTIE 1 – La grille : Concepts, architectures et fonctionnement général Gilles Mathieu – gilles.mathieu@inserm.fr Coordination de l’Informatique Scientifique de l’Inserm

Cette présentation… … fait partie d’une série de 3 : Partie 1 : La grille : Concepts, architectures et fonctionnement général Partie 2 : La grille : Détails de fonctionnement, opérations et outils Partie 3 : Le Cloud Computing : principes et utilisation

La grille… Généralités Fonctionnement La grille et le monde Concepts généraux et paradigmes Historique Panorama actuel Fonctionnement Architecture globale La vie d’un job : aperçu des services La grille et le monde Bénéfices et limitations Quelques chiffres et statistiques

Paradigmes et concepts Une grille, c’est quoi ? Une infrastructure virtuelle constituée d’un ensemble de ressources, géographiquement éloignés mais fonctionnant en réseau pour fournir une puissance globale à des utilisateurs identifiés What’s in a name… Analogie avec le réseau électrique ("Power Grid") “Accessing computer power from a computer grid should be as simple as accessing electrical power from an electrical grid“

Paradigmes et concepts La boulette française Traduire "grid" en "grille"… So much pour l’image marketing et pour l’analogie avec le "power grid", qui perd son sens au passage

Paradigmes et concepts Les 5 piliers de la grille Les ressources sont partagées L’accès est sécurisé L’usage des ressources est optimisé La distance n’est pas importante Les ressources sont interopérables au travers de standards ouverts "The grid is about collaboration, about working together"

Les différents types de grille Grilles de données Distribution des données pour stockage à grande échelle (Grille de Data Centers) Grilles de calcul Distribution de la puissance de calcul (Grille de Clusters) Bien souvent, les deux sont couplés…

Les différents types de grille Grilles de production Objectif : servir à la production scientifique, ou industrielle Ex: EGI, WLCG Grilles de recherche Objectif : comprendre et expérimenter le fonctionnement de systèmes distribués Ex: Grid5000

Un peu d’histoire… Le principe n’est pas si nouveau SETI@home... L’une des premières grilles Le web : une grille d’informations… Les besoins croissants et l’amélioration des réseaux ont rendu ce principe réalisable

Un peu d’histoire… 1999 : Ian Foster et Carl Kesselman, les pères de la grille de calcul "The Grid: Blueprint for a new computing infrastructure"

Les grands débuts Fin des années 90: projet de créer le LHC au CERN Problématique: comment stocker et traiter les 15Po de données produites chaque année? Un pari: créer une "grille" internationale

Une lignée de projets européens EDG 2002-2004 EDG, l’Ancêtre EGEE-I 2004-2006 EGEE 1er, l’Explorateur EGEE-II 2006-2008 EGEE II, le Bâtisseur EGEE-III 2008-2010 EGEE III, le Fédéraliste EGI-InSPIRE 2010-2015 EGI-InSPIRE, l’Empereur EGI-Engage 2015-2018 EGI-Engage, le Jeune

Panorama européen actuel Une grille européenne de production : EGI Une fédération de grilles nationales : les National Grid Initiatives (NGI) NGI Française = France Grilles Collaborations et interopérabilité bien au-delà de l’Europe Ressources "mondiales" Accords entre projets et infrastructures

EGI = European Grid Infrastructure 32 countries (National Grid Initiatives) Grid Federating IT services Infrastructure Computers, Data, Applications Clouds, clusters, grids,…. and beyond!! Sustainability Sustainable operation Project-driven innovation EGI-Engage, AARC, INDICO, etc. EGI.eu in Amsterdam Crédits: G.Sipos (EGI.eu)

EGI Coordonnée par une organisation à but non lucratif (EGI.eu) basée à Amsterdam Partenariats et interopérations au-delà de l’Europe EGI Resources 364 resource centres 630 000 CPUs 375 PB storage (disk+tape)

France Grilles (FG) L’infrastructure de grille nationale (NGI) Grille de production intégrée à EGI Groupement d’intérêt scientifique (GIS) Créé en juin 2010, renouvelé en 2014 8 partenaires académiques

FG - Resources 37k logical CPUs 18.7 PB disk storage 15 PB tape storage 16 sites Grille 8 sites Cloud Les ressources sont fournies par les communautés et les partenaires

FONCTIONNEMENT GENERAL

Grid overview Image credits: http://www.adarshpatil.com

Une vue "plateforme"

La pile grille Applications Middleware Ressources Réseau Standalone Portails & gateways Applications Standalone apps Workload management User Interface Information System File catalogs Computing Element Middleware Auth. service Storage Element Cluster Serveur Ressources Disque/bande Internet public Lignes dédiées Réseaux académiques Réseau

Organisation des utilisateurs VO A Research teams Virtual Organisations (VO) VO B Virtual Research Communities (VRC) VO D In EGI (Aug.2014): - 213 VOs - 5 VRCs VO C

Pour commencer, une histoire simple Il était une fois, un chercheur qui voulait utiliser la grille pour lancer un programme compliqué (du genre ls -a)… TO DO LIST Ton calcul tu prépareras Patte blanche tu montreras Ton calcul tu soumettras Patiemment tu attendras Tes résultats tu récupèreras

Ton calcul tu prépareras Il faut créer un "job"… c'est quoi ? un exécutable ou un script qui peut être lancé sur un (ou plusieurs) CPUs pour produire un output. généralement, avec des paramètres et des données d'entrée le tout encapsulé dans une couche de description écrite en JDL (Job Description Language)

Ton calcul tu prépareras JDL = liste de type "key = value"  C'est dans le JDL que sont spécifiés tous les requirements (librairies, OS, mémoire, données, etc.) [ Executable = “ls -al”; StdError = “stderr.log”; StdOutput = “stdout.log”; OutputSandbox = {“stderr.log”, “stdout.log”}; ]

Patte blanche tu montreras Passeport = certificat X509 Délivré par une autorité reconnue (en France : Grid2FR, opérée par RENATER) Visa = Proxy L’utilisateur doit demander un proxy (délégation) à durée de vie limitée (e.g. 24h) Le service d’authentification ne délivre un proxy que si le certificat est valide et l’utilisateur est bien enregistré dans la VO correspondante Authentification mutuelle Utilisateur et service doivent prouver leur identité

Ton calcul tu soumettras Depuis où ? Une interface utilisateur en ligne de commande, un portail, un « job scheduler »… Une commande, et hop Le job est soumis au système Un mécanisme de Workload Management interroge le système d’information pour déterminer le meilleur élément de calcul (CE) disponible Le job est mis en queue sur cet élément

Patiemment tu attendras… Pendant ce temps-là : Le job a été envoyé par l’utilisateur Le système cherche la meilleure option de soumission Le job est transmis au CE Le job est en attente sur le CE Ie job tourne Il est terminé L’utilisateur a récupéré le résultat Statut du job Submitted Waiting Ready Scheduled Running Done Cleared

Tes résultats tu récupèreras Dans notre exemple, le seul résultat est le stdOut Dans la vraie vie, le "vrai" résultat est sans doute un set de données généré et déposé sur un élément de stockage Données référencées dans un catalogue La référence est passée dans le job Output

Et en détails ? Pour plus de détails sur le fonctionnement des différents services entrant en jeu dans le scénario précédent, voir la 2nde partie de cette présentation…

LA GRILLE ET LE MONDE

Grille vs HPC GRILLE Architectures "classiques" Répartition géographique Modèle opportuniste Unité: CPU.Hours Parallélisme de données Jobs indépendants HPC Supercalculateurs Localisation géographique Modèle d’allocation Unité: Flop Parallélisme de calcul Jobs corrélés Deux outils différents pour deux besoins différents!

Bénéfices & limitations La grille est faite pour l’analyse à haut débit (HTC). Elle fonctionne bien pour : Les tâches peu couplées, non communicantes Les gros volumes de données distribuées Les collaborations et utilisateurs dispersés Les bénéfices dépendent aussi : Du niveau de support et des ressources disponibles pour la communauté considérée Du ratio entre l’effort initial pour "gridifier" le code et l’usage attendu

Bénéfices et limitations Benefits Grid Local Effort & time "gridification" overload

Quelques bénéfices Optimisation de l’utilisation des ressources Les clusters de la grille tournent à bloc Collaboration facilitée A travers le concept de VO Partage d’expertise et support Création de nouvelles communautés Faible coût économique Mutualisation et réutilisation

Quelques limites Complexité et coût d’entrée Taux d’erreur des jobs Réécriture du code, intégration des concepts… Taux d’erreur des jobs Le 100% de succès est difficile à atteindre Files d’attente Surtout pour les petites VOs Ne convient pas à tous les profils Ex: nombreux fichiers de grosse taille Jobs très courts ou très longs

Utilisation des ressources dans EGI 2004-2014 : 57 milliards d’heures CPU Equivalent à 6,5 millions d’années CPU en 10 ans 2E10 heures (2.3 millions d’années) en 2014 14% ont été utilisées sur France Grilles Source : EGI Accounting Portal

Sciences de la vie 438 millions d’heures CPU en 2014 Seulement 2% de l’utilisation totale Mais croissance exponentielle Source : EGI Accounting Portal

Sciences de la vie "medical and health sciences" 24 VOs (mai 2015) Source : EGI Operations Portal

Les utilisateurs en France 133 utilisateurs "directs" en sciences du vivant, MAIS: Certains utilisateurs font des sciences de la vie dans les VO pluri-disciplinaires D’autres sont "regroupés" derrière des portails

Questions ?