1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France
Grid Computing 2
Il n'existe pas de définitions très précises des grilles de calcul. Plaszczak/Wellner définissent la grille de calcul comme la technologie qui permet la virtualisation de ressources à la demande, et le partage entre plusieurs organisations IBM définit le calcul en grille comme une méthode utilisant une panoplie de protocoles standards pour avoir l'accès aux applications et aux données, à la puissance de calcul, à la capacité de stockage entre un vaste réseau de ressources informatiques à travers Internet Une autre définition de la grille de calcul est donnée par Fernando Corbató du MIT. Lui et les autres concepteurs du système d'exploitation Multics envisageaient le système comme une entreprise fournisseur d'énergie ou une compagnie des eaux. Buyya définit la grille comme un type de système parallèle et distribué qui permet le partage, la sélection, et l'agrégation de ressources autonomes géographiquement distribués dynamiquement. Chacune de ces ressources ont leur propre disponibilité, capacité, performance, coût, et utilisateurs, avec leurs propres contraintes de qualité de service. Le CERN (European Organization for Nuclear Research), un des plus gros consommateurs de puissance de calcul à travers la technologie du Grid Computing, la définit comme un service pour le partage de puissance informatique et de capacité de stockage à travers l'Internet. Il n'existe pas de définitions très précises des grilles de calcul. Plaszczak/Wellner définissent la grille de calcul comme la technologie qui permet la virtualisation de ressources à la demande, et le partage entre plusieurs organisations IBM définit le calcul en grille comme une méthode utilisant une panoplie de protocoles standards pour avoir l'accès aux applications et aux données, à la puissance de calcul, à la capacité de stockage entre un vaste réseau de ressources informatiques à travers Internet Une autre définition de la grille de calcul est donnée par Fernando Corbató du MIT. Lui et les autres concepteurs du système d'exploitation Multics envisageaient le système comme une entreprise fournisseur d'énergie ou une compagnie des eaux. Buyya définit la grille comme un type de système parallèle et distribué qui permet le partage, la sélection, et l'agrégation de ressources autonomes géographiquement distribués dynamiquement. Chacune de ces ressources ont leur propre disponibilité, capacité, performance, coût, et utilisateurs, avec leurs propres contraintes de qualité de service. Le CERN (European Organization for Nuclear Research), un des plus gros consommateurs de puissance de calcul à travers la technologie du Grid Computing, la définit comme un service pour le partage de puissance informatique et de capacité de stockage à travers l'Internet. 3 Source :
Grid Computing Mais la définition « finale » est probablement celle fournie par Ian Foster dans son article « What is a Grid? A Three Point Checklist » Les trois points quil définit sont : Des ressources informatiques dont ladministration nest pas centralisée, Des méthodes utilisées qui sont standardisées, Des ressources dont la qualité de service nest pas assurée. Mais la définition « finale » est probablement celle fournie par Ian Foster dans son article « What is a Grid? A Three Point Checklist » Les trois points quil définit sont : Des ressources informatiques dont ladministration nest pas centralisée, Des méthodes utilisées qui sont standardisées, Des ressources dont la qualité de service nest pas assurée. Source :
Grid Computing : une tentative de définition Une grille informatique ou Grid est une infrastructure virtuelle constituée d'un ensemble coordonné de ressources informatiques potentiellement partagées, distribuées, hétérogènes, externalisées et sans administration centralisée Une grille est donc une infrastructure matérielle et logicielle qualifiée de virtuelle car les relations entre les entités qui la composent n'existent pas matériellement mais numériquement Une grille garantit des qualités de service non- triviales, c'est-à-dire qu'elle se distingue des autres infrastructures dans son aptitude à répondre adéquatement à des exigences (accessibilité, disponibilité, fiabilité,...) compte tenu de la puissance de calcul ou de stockage qu'elle représente Une grille informatique ou Grid est une infrastructure virtuelle constituée d'un ensemble coordonné de ressources informatiques potentiellement partagées, distribuées, hétérogènes, externalisées et sans administration centralisée Une grille est donc une infrastructure matérielle et logicielle qualifiée de virtuelle car les relations entre les entités qui la composent n'existent pas matériellement mais numériquement Une grille garantit des qualités de service non- triviales, c'est-à-dire qu'elle se distingue des autres infrastructures dans son aptitude à répondre adéquatement à des exigences (accessibilité, disponibilité, fiabilité,...) compte tenu de la puissance de calcul ou de stockage qu'elle représente 5 Daprès
Grid Computing : une tentative de définition (suite) Une grille se compose de ressources informatiques : tout élément qui permet lexécution d'une tâche ou le stockage dune donnée numérique Cette définition inclut bien sûr les ordinateurs personnels, mais aussi en théorie les téléphones portables et tout objet qui présente un composant informatique Une grille se compose de ressources informatiques : tout élément qui permet lexécution d'une tâche ou le stockage dune donnée numérique Cette définition inclut bien sûr les ordinateurs personnels, mais aussi en théorie les téléphones portables et tout objet qui présente un composant informatique 6 Daprès
Grid Computing : une tentative de définition (suite) Ces ressources sont potentiellement qualifiées de : Partagées : elles sont mises à la disposition des différents consommateurs de la grille et éventuellement pour différents usages applicatifs Distribuées : elles sont situées dans des lieux géographiques différents Hétérogènes : elles sont de toute nature, différant par exemple par le système d'exploitation ou le système de gestion des fichiers Coordonnées : les ressources sont organisées, connectées et gérées en fonction de besoins (objectifs) et contraintes (environnements). Ces dispositions sont souvent assurées par un ou plusieurs ordonnanceurs Externalisées : les ressources sont accessibles à la demande chez un fournisseur externe Non-contrôlées (ou autonomes) : les ressources ne sont pas contrôlées par une unité commune. Contrairement à un cluster, les ressources sont hors de la portée d'un moniteur de contrôle Ces ressources sont potentiellement qualifiées de : Partagées : elles sont mises à la disposition des différents consommateurs de la grille et éventuellement pour différents usages applicatifs Distribuées : elles sont situées dans des lieux géographiques différents Hétérogènes : elles sont de toute nature, différant par exemple par le système d'exploitation ou le système de gestion des fichiers Coordonnées : les ressources sont organisées, connectées et gérées en fonction de besoins (objectifs) et contraintes (environnements). Ces dispositions sont souvent assurées par un ou plusieurs ordonnanceurs Externalisées : les ressources sont accessibles à la demande chez un fournisseur externe Non-contrôlées (ou autonomes) : les ressources ne sont pas contrôlées par une unité commune. Contrairement à un cluster, les ressources sont hors de la portée d'un moniteur de contrôle Daprès
Grid Computing : une tentative de définition (suite) L'expression grille de calcul est parfois employée alors que d'autres termes conviennent mieux. Il est nécessaire de distinguer les concepts suivants : Cluster : ensemble de machines homogènes et localisées, organisées en grappe. Grille : ensemble de ressources hétérogènes et délocalisées (ordinateurs, serveurs, clusters,...). Une grille de calcul intègre un intergiciel (middleware) : l'ensemble des couches réseaux et services logiciels qui permettent le dialogue entre les différents composants d'une application répartie. L'intergiciel masque la complexité des échanges inter-applications. Le desktop grid est une forme de grille de calcul. Il s'agit d'exploiter pleinement l'ensemble des ressources inutilisées de PC tout à fait classique. L'expression grille de calcul est parfois employée alors que d'autres termes conviennent mieux. Il est nécessaire de distinguer les concepts suivants : Cluster : ensemble de machines homogènes et localisées, organisées en grappe. Grille : ensemble de ressources hétérogènes et délocalisées (ordinateurs, serveurs, clusters,...). Une grille de calcul intègre un intergiciel (middleware) : l'ensemble des couches réseaux et services logiciels qui permettent le dialogue entre les différents composants d'une application répartie. L'intergiciel masque la complexité des échanges inter-applications. Le desktop grid est une forme de grille de calcul. Il s'agit d'exploiter pleinement l'ensemble des ressources inutilisées de PC tout à fait classique. Daprès
La Globus Alliance et le Globus Toolkit La Globus Alliance est une « Organisation Virtuelle » qui a pour but d'aider le monde scientifique, la recherche, les entreprises à créer des applications basées sur le Grid Computing. L'architecture de grille permet à plusieurs entités de collaborer, de mettre en commun leurs ressources informatiques. La Globus Alliance s'étend du laboratoire national d'Argonne (Etats-Unis, Illinois) en passant par l'université de l'institut des sciences de l'information de la Californie méridionale (Etats-Unis), l'université de Chicago (Etats- Unis),le centre national pour les applications de « Supercomputing » NCSA, Arlington en Virginie, Etats- Unis), l'université d'Edimbourg (Ecosse), et enfin vers le centre suédois pour les ordinateurs mis en parallèle (Linköping, Suède). La Globus Alliance est une « Organisation Virtuelle » qui a pour but d'aider le monde scientifique, la recherche, les entreprises à créer des applications basées sur le Grid Computing. L'architecture de grille permet à plusieurs entités de collaborer, de mettre en commun leurs ressources informatiques. La Globus Alliance s'étend du laboratoire national d'Argonne (Etats-Unis, Illinois) en passant par l'université de l'institut des sciences de l'information de la Californie méridionale (Etats-Unis), l'université de Chicago (Etats- Unis),le centre national pour les applications de « Supercomputing » NCSA, Arlington en Virginie, Etats- Unis), l'université d'Edimbourg (Ecosse), et enfin vers le centre suédois pour les ordinateurs mis en parallèle (Linköping, Suède). 9
La Globus Alliance et le Globus Toolkit Elle développe et essaie de standardiser la technologie quest le Grid Computing au moyen de son middleware vedette le « Globus Toolkit ». Comme son nom l'indique cest une boîte à outils (modules, bibliothèques) de type middleware développée en C et en Java, qui permet de créer une architecture de grille et de développer des applications basées sur la technologie du Grid Computing. Le Globus Toolkit est à la base de nombreux projets dans le monde scientifique et des entreprises Elle développe et essaie de standardiser la technologie quest le Grid Computing au moyen de son middleware vedette le « Globus Toolkit ». Comme son nom l'indique cest une boîte à outils (modules, bibliothèques) de type middleware développée en C et en Java, qui permet de créer une architecture de grille et de développer des applications basées sur la technologie du Grid Computing. Le Globus Toolkit est à la base de nombreux projets dans le monde scientifique et des entreprises 10
Le Globus Toolkit Plus dinformation en
Quelques projets emblématiques Astronomie Sloan Digital Sky Survey National Virtual Observatory Chimie CMCSCMCS (Collaboratory for the Multi-scale Chemical Science) Génie Civil NEESNEES (Network for Earthquake Engineering Simulation) Climatologie LEADLEAD (Linked Environments for Atmospheric Discovery) Earth System Grid Ecologie LTERLTER (Long Term Ecological Research) Médecine BIRNBIRN (Biomedical Informatics Research Network) Astronomie Sloan Digital Sky Survey National Virtual Observatory Chimie CMCSCMCS (Collaboratory for the Multi-scale Chemical Science) Génie Civil NEESNEES (Network for Earthquake Engineering Simulation) Climatologie LEADLEAD (Linked Environments for Atmospheric Discovery) Earth System Grid Ecologie LTERLTER (Long Term Ecological Research) Médecine BIRNBIRN (Biomedical Informatics Research Network)
Quelques projets emblématiques Océanographie LOOKINGLOOKING (Laboratory for the Ocean Observatory Knowledge INtegration Grid) Physique LIGOLIGO (Laser Interferometer Gravitational- Wave Observatory) Particle Physics Data Grid EGEE Géologie SCECSCEC (Southern California Earthquake Center) Océanographie LOOKINGLOOKING (Laboratory for the Ocean Observatory Knowledge INtegration Grid) Physique LIGOLIGO (Laser Interferometer Gravitational- Wave Observatory) Particle Physics Data Grid EGEE Géologie SCECSCEC (Southern California Earthquake Center)
© 2007 Microsoft France Votre potentiel, notre passion TM