La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

JTE – 2 oct. 2001 DIET Une approche extensible pour les serveurs de calcul E. Caron, F. Desprez, M. Quinson, F. Suter INRIA Rhône-Alpes LIP ENS Lyon,

Présentations similaires


Présentation au sujet: "JTE – 2 oct. 2001 DIET Une approche extensible pour les serveurs de calcul E. Caron, F. Desprez, M. Quinson, F. Suter INRIA Rhône-Alpes LIP ENS Lyon,"— Transcription de la présentation:

1

2 JTE – 2 oct. 2001 DIET Une approche extensible pour les serveurs de calcul E. Caron, F. Desprez, M. Quinson, F. Suter INRIA Rhône-Alpes LIP ENS Lyon, France E. Fleury, E. Jeannot INRIA Lorraine LORIA Nancy, France S. Contassot, F. Lombard, J.-M. Nicod, L. Philippe LIFC Besançon, France

3 JTE – 2 oct. 2001 Le futur du calcul parallèle : distribué et hétérogène Metacomputing/Grid Computing = Utiliser des ensembles distribués de plates-formes hétérogènes Le Network Computing aujourd’hui ! –Grappes de machines SMP avec des processeurs rapides, des réseaux rapides (et peu coûteux), des logiciels (pratiquement) matures De nombreux projets (Trop?) Cible: plusieurs applications dans de nombreux domaines (pas uniquement que des applications numériques ou embarrassingly parallel) Quelques problèmes importants: –algorithmiques (distribution des données, équilibrage des charges, algorithmes tolérants à la latence,...) –systèmes (administration, tolérance aux pannes, sécurité, localisation de ressources, …) –logiciels (intéropérabilité, réutilisation de code,...) èGrid forum INTRODUCTION

4 JTE – 2 oct. 2001 Une idée à long terme pour le Metacomputing: louer de la puissance de calcul et de la capacité mémoire à travers l’Internet Très grand potentiel Nécessité d’avoir des Problem Solving Environments (PSEs) et des ASP (Application Service Provider) Les applications ont toujours besoin de plus de puissance de calcul et de capacité mémoire Certaines bibliothèques ou codes propriétaires doivent rester sur place Des données confidentielles ne doivent pas circuler sur le réseau è Utilisation de serveurs de calculs accessibles à travers une interface simple  Toujours difficiles à utiliser pour les non-spécialistes  Pratiquement pas de transparence  Les problèmes de sécurité et d’accounting ne sont généralement pas traités  Souvent des PSEs dépendants d’une application  Pas de standards (CORBA, JAVA/JINI, sockets, …) pour construire les serveurs de calcul INTRODUCTION, suite

5 JTE – 2 oct. 2001 Network enabled solvers –Netsolve (University of Tennessee, USA) –NINF (Electrotechnical Lab, Umezono, JP) –Remote Computation System (ETH Zürich, CH) –Meta-NEOS (Argonne National Lab.) Problem Solving Environments –Information Power Grid (NASA) –Parallel Simulation User Environment (Univ. of Wales, UK) Accès à des serveurs via le Web –Virtual Distributed Computing Environment (Syracuse Univ.) –WebFLOW (Syracuse Univ.) De nombreux projets (visualisation distribuée, travail coopératif, éducation à distance, environnement de simulation dépendant d’applications,...) Efforts logiciels proches –GrADS, Globus, Legion, APPLEs, Nimrod-G, DISCWorld, CoG toolkit Projets proches

6 JTE – 2 oct. 2001 AGENT(s) AC S1 S2 S3S4 Client A, B, C Réponse (C) S2 ! Requête Op(C, A, B) Big picture

7 JTE – 2 oct. 2001 Sécurité –Comptes et accès utilisateurs –Transferts de données Tolérance aux pannes –Serveurs ou agents Intéropérabilité –Description de problèmes –Redistributions de données entre les serveurs Check-pointing –E/S parallèles rapides –Garbage collection Scalabilité –Hiérarchie de serveurs/d’agents Localisation de ressource –Matérielle et logicielles Ordonnancement –Ordonnancement on-line d’ordonnancements off-line Partage de serveurs entre des utilisateurs –Problèmes de sécurité –Lock/unlock, consistence de données, race conditions Evaluation de performances –Hétérogénéité –Systèmes batch Visualisation de données –Problèmes de scalabilité Problèmes reliés

8 JTE – 2 oct. 2001 Idées –Scilab comme une première application cible –Pour simplifier l’utilisation de nouvelles bibliothèques (bibliothèques pour les problèmes manipulant des matrices creuses) –Pour bénéficier des développements actuels autour du metacomputing –Développer un toolkit pour les serveurs de calcul Premier prototype développé à partir de logiciels existants –Netsolve (Université du Tennessee) –NWS (UCSD et UTK) pour l’évaluation dynamique de performances –Nos développements sur les bibliothèques (routines de redistribution, solveurs creux, routines pour l’out-of-core) –LDAP pour la base de donnée logicielle et CORBA pour la gestion des serveurs Notre première vue des serveurs de calcul

9 JTE – 2 oct. 2001 Ajouter des fonctionnalités à Netsolve pour notre application –Persistance des données sur les serveurs –Redistribution et parallélisme entre les serveurs –Meilleure évaluation des paires [routine, machine] pour les calculs à grain fin –Amélioration de l’ordonnanceur (tester des heuristiques d’ordonnancement on-line) –Base de donnée portable des bibliothèques disponibles (LDAP) Avoir une plate-forme d’expérimentation pour nos developpements –Approche à parallélisme mixte (parallélisme de données et parallélisme de tâches) –Heuristiques d’ordonnancement pour les tâches data-parallèles –Algorithmes parallèles sur des plates-formes hétérogènes –Evaluation de performances –Gestion des serveurs avec CORBA –Visualisation interactive de données distribuées NSF-INRIA avec l’Université du Tennessee Nos premiers buts

10 JTE – 2 oct. 2001 Réseau rapide entre les URs INRIA (2.5 Gb/s) et plusieurs autres centres de recherche Connecter plusieurs grappes de PCs, SGI O2K, et des salles de réalité virtuelle Plate-forme de test pour nos développements Projet RNRT Plusieurs projets de metacomputing –objets CORBA parallèles, –environnements de metacomputing et couches de communication multi-protocoles, –serveurs de calculs, –Couplage de codes, réalité virtuelle,... VTHD

11 JTE – 2 oct. 2001 Netsolve sur VTHD Agent ScilabClients Serveurs

12 JTE – 2 oct. 2001 S2 S3 Système batch S1 Ord. local AGENT Ordon. Serveur de visualization BD logicielle (distribuée) BD de performances (distribuée) AGENT Ordon. AGENT Ordon. C, Fortran, Java Connexion directe Big picture améliorée

13 JTE – 2 oct. 2001 Système de nommage de ressources logicielles Pour être capable de dire à l’ordonnanceur –Quels serveurs sont capables de réaliser quelle opération (en utilisant quelle bibliothèque) –Quels sont les utilisateurs de l’environnement (et les opérations qu’ils effectuent) –Où sont les données génériques Utilisation de LDAP (Lightweight Directory Access Protocol) Avantages et inconvénients de LDAP: Distribué Hiérarchique Protocole ouvert, standard  Optimisé pour la lecture (pas pour la mise à jour) SLiM: Scientific Libraries Metaserver

14 JTE – 2 oct. 2001 Evaluation de performances sur la plate-forme pour être capable de trouver un serveur efficace (en tenant compte des coûts de redistribution et de calcul) sans tester toutes les configurations  base de données de performances pour l’ordonnanceur Basé sur NWS (Network Weather Service) Performances de calcul –charge, capacité mémoire et performances des queues de batch (dynamique) –Tests exhaustifs des bibliothèques disponibles (statique) Performances de communication –Etre capable de trouver le coût des redistributions de données entre deux serveurs en fonction de l’architecture réseau et des informations dynamiques –Bande-passante et latence (hiérarchique) Ensemble hiérarchique d’agents –Problèmes de scalabilité A B C FAST: Fast Agent’s System Timer

15 JTE – 2 oct. 2001 Application cliente API de FAST Acquisition de données statiques Acquisition De données dynamiques FAST Soft. bas niveau LDAPBDBNWS... SLiM et FAST SLiM Machine Capacité mem. Vitesse CPU Système batch Réseau Bande-passante Latences Topologie Protocoles Calcul Capacité Temps d’exécution sur une archi. donnée Machine Statut (up ou down) Charge Mémoire Statut de la queue de batch Réseau Bande-passantes Latences

16 JTE – 2 oct. 2001 Améliorations de NWS - temps de réponse

17 JTE – 2 oct. 2001 Améliorations de NWS - collaboration avec l’ordonnanceur Exécution d’une tâche Temps idle

18 JTE – 2 oct. 2001 Architecture générale de DIET Composants : CRD : Computational Resource Daemon SeD : Server Daemon LA : Leader Agent MA : Master Agent ReD : ReDirector Outils associés : SLiM : Scientific Libraries Metaserver FAST : Fast Agent’s System Timer

19 JTE – 2 oct. 2001 MA ReD MA LA Architecture hiérarchique pour une meilleure scalabilité Informations distribuées dans l’arbre Ordonnanceurs plug-in Localisation du Master Agent le plus proche Connexion directe front end du serveur Master Agent Architecture hiérarchique pour VTHD

20 JTE – 2 oct. 2001 Initialisation du système ReD C 1 - Enregistrement auprès du ReD 2 - Connexion du LA au MA LA 3 - Démarrage d’un SeD LA 4 - Ajout d’un second LA et de ses SeDs 5 - Interrogation du ReD 6 - Adresse du « meilleur » MA 7 - Connexion du client au MA MA

21 JTE – 2 oct. 2001 Traitement d’une requête Client F(A,B) ? MA LA1LA2LA3 LA11LA12 S111S112S121 S122 S123 S21S31S32 ABF( ) F(A,B) NomDeProblème Attributs : param 1 … param n param 1 param n

22 JTE – 2 oct. 2001 Évaluation des temps MA LA1LA2LA3 LA11LA12 S111S112S121 S122 S123 S21S31S32 A B F( ) MonNom Données : Localisation TempsVersMoi Localisation TempsVersMoi Calcul :Nom tCalc tComm Nom tCalc tComm Retour de toutes les informations provenant des serveurs Critère de choix : serveur le plus rapide – Autres critères possibles : le plus près (dans la hiérarchie), le moins chargé, le plus ou le moins spécialisé, le moins cher…

23 JTE – 2 oct. 2001 Couches de communications Sockets Disponibilité, portabilité et performances Compatibilité et réutilisation (Ninf, NetSolve)  Pas toujours performant  Limitation par le système d’exploitation Réseau StubSkel Stub Interface Commune Interface Commune Code Commun Code Commun Sockets Composant 1 Composant 2 CORBA Interopérabilité, évolutivité, maintenabilité et performances Modèle client-serveur  Pas toujours disponible  Un peu lourd …

24 JTE – 2 oct. 2001 Technologie Java technology pour le portal supercomputing –Utilisation de Jini pour l’enregistrement de serveurs, lookup service, … –Connexion Java/CORBA connexion pour de meilleures performances –Java/Jini/JMX, Sun Grid Engine Jini Lookup Service Service Registrations in Lookup Service... WWW Browser... Java program... Jini-enabled Connection Services Proxy Application Level Gateway Local ports Mobile client Computational server Proxy Registration La suite ?

25 JTE – 2 oct. 2001 ACI GRID Grid-ASP Appli 1 : modélisation numérique de terrain (LST, ENS Lyon) Appli 2 : simulation de circuits électroniques (IRCOM) Appli 3 : chimie Appli 4 : physique (Lab. Physique Lyon 1, Lab. Physique ENS Lyon, LAN Lyon 1) Applications  CNES 2001 - distribution Spot Image

26 JTE – 2 oct. 2001 Développement d’un ensemble d’outils portables pour bâtir des environnements de type ASP Multi-applications, multi plate-formes et multi-interfaces Focalisation sur des problèmes tels que la localisation de ressources, l’ordonnancement, l’algorithmique, l’analyse de performances, les clients et les applications mobiles Intégration de CORBA et Java Validations sur diverses « vraies » applications Portabilité Open-source RNTL GASP Grid forum Conclusions et travaux futurs http://www.ens-lyon.fr/~desprez/DIET/

27 JTE – 2 oct. 2001 Sécurité –Comptes et accès utilisateurs –Transferts de données Tolérance aux pannes –Serveurs ou agents Intéropérabilité –Description de problèmes –Redistributions de données entre les serveurs Check-pointing –E/S parallèles rapides –Garbage collection Scalabilité –Hiérarchie de serveurs/d’agents Localisation de ressources –Matérielles et logicielles Ordonnancement –Ordonnancement on-line d’ordonnancements off-line Partage de serveurs entre des utilisateurs –Problèmes de sécurité –Lock/unlock, consistence de données, race conditions Evaluation de performances –Hétérogénéité –Systèmes batch Visualisation de données –Problèmes de scalabilité Travaux à court terme

28 JTE – 2 oct. 2001 Stages DESS, DEA Postdocs ou ingénieurs de recherche sur les projets RNTL GASP, ACI Grid GridASP ou RNRT VTHD++ On embauche !

29 JTE – 2 oct. 2001 Stages DESS, DEA Postdocs ou ingénieurs de recherche sur les projets RNTL GASP, ACI Grid GridASP ou RNRT VTHD++ On embauche !


Télécharger ppt "JTE – 2 oct. 2001 DIET Une approche extensible pour les serveurs de calcul E. Caron, F. Desprez, M. Quinson, F. Suter INRIA Rhône-Alpes LIP ENS Lyon,"

Présentations similaires


Annonces Google