Algorithmique pour les plateformes distribuées et hétérogènes

Slides:



Advertisements
Présentations similaires
Fabrice Lauri, François Charpillet, Daniel Szer
Advertisements

CGP2P, école des mines Sous-projet V La participation du LAL au projet CGP2P DataGRID CGP2P.
« Systèmes électroniques »
Karima Boudaoud, Charles McCathieNevile
Résolution de problèmes et logiciel de calcul symbolique
Sous-projet IV Communications Placement/Ordonnancement.
Journée projet CGP2P Laboratoire ID / Projet APACHE (URM 5132) Equipe G3 Grappe & Grille de Grappe 3 Enseignant-Chercheurs 7 Doctorants DEAs.
Gabriel Antoniu IRISA / INRIA Rennes
Applications de GdX Coordinateur thématique : Christophe Cérin
A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences.
Le"cartable électronique"®
Projet FIACRE 1 ACI Sécurité InformatiqueToulouse, novembre 2004 FIACRE Fiabilité des Assemblages de Composants Répartis Modèles et outils pour lanalyse.
ACI GRID Projet JE RESAM Support Réseau et Intelligence pour la Grille Coordinateur C. Pham, Univ. Lyon 1, INRIA RESO.
1 Internet Act II Gilles Kahn Président Directeur Général, INRIA.
Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
Applications et Techniques
Stockage dans DIET Groupe de travail du 16 décembre 2002.
Architecture de réseaux
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
18 avril 2002réunion Datagrid France1 E-toile Plate-forme RNTL 2001 Environnement matériel et logiciel pour le développement et l expérimentation de grille.
B. Del-FabbroCFSE05LIFC p.1 Data Tree Manager : Un service de gestion des données persistantes pour le calcul ASP sur la grille Bruno DEL-FABBRO LIFC Besançon,
Jean-François Deverge, Sébastien Monnet
1 ACI DADDI - Réunion de lancement IRISA - Projet ADEPT Michel Hurfin Jean-Pierre Le Narzul Frédéric Tronel 23 mai 2005.
Sélection automatique d’index et de vues matérialisées
Maple, modélisation et résolution de problèmes
Monique THONNAT et Nathanaël ROTA Projet ORION
DataGRAAL DataGRid pour Animation et Applications à Large échelle
Architecture de grille générique, multi-
Chaire UNESCO - Calcul numérique intensif
Rennes, le 18 septembre 2006 Support du paradigme maître-travailleur dans les applications à base de composants Tâche 2.2 Hinde Bouziane Réunion LEGO.
Configuration de Windows Server 2008 Active Directory
SCIENCES DE L ’INGENIEUR
Interprétation de séquences dimages pour des applications MédiaSpace Alberto AVANZI François BREMOND Monique THONNAT Projet ORION INRIA de Sophia Antipolis.
1 Grille de calcul et physique des particules Vincent Garonne CPPM, Marseille Novembre 2003 Contenu de la présentation Etat de lart : Grille de calcul.
Universté de la Manouba
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
1 DataGRAAL DataGRid pour Animation et Applications à Large échelle Yves Denneulin IMAG-ID Pierre Sens LIP6 - INRIA.
Ordonnancement de tâches
WP2 Modèles de programmation
L’adaptativité pour un solveur de l’équation de Vlasov
LEGO – Rennes, 18 Septembre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de.
Nouvelles de PARIS et État d’avancement des briques Christian Perez – Toulouse – 22 octobre 2008.
IntroductionContexteAnalyseConclusionApproche Présentation d’article 04/02/04 DEA DISIC Grid Computing Monitoring Data Archive In Grid Environments GANAME.
Soutenance finale 12 mars 2004 Présenté par : Alban HERMET
Le workflow Encadré par: M . BAIDADA Réalisé par: ATRASSI Najoua
Simulation de problèmes couplés d’hydro-géologie :
Activités développées RTP 12 : Information et connaissance : "découvrir et résumer" Actions spécifiques et équipes-projets associées Objectifs thématiques.
Projet NavInc Florian Bastien Fabien Cornic Antoine Després
GDS – Paris, 13 Octobre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de M2RI.
Partage de mémoire à très grande échelle sur des réseaux pair-à-pair
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
La sécurité dans les réseaux mobiles Ad hoc
Épopée d’expériences DIET sur Grid5000
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
JTE – 2 oct DIET Une approche extensible pour les serveurs de calcul E. Caron, F. Desprez, M. Quinson, F. Suter INRIA Rhône-Alpes LIP ENS Lyon,
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
Journée scientifique 5 juin Cluster de recherche ISLE Projet « Calcul Hautes Performances et Informatique Distribuée » Proposition de renouvellement.
Modèles et protocoles de cohérence des données en environnement volatil Grid Data Service IRISA (Rennes), LIP (Lyon) et LIP6 (Paris) Loïc Cudennec Superviseurs.
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
PROJET CAPS Compilation, Architecture, Parallélisme et Système.
Bilan GDS Du côté de chez GRAAL Eddy Caron LIP ENS Lyon.
GDS : Grid Data Service Gabriel Antoniu IRISA / INRIA Rennes Réunion de lancement du projet GDS de l’ACI Masses de Données 22 septembre 2003.
Gabriel Antoniu IRISA / INRIA Rennes
1 Deux exemples de management (et d’organisation) de la recherche : le CNRS et l’INRIA Club EEA, Tours, 13 mai 2009.
COMPARAISON ENTRE GNUTELLA ET FREENET
Un service de partage de données pour DIET : GDS basé sur JuxMem Mathieu Jan Projet PARIS Lyon, 5 décembre 2003.
PaCO++ André Ribes Réunion Hydrogrid Rennes 15/09/03.
GDS : Grid Data Service Etat de l’avancement Gabriel Antoniu Réunion GDS, Lyon, 17 février 2006 IRISA, Rennes ACI Masses de Données.
Projet GDS de l’ACI MD Projet PARIS IRISA, Rennes.
Grilles de recherche Veronique Donzeau-Gouge. 2 objectifs Renforcer la présence du CNRS dans ce domaine en liaison avec : L’Institut ST2I L’INRIA, Les.
Transcription de la présentation:

Algorithmique pour les plateformes distribuées et hétérogènes LIP ENS Lyon INRIA Rhône-Alpes

Plan de la présentation Membres du projet Introduction et fondements scientifiques Présentation globale du projet Algorithmique et ordonnancement Ordonnancement pour le calcul creux Approche client-serveur pour la simulation Logiciels Collaborations régionales, nationales et internationales Contrats et projets Conclusions et perspectives

Effectifs Permanents Collaborateurs extérieurs E. Caron (MdC ENS) F. Desprez (DR2 INRIA, responsable) J.-Y. L’Excellent (CR2 INRIA) Y. Robert (Prof. ENS Lyon) F. Vivien (CR1 INRIA) Collaborateurs extérieurs J.-M. Nicod (MdC Besançon) L. Philippe (Prof. Besançon) Détachements, IE, ATER, postdocs, invités P. Combes (IE INRIA ACI GRID ASP , jusqu’à Sept. 03) – H. Dail (IE INRIA, à partir de Janv.03) G. Utard (Det. INRIA, jusqu’à Sept. 03) – A. Su (Posdoc INRIA, à partir de Janv.03) C. Pera (IE ENS RNTL GASP, , jusqu’à Juin. 04) – M. Colin (Postdoc INRIA, jusqu’à Sep. 04) C. Koch Hoffer (IE INRIA VTHD++, jusqu’à Sept. 03) Doctorants S. Dahan (B), V. Garonne (M), A. Guermouche, B. Del Fabro (B), L. Marshall, P. Kaur Chouhan, A. Legrand, M. Quinson (jusqu’à Sept. 03), H. Renard, A. Vernois

Introduction et fondements

Caractéristiques des plateformes cibles Hétérogénéité Réseaux (couches de communications multi-protocoles), processeurs, hiérarchies mémoire profondes Équilibrage des charges (ordonnancement) Distribution des données (statique et dynamique) Évaluation des performances, modélisation des architectures Simulation Dynamicité Découverte de l’architecture Distribution des données Évaluation des performances, modélisation Informations sur la charge en temps réel Réactivité !

Nouveau projet GRAAL (GRids And ALgorithms) Focalisation sur les problèmes algorithmiques dans les environnements hétérogènes et distribués Algorithmique, placement de données et ordonnancement Algorithmique pour le creux Approche client-serveur pour l’exécution distribuée Mots-clés: algorithmique + bibliothèques + applications sur les architectures hétérogènes et distribuées Un des 5 challenges de l’INRIA : « Maîtriser l’infrastructure numérique en sachant programmer, calculer et communiquer sur l’Internet et sur des réseaux hétérogènes »

Algorithmique et ordonnancement Y. Robert, F. Vivien

Algorithmique et ordonnancement : Objectifs Nécessité d'une approche théorique malgré la difficulté des problèmes d'ordonnancement (minimisation du temps d'exécution) Injecter une connaissance statique dans un environnement essentiellement dynamique Étudier l'impact des nouveaux paramètres architecturaux : hétérogénéité, volatilité, hiérarchie Évaluation des stratégies : rejouer/comparer les heuristiques contre une même charge, simulée mais réaliste

Algorithmique et ordonnancement : Résultats (1/2) Extension de ScaLAPACK aux grappes hétérogènes Nouveaux résultats de complexité Redistribution face aux variations de vitesse Publications marquantes : IEEE TC, IEEE TPDS, livre ALgoPar DIVISIBLE LOAD Maître-esclave hétérogène Algorithme multi-round : premier résultat de complexité Publications marquantes : IEEE TPDS, Parallel Computing Collaboration UCSD : H. Casanova

Algorithmique et ordonnancement : Résultats (2/2) ORDONNANCEMENT EN REGIME PERMANENT Distribution optimale de tâches indépendantes sur une plateforme complexe Extension au parallélisme mixte Approche féconde : nombreux travaux en cours Publications marquantes : IPDPS, journaux à paraître Collaboration UCSD : L. Carter, J. Ferrante SimGrid Extension à un ordonnanceur distribué Découverte et modélisation des réseaux V2 du logiciel disponible librement

Algorithmique et ordonnancement : Perspectives Grappes de grappes Équilibrage de charge avec partage de bande passante dans les réseaux ORDONNANCEMENT Heuristiques hiérarchiques et intégration DIET Boîte-à-outils maître-esclave hétérogène Tâches partageant des fichiers Réplication pour la tolérance aux pannes

Algorithmique pour le creux J.-Y. L’Excellent, G. Utard

Méthodes directes pour la résolution de systèmes linéaires creux de grande taille Résolution d’un système linéaire creux Ax=b Simulation d’un phénomène physique Méthodes directes (ex: multifrontale) A = LU ou LDLT (Gauss) Résolution : Ly = b puis Ux = y Très robustes si pivotage numérique ( structures de données dynamiques) Heuristiques de renumérotation Approches dynamiques (placement, ordonnancement) Structures de données dynamiques Dynamicité liée aux architectures parallèles actuelles Remplissage Matrice initiale

Méthodes directes : Axes de recherche (1/2) Étude des techniques de renumérotation les plus récentes AMD, AMF, SCOTCH (ScAlApplix), PORD (Univ of Paderborn), METIS (Univ of Minnesota) Impact sur le graphe de dépendance des tâches Impact sur la mémoire Impact sur les performances et le parallélisme Ordonnancements dynamiques et équilibrage de charge Grappes de multiprocesseurs Ordonnanceurs pour optimiser les accès mémoire Extension aux architectures plus hétérogènes Approches out-of-core Faire face aux défis de la simulation (taille croissante des problèmes) Factorisation + résolution (anticiper la lecture des facteurs) Très lié aux aspects ordonnancement

Méthodes directes : Axes de recherche (2/2) Accès à nos techniques de résolution au travers de la grille Mise en place en environnement client-serveur (avec DIET) Site d’expertise (portail Web) avec comparaison à distance d’une large gamme de solveurs creux (ACI GRID TLSE) Expérimentation et validation des recherches sur des problèmes industriels de grande taille Grâce à la plateforme logicielle MUMPS, diffusée dans l’industrie: Boeing, EADS, CEA, Dassault, … Rester à l’écoute des besoins des utilisateurs numériciens Maintenir une plateforme d’expérimentation compétitive Publications SIAM J. Matrix Analysis and Applications, ACM Trans. Math. Software, Comput. Methods Appl. Mech. Eng., Parallel Computing, IPDPS Collaborations ENSEEIHT-IRIT, CERFACS, PARA//AB (Norvège), NERSC (Berkeley)

Méthodes directes : Perspectives Poursuivre les collaborations industrielles accès à des problèmes réels contrats d’étude Algorithmique numérique pour le creux: out-of-core et liens avec l’ordonnancement couplage avec des méthodes itératives phase d’analyse symbolique parallèle, etc. Environnements très hétérogènes processeurs/réseaux/mémoire ordonnancements mixtes statiques/dynamiques Utilisation des ressources de la grille accès à distance aux solveurs valorisation de nos recherches (aspect vitrine) Algorithmique numérique pour le creux, … en ayant pour objectif la grille

Approche client serveur pour la simulation E. Caron, F. Desprez, J.-M. Nicod, L. Philippe Voir Eddy !

Serveurs de calculs : Objectifs Fournir de la puissance de calcul à travers l’Internet Développer une boîte-à-outils pour le déploiement d’environnements de type Application Service Provider (ASP) applications de différentes natures (dynamique moléculaire, chimie, électronique, physique, géologie, bioinformatique, compilation, …) Modèle client-agent-serveur (Remote Procedure Call pour la grille) Étudier les problèmes fondamentaux derrière la mise en place de tels environnements Ordonnancement Gestion de données Liaisons avec les intergiciels Valider les résultats théoriques par simulation (SimGrid) l’intergiciel (plateforme logicielle DIET, Distributed Interactive Engineering Toolbox) Participation au Global Grid Forum (GridRPC WG) C A S

AGENT Partie centrale des systèmes GRID-RPC Localisation importante Choisit les serveurs capables de réaliser une requête demandée par un client Équilibre la charge entre les serveurs (ordonnancement) Récupère les informations sur les serveurs disponibles Interroge la base de données de performances Localisation importante Problèmes éventuels de passage à l’échelle Peut gérer Une partie de la sécurité La tolérance aux pannes de serveurs Dans notre approche Ensemble distribué d’agents Parcours d’arbres avec informations réparties dans les nœuds pour l’approche hiérarchique Connexion à FAST pour récupérer les informations sur les ressources Différents ordonnanceurs génériques ou dépendants des applications Liaisons avec la découverte de services dans les intergiciels C S A

Ordonnancement Ordonnancement hiérarchique et distribué Étude de plusieurs connexions entre les agents (hiérarchique, distribuée, agents dupliqués, …) Heuristiques associées Déploiement automatique Placement des agents en fonction des caractéristiques de l’architecture cible (hiérarchie de réseaux, variations de performances, dynamicité) Parallélisme mixte Association du parallélisme de données et du parallélisme de tâches Ordonnancement des requêtes une à une (ordo. Online) ou d’un flot de requêtes (connaissance « statique » des dépendances et graphe de l’application) Connexion pair-à-pair des ordonnanceurs Connexion totalement dynamique au vol (dynamicité de la plateforme, tolérance aux pannes) PASTRY, CHORD, CAN Publications : Parallel Computing, CCPE, PDCP, IPDPS, EuroPAR, HiPC, ICPP Collaborations : GRAIL/UCSD, LaRIA, ALGORILLE E. Caron, F. Desprez, J.-M. Nicod, Y. Robert, F. Vivien

Gestion des données Accès aux données Sources : Privées (client), Partagées (serveur dédié) Temps d'accès ? Infrastructure de stockage intermédiaire Espaces de stockage réservés sur les nœuds de calcul plus mécanismes de transfert optimisés (GASS) Réseau parallèle de stockage (IBP) Stratégies d'optimisation : réplication, migration, persistance Problématiques : localisation, sécurité, intégrité, prédiction Axes de recherche : Intégration des infrastructures de stockage : interaction avec l'ordonnancement (sélection de nœuds de calcul, demande de réplication/migration) Gestion de données modifiables (cohérence, ACI MD GDS) Publications : Parallel Computing, IPDPS, CCGRID Collaborations : LaRIA, LRI Le point d'accès unique aux données est le goulot d'étranglement Des systèmes de stockage distribué sur/pour la grille ont donc été conçus pour améliorer les accès. Principe de base : la réplication des data sur des serveurs rapides/proches. On compte donc étudier ces infrastructures ainsi que leur intégration dans un NES telle que DIET. Les problèmes principaux qui se poserons concernera celui du placement (ordonné un réplication/migration) et la determination des temps d'accès (nature dynamique du réseau). Tous ces infrastructures ne proposent que des accès a des objet read only, et ne permettent pas de modifier des réplicats. Dans le cadre de la proposition d'ACI MD GDS, nous voulons étudier la faisabilité d'introduire des objets modifiables et les problèmes de cohérence qui en découle. E. Caron, J.-M. Nicod, L. Philippe, G. Utard

Évaluation de nouvelles technologies logicielles Relations fortes entre d’une part les couches logicielles utilisées pour développer les environnements et les applications et d’autre part les algorithmes et heuristiques utilisées Modélisation des comportements réseau Modélisation des architectures cibles (hiérarchie) Modélisation des diverses couches logicielles Modèles existants pour les approches CORBA (utilisé dans DIET) Autres modèles ? Nouvelles technologies utilisées dans les grilles (Web Services (OGSA), JXTA, composants, …) Important de surveiller l’évolution des intergiciels pour nos propres développements F. Desprez, L. Philippe

Logiciels Scilab// DIET MUMPS SimGrid Version parallèle de Scilab (PVM, PBLAS, ScaLAPACK, NetSolve, DIET) Surcharge des opérateurs DIET Toolkit pour applications utilisant des serveurs de calcul distribués API pour l’ajout de nouvelles applications FAST (Fast Agent System Timer) pour l’évaluation de la plateforme MUMPS Solveur creux par méthode multifrontale Collaboration avec le CERFACS, l’ENSEEIHT-IRIT et PARA//AB Plateforme d’expérimentation et de valorisation SimGrid Toolkit de simulation à événements discrets pour la simulation d’heuristiques d’ordonnancement Insertion de traces réelles Amélioration dans GRAAL (simulation d’agents communicants) En collaboration avec UCSD

Contrats et projets nationaux ARC INRIA RedGRID : redistribution de données en environnement hétérogène ACI Grid ASP : déploiement d’applications sur plateforme DIET TLSE : site d’expertise pour les matrices creuses DataGRAAL : gestion de données dans les grilles CGP2P : approche calcul global (XtremWeb) GRIPPS : recherche de motifs en bioinformatique GRID2 : animation ARGE : fédération des travaux dans le grand est ACI Grandes Masses de Données GDS : Gestion de données à grande échelle Grid Explorer Plateforme de simulation RNTL GASP : développement de la plateforme DIET (avec Sun Labs Europe) RNRT VTHD++ : validation de la plateforme réseau avec nos applications PSMN et Fédération lyonnaise de calcul En cours de soumission : GRID 5000, RNTL eGuilde

Contrats et projets nationaux, européens et internationaux NSF/INRIA University of Minnesota, University of Indiana, NESRC, ScAlApplix, ALADIN, ENSEEIHT-IRIT préconditionneurs parallèles University of Tennessee environnements pour la grille University of California San Diego ordonnancement hétérogène Équipe Associée INRIA GRAIL (UCSD) Ordonnancement pour les plateformes hétérogènes Simulation et validation de DIET avec SimGrid Échange de chercheurs et organisation workshop STAR Korée Déploiement de DIET sur une grille nationale + applis Programme Franco-Bavarois LRR Lab., TUM (Munich) Monitoring grille et application de bioinformatique Réseau d’excellence CoreGRID (6ème PRCD)

Collaborations nationales et internationales Laboratoires étrangers University of Tennessee Knoxville, USA University of California San Diego, USA NESRC, Lawrence Berkeley Laboratory, USA PARALLAB, University of Bergen, Norvège TUM Munich, Allemagne University of Sains, Malaisie Projets INRIA APACHE (Rhône-Alpes) ARES (Rhône-Alpes) RESO (Rhône-Alpes) Résédas/ALGORILLE (Lorraine), ALADIN (IRISA) PARIS (IRISA), Métalau (Rocquencourt) ScAlApplix (Futur) Laboratoires français Université de Franche-Comté LaRIA (Amiens) ENSEEIHT-IRIT, CERFACS (Toulouse) LSIIT (Strasbourg) IBCP PSMN

Positionnement au sein de l’INRIA APACHE (INRIA Rhône-Alpes) Collaboration existante avec l’équipe de D. Trystram autour de l’ordonnancement Intérêt pour le déploiement automatique de logiciels SARDES (INRIA Rhône-Alpes) Utilisation des résultats de SARDES autour des intergiciels pour les plateformes distribuées ObjectWeb PARIS (INRIA-IRISA) Réutilisation de leurs développements autour de Grid Enabled Corba Plusieurs collaborations en cours (ARC INRIA, ACI GMD) ALGORILLE (Lorraine) Approches différentes (modélisation des applications vs heuristiques d’ordo) Plusieurs collaborations en cours (ARC INRIA, ACI GRID, RNTL) Grand Large (Futur) Approches différentes (calcul global dans son ensemble pour Grand Large) Collaborations existantes (CGP2P) et possibles (ordonnancement, sécurité, tolérance aux pannes, découverte de services) ScAlApplix (Futur) Approches différentes (ordonnancement statique vs dynamique), autres applications Collaborations existantes (MUMPS/Pastix, renumérotations, ARC INRIA)

Conclusions

Conclusions Des aspects intergiciels pour les plateformes distribuées et hétérogènes …. … aux aspects fondamentaux de l’algorithmique parallèle hétérogène et de l’ordonnancement Implications importantes dans les projets de grilles nationaux, européens et internationaux Visibilité nationale et internationale Rester proche des applications: calcul numérique « classique » mais aussi d’autres domaines (data-intensive) Collaborations industrielles autour des grilles de calcul

But ultime Problem Solving Environments Plus de transparence, généricité, sécurité Unification des couches logicielles (Grid Forum) Couplage algorithmique et modèles avec les supports d’exécution et les architectures Pouvoir traiter à la fois les données et les calculs Virtual Data Tools Request Planning and Scheduling Tools Request Execution Management Tools Transforms Distributed resources (code, storage, computers, and network) Resource Management Services Security and Policy Other Grid Interactive User Tools Production Team Individual Investigator Other Users Raw data source

Domaines d’applications Applications des solveurs creux Dynamique moléculaire Modèles numériques de terrain Simulation de circuits électroniques Biochimie Physique Bioinformatique Compilation à distance