Pr. Alain Greiner (LIP6 - ASIM) Daniel Millot, Philippe Lalevee (INT)

Slides:



Advertisements
Présentations similaires
Semaine 5 Couche Liaison de données Cours préparé par Marc Aubé
Advertisements

17ème Forum sur les Impédances Electrochimiques, 31/01/05, Paris
LES NOMBRES PREMIERS ET COMPOSÉS
Le moteur
Fabrice Lauri, François Charpillet, Daniel Szer
Non linéarités liées à la thermique
Institut Supérieur d'Informatique
LIRMM 1 Journée Deuxièmes années Département Microélectronique LIRMM.
ACTIVITES Le calcul littéral (3).
Les Prepositions.
26/03/2017 Fonctionnement d ’un cluster sous AIX grâce à HACMP : High Availability Cluster Multi-Processing Raphaël Bosc, IR5.
Architecture de réseaux
Performances 1 Évolution : Performance. Performances 2 Évolution : Mémoire.
A abstraction b assembleur c nombre binaire d bit e cache f UC g puce h compilateur i famille dordinateurs j contrôle k chemin de données l défaut m dé
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
Sélection automatique d’index et de vues matérialisées
wireless sensor networks
Topic: CP Advanced Name: P. BRASSIER Department: A&D.
Page 1 Introduction à ATEasy 3.0 Page 2 Quest ce quATEasy 3.0? n Ensemble de développement très simple demploi n Conçu pour développer des bancs de test.
Application des algorithmes génétiques
Gestion des Périphériques
Classification Multi Source En Intégrant La Texture
2-1 CIRCUITS ÉLECTRIQUES SIMPLES
Projet Master 2 Nouvelles Technologies et Handicap
La machine parallèle MPC1 Hardware, protocoles et performances Université P. & M. Curie (PARIS) Laboratoire dInformatique de PARIS6 Olivier Glück.
Principes de persistance dans les applications orienté objet
Virtual Local Area Network
LES RESEAUX DE CAPTEURS SANS-FIL
Titre : Implémentation des éléments finis sous Matlab
Informatique temps réel et réseaux de terrain – ELEC365
Optimisations de la bibliothèque de communication MPI pour machines parallèles de type « grappe de PCs » sur une primitive décriture distante Olivier Glück.
Olivier GLUCK Jérôme JEANJEAN Responsable : Philippe LALEVEE, Département INF 05/02/1999.
Interprétation de séquences dimages pour des applications MédiaSpace Alberto AVANZI François BREMOND Monique THONNAT Projet ORION INRIA de Sophia Antipolis.
PLD GHome H4214 Piccolo Thomas Gu Lei Deville Romain Huang Yachen
Programmation concurrente
Journées scientifiques GdR MOMAS 4-5 novembre Modèles et couplages
Notre calendrier français MARS 2014
Club Cast3m 21 novembre 2008 Modélisation du comportement hydromécanique post-fermeture d’une cavité souterraine remblayée N. Dufour et H. Wong DGCB,
3ème partie: les filtres
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
C'est pour bientôt.....
Veuillez trouver ci-joint
électroencéphalographie Estimation des conductivités in vivo
L’APPLICATION DE P2P DANS UN RESEAUADHOC
Le workflow Encadré par: M . BAIDADA Réalisé par: ATRASSI Najoua
LUNDI – MARDI – MERCREDI – JEUDI – VENDREDI – SAMEDI – DIMANCHE
Stage 2A CS80 pour Origin 1/28. 1) Presentation of the internship 2) The Multi-Oscillator 3) Connection-GUI’s API Conclusion Stage 2A CS80 pour Origin.
Importance du réseau dans des architectures MIMD Tout échange entre les processeurs nécessite un transfert de données via le réseau.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Modèle pédagogique d’un système d’apprentissage (SA)
Un système de gestion de tâches pour la machine parallèle MPC
La machine parallèle MPC1
1. Présentation générale du système
10 paires -. 9 séries de 3 étuis ( n° 1 à 27 ) 9 positions à jouer 5 tables Réalisé par M..Chardon.
SI Informations routières- 1 CETE-SO Les réseaux de transmission : Utilisation du Wi-Fi ‏ La collecte de l’information Formation CERPET – juin 2008 Abdelmename.
CALENDRIER-PLAYBOY 2020.
1. Présentation générale du système
Projet de stage d’année IIR4 sous le thème:
Quel est l’intérêt d’utiliser le diagramme de Gantt dans la démarche de projet A partir d’un exemple concret, nous allons pouvoir exploiter plusieurs parties.
1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )
Acquisition en laboratoire et à l’Observatoire du Pic du Midi
Relevez le numéro de votre logo préféré et adressez-le à : En cas d’hésitation, vous pouvez choisir jusqu’à 3 logos. Seront pris.
Projet Implémentation du protocole MMT sous Linux
Les réseaux locaux virtuels : VLAN
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
Modèles et protocoles de cohérence des données en environnement volatil Grid Data Service IRISA (Rennes), LIP (Lyon) et LIP6 (Paris) Loïc Cudennec Superviseurs.
1. Introduction Le traitement informatisé de données requiert un dialogue, une communication entre l’homme et la machine, et parfois, entre plusieurs.
Interface de communication pour les réseaux InfiniBand
Transcription de la présentation:

Pr. Alain Greiner (LIP6 - ASIM) Daniel Millot, Philippe Lalevee (INT) Etudes de performance sur une machine parallèle de type « Grappe de PCs » uldludpm m Encadrants : Pr. Alain Greiner (LIP6 - ASIM) Daniel Millot, Philippe Lalevee (INT)

Introduction / Sujet Lieu : LIP6 Cadre : Projet Multi-PC (MPC - 1995) Machine parallèle à faible coût Grappe de PCs reliés par un réseau haut-débit Technologie HSL développée au laboratoire Objet : études de performance à différents niveaux des couches logicielles couches basses MPC, couches hautes PVM parallélisation de la résolution de l’équation de Laplace sur un domaine 2D comparaisons avec ETHERNET 100 2

Plan de la Présentation Introduction / Sujet La machine MPC L’environnement PVM-MPC L’équation de Laplace Fast-PVM Conclusions 3

La machine MPC Architecture matérielle Architecture logicielle http://mpc.lip6.fr/ Architecture matérielle Architecture logicielle L’écriture distante Les couches basses MPC 4

Architecture matérielle (1/2) La machine MPC (1/5) Architecture matérielle (1/2) Nœuds de calcul = PCs (Bi-pentium) Machine MPC prévue pour plus de 250 nœuds Réseau HSL Réseau de contrôle : ETHERNET La technologie HSL (IEEE 1355 - 1993) Deux composants VLSI RCUBE : routeur rapide (8 liens HSL) PCI-DDC : interface avec le bus PCI - réalise l’écriture distante (accès DMA) bus PCI : 130 Mo/s - PCI-DDC : 160 Mo/s 5

Architecture matérielle (2/2) La machine MPC (2/5) Architecture matérielle (2/2) Le lien HSL lien série, point à point, bidirectionnel débit maximum : 1 Gigabit/s 6

L’écriture distante (1/2) La machine MPC (3/5) L’écriture distante (1/2) Descripteur DMA (entrée de LPE) : nœud destinataire, adresse physique locale, nb d ’octets, adresse physique distante, ... 7

L’écriture distante (2/2) La machine MPC (4/5) L’écriture distante (2/2) Caractéristiques du « Remote Write » : Zéro copie (faible latence) Récepteur actif (RDV préalable) Le récepteur ne connaît pas la taille des messages qu’il reçoit DMA  verrouillage mémoire 8

Les couches de communication MPC La machine MPC (5/5) Les couches de communication MPC 9

Plan de la Présentation Introduction / Sujet La machine MPC L’environnement PVM-MPC L’équation de Laplace Fast-PVM Conclusions 1010

L’environnement PVM-MPC Les couches PVM PVM sur la machine MPC Architecture de PVM-MPC Les communications Mesures de performances 1111

PVM : Les différentes couches Modèle à passages de messages - environnements hétérogènes Gestion de tampons utilisateur Primitives d ’émission et réception Portage au niveau de SLR/V PVM1 : gestions des tampons, pack PVM2 : transfert des fragments sur le réseau natif (appels systèmes - ex. pilote PVM-MPC) 1212

Architecture et communications PVM (2/4) Architecture et communications PVM 3.3 (Ethernet ou MPC) Architecture à démon unique (cf. Paragon) 1313

Mesures de performance PVM (3/4) Mesures de performance Prog de tests : ping-pong (100 aller-retours) 1414

Conclusions sur PVM-MPC Couches basses : SLR/V > TCP/IP défauts matériels  débit limité Communications PVM TF/TF connexion HSL permanente  bonnes perf. Communications PVM TM/TF très mauvais résultats (170 ms pour 64 K) Corruption des données sur PVM-MPC Coût des couches PVM recopies PVM (> 1 ms pour 64 K) mais SLR zéro copie 1515

Plan de la Présentation Introduction / Sujet La machine MPC L’environnement PVM-MPC L’équation de Laplace Fast-PVM Conclusions 1616

L’équation de Laplace Principe de parallélisation Méthode R&B itération de Jacobi domaine de décomposition Méthode R&B Mesures sur ETHERNET 1717

Principe de la parallélisation Laplace (1/3) Principe de la parallélisation Discrétisation  méthodes itératives Itération de Jacobi : Décomposition en bandes 1818

Méthodes R&B Décomposition en 2 phases Convergence plus rapide Laplace (2/3) Méthodes R&B Décomposition en 2 phases Phase 1 : mise à jour rouge Phase 2 : mise à jour noire Convergence plus rapide Une itération sur un esclave // Phase 1 recv(FN) calcul(FR) send(FR) calcul(IR) // Phase 2 recv(FR) calcul(FN) send(FN) calcul(IN) 1919

Mesures sur ETHERNET Pas de mesures sur PVM-MPC Laplace (3/3) Mesures sur ETHERNET Pas de mesures sur PVM-MPC Pas adapté à PVM sur des petites matrices (< 250*250) Mesures : 4 processeurs, frontières = 100, précision 0,01 SPEED-UP = Temps séquentiel sur Temps // 2020

Plan de la Présentation Introduction / Sujet La machine MPC L’environnement PVM-MPC L’équation de Laplace Fast-PVM Conclusions 2121

Fast-PVM Objectifs Sémantiques Contraintes Conclusions 2222

Objectifs de Fast-PVM Amélioration des performances Remplacement des couches actuelles  réduire le chemin critique logiciel Couches mieux adaptées à l’architecture MPC  utilisation directe de PUT Ni recopie, ni appel système PUT en mode utilisateur Sémantique proche de celle de PVM 2323

Sémantique de Fast-PVM PUT en mode utilisateur  1 seule application à la fois 1 zone d ’émission-calcul et 1 tampon de réception par (tid, mstag) 3 types de fonctions acquisition / relâchement des ressources réseau gestion des tampons (appel système) émission / réception Emission non bloquante ( PVM) 2424

Contraintes Réutilisations des mêmes tampons (structure de boucle) Fast-PVM (3/5) Contraintes Réutilisations des mêmes tampons (structure de boucle) 2 Problèmes : (exemple d’une séquence Recv/Calcul/Send) modification des données avant l’envoi effectif écrasement des données avant consommation en réception 2525

Contraintes  mécanisme de synchronisation (accusé de réception) Fast-PVM (4/5) Contraintes  mécanisme de synchronisation (accusé de réception) Par exemple : 2626

Conclusions sur Fast-PVM Adapté à un certain type d ’applications tampons statiques mécanisme de synchronisation Application type : méthode R&B Problèmes non résolus : partage des ressources réseau PUT en mode utilisateur transformation automatique de portions de code PVM mariage avec PVM 2727

Conclusion Bilan du stage Perspectives JMS pour la machine MPC Etat de fonctionnement de PVM-MPC Benchmark Laplace pour la machine MPC Etudes de nouvelles couches de communication Perspectives Exploitation de la machine MPC (JMS/PVM/PM²) Reprendre PVM-MPC Validation de Fast-PVM Projet MPC 2828