Les systèmes multiprocesseurs Ph. Sèvre le 19/12/08.

Slides:



Advertisements
Présentations similaires
GEF 435 Principes des systèmes dexploitation Les systèmes dexploitation en général (Tanenbaum 1.1 et 1.3)
Advertisements

Placement de Motifs Architecture Application Contraintes: - Charge
Montée en charge avec SQL Server 2005: bonnes pratiques & performances
Master de recherche informatique Université de Montpellier 2
LIRMM 1 Journée Deuxièmes années Département Microélectronique LIRMM.
Types des systèmes d’exploitation
Architectures Matérielles
CLUSTERING Grappe d'ordinateurs.
Présentation de l’Architecture Windows NT
PLAN du COURS Introduction Structure des Systèmes Informatiques
Objectif de l’exposé.
A abstraction b assembleur c nombre binaire d bit e cache f UC g puce h compilateur i famille dordinateurs j contrôle k chemin de données l défaut m dé
2.Les différentes architectures (Louis)
Bibliothèques Scientifiques
Modèle polyédrique: fondements et application à la parallélisation de programmes réguliers Tanguy Risset DIF 2001/2002.
NFE 107 : Urbanisation et architecture des systèmes d'information
Architecture de machines La mémoire
Architecture de machines Principes généraux
Architecture de machines La mémoire
Lordinateur, vu de lintérieur. Le processeur Dans une ville informatique que serait un ordinateur, le processeur représenterait la mairie. Le processeur.
Organisation du système d’information comptable et de gestion
ARCHITECTURE DES ORDINATEURS
Architecture d’un ordinateur
Introduction aux réseaux
Virtualisation côté serveur
Réalisée par :Samira RAHALI
Les Chipsets A QUOI ÇA SERT ?
Informatique temps réel et réseaux de terrain – ELEC365
Optimisation et parallélisation de code pour processeur à instructions SIMD multimedia François Ferrand.
Pr. Alain Greiner (LIP6 - ASIM) Daniel Millot, Philippe Lalevee (INT)
Les multiprocesseurs Jusqu’à maintenant, nous avons parlé longuement des microprocesseurs. Nous allons maintenant étudier les multiprocesseurs, comment.
Présentation du mémoire
Les systèmes multiplateformes
Module 4 : Maintenance des pilotes de périphériques
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
L’adaptativité pour un solveur de l’équation de Vlasov
Informatique 1. Les applications de l’informatique
Windows Server Virtualization
Lycée ELKHAWARIZMI De SAFI
Importance du réseau dans des architectures MIMD Tout échange entre les processeurs nécessite un transfert de données via le réseau.
Vue d'ensemble Surveillance des journaux d'événements
Module 8 : Surveillance des performances de SQL Server
© OutilsInformatique, 2014 tous droits réservés 1.Définir des termes et concepts de la gestion de réseau. 2.Comprendre les avantages d’un réseau. 3.Comprendre.
Présentation rapide d’
8INF856 Programmation sur architectures parallèles
L’ architecture système
Noyau Linux et multi-processeur sur plateforme embarquée ST50 Vendredi 18 Mars 2005 – Thomas Petazzoni.
La programmation système
D. E ZEGOUR Institut National d ’Informatique
Offre DataCenter & Virtualisation Laurent Bonnet, Architecte Systèmes Alain Le Hegarat, Responsable Marketing 24 Novembre 2009.
Séance 13 Internet.
15/02/2008 v Socle de virtualisation des serveurs Linux version du 15/02/2008.
Les différents modèles d’architecture technique
Introduction aux solutions Microsoft pour le HPC.
L'unité centrale est composé en générale de :
PaCO++ André Ribes Réunion Hydrogrid Rennes 15/09/03.
Introduction aux architectures parallèles
V- Identification des ordinateurs sur le réseau
Architecture Client/Serveur
Architecture matérielle Bilans et perspectives. Les processeurs Intel Core I7 : 6 coeurs AMD : repasse dans le vert - o processeurs Phenom 4 ou 6 coeurs.
Lyon, 24/04/2007 Portage et déploiement de l'application Climat sur Eric Maisonnave.
Les cartes graphiques Leur partie software.
Sextant RFS Consultants – Octobre Sextant Le logiciel d’assistance administrative indispensable à toute structure de plus d’une personne. Le premier.
Schémas Logiques des cartes mères utilisées dans les stations de travail Présentation réalisée par : Franck THOMAS – AFPA Angers Le but de ce diaporama.
PetaSky: Expérimentations avec HadoopDB et Hive 1 Amin Mesmoudi.
ASR5 Système pour architectures multicœurs CSC5001 : Systèmes Hautes Performances Architecte de Services informatiques Répartis Gaël Thomas
Introduction O.Legrand G. Seront. Open Handset Alliance Project Regroupement d'entreprises : –de télécommunications, –de constructeurs d’appareils mobiles,
Systèmes à microprocesseur Les mémoires
GPU sous LabVIEW eTIG_OOP_ Plan de la présentation 1.Frameworks OOP référencés 2.Performances d’accés 3.Performances de compilation 4.Erreurs.
Transcription de la présentation:

Les systèmes multiprocesseurs Ph. Sèvre le 19/12/08

Introduction Problématique : comment obtenir plus de puissance ? Processeur plus puissant : investissement lourds pour les constructeurs Solution la plus évidente : multiplier le nombre de processeurs ou le nombre de coeurs Prroblème : la linéarité –4 proc. : Puissance X 4 ? –64 proc : Puissance X ?

Notion de couplage

Les processeurs multi-coeurs plusieurs cœurs de processeurs côte-à-côte sur le silicium : le support (connectique) ne change pas. Certains éléments, (la mémoire cache) peuvent être mis en commun. Les processeurs multicœurs sont cadencés à des fréquences inférieures à celle des monoprocesseurs, d'où une consommation et un dégagement de chaleur réduit. remplacent N processeurs Sun : de multicœurs en trois dimensions, cest-à- dire avec une zone de recouvrement des deux cœurs (donc superposés) permettant de mettre en place des canaux de communication entre eux. ces architectures intéressantes pour les programmes qui se prètent simultanément aux deux techniques precitées (multicœurs et hyperthreading).

Le SMP (Symetric MultiProcessing) plusieurs proc. sur la carte mère, chacun disposant dun accès égal aux ressources chacun dispose de sa mémoire cache accèdent tous à la même mémoire système (Uniform Memory Access) fonctionne bien jusquà 4 ou 8 processeurs, ensuite la gestion de laccès aux ressources communes (bus, mémoire,...) pose problème

Le SMP en architecture Intel Gros problème : adressage des proc sur 2 bits => 4 procs. Maxi passage à 8 procs : nouveau chipset dévellopé spécialement par Intel (Profusion) actuellement, très peu de solutions Intel à plus de 8 procs.

SMP : Shéma de principe

Le SMP - le Crossbar composant électronique (commutateur) qui remplace le bus système chaque composant dispose de laccès immédiat aux données à lorigine sur les mainframes, disponible sur les serveurs de haut et entrée de gamme permet de supporter un plus grand nombre de proc avec de bonnes performances utilisé chez –Bull (Escala), Sun (Enterprise : 64 proc), –Unisys (ES7000 : 32 proc sur Intel), HP

Le SMP - Bilan très répandu simple à fabriquer peu cher pas de réécriture des application en revanche : –non linéaire (2 procs => 1,6) –performances si plus de 8 procs (sauf si crossbar) –scalabilité –nombre de procs limité (32 ou 64)

Le SMP - Crossbar - CMP on trouve également le terme CMP (Cellular Multi Processing) pour qualifier le SMP avec Crossbar le CMP permet également le partionnement physique de larchitecture par rapport au SMP classique –il est plus linéaire –nombre de procs plus importants –plus grande scalabilité

NUMA Non Unifom Memory Access Différents modules SMP de quatre procs chacun commutés entre eux, forment un quad. Ce quad possède sa propre mémoire, son bus et son système d'entrées-sorties et l'ensemble des modules est géré par un seul système d'exploitation chaque module communique avec les autres par un bus à 1 Gb/s presque linéaire : 2 procs => 1,97

NUMA: Schéma de principe

NUMA - Suite Pas deffet de goulet détranglement du à laccès commun à un bus unique comme avec SMP Problème : certaines applications demandent à être réécrites => mémoire non linéaire Mise en œuvre chez IBM (Numa-Q ) après le rachat de Sequant, chez Unisys, HP (V9000). peut supporter plus de 100 procs système partitionnable limité au monde Unix et Linux bientôt quelques problèmes de temps de latence pour laccès à la mémoire

CC-NUMA CC-NUMA, ou cache-coherent NUMA utilise un système de gestion de la cohérence de cache par matériel (coomunication inter- noeuds). Les transferts mémoire et les requêtes sont traitées exclusivement par matériel (détermination si ladresse est locale ou distante) CC-NUMA est la form la plus répandue de NUMA du fait de son efficacité. NUMA-Q est la version IBM de CC-NUMA

MPP (Massively Parallel Processing) systèmes distribués complètement indépendant chaque noeud dispose de sa propre instance du SE, un ou 2 processeurs, de mémoire, dentrées sorties et dun bus système. Les noeuds sont interconnectés gestion de la cohérence : envoi de message (logiciel) pb : si nombre de noeuds élevé, croissance exponentielle du traffic et baisse des performances

MPP : Schéma de principe

MPP (Massively Parallel Processing) peut supporter plusieurs centaines de noeuds Pb : les applications doivent être réécrites pour utiliser les spécificités du MPP Vendeurs : Siemens, NCR coût élevé Exemples dutilisation : –VOD : Vidéo On demand –Data Warehouse, Data Mining...

Tableau : quelques exemples

En conclusion le SMP est très utilisé et pas uniquement sur les machines dentrée de gamme il est très bien supporté en architecture Intel de plus en plus de machines hybrides : quad SMP en architecture NUMA pour les applications demandant plus de puissance, il faut se tourner vers les solutions NUMA ou MPP

Le 64 bits : Opteron/Itanium Opteron/Athlon64 (AMD): fonctionne aussi en mode 32 bits – 8 procs. Maxi. Utilisé actuellement par IBM et Sun. Itanium (Intel): mode 64 bits uniquement – performances relativement décevantes actuellement : il faut un gros travail sur le compilateur qui doit gérer la parallélisation du flux. Avenir incertain …. Intel : Xeon et Core Duo, Core Quad