MGV * : quelques prévisions de performances * Modèle à Grande Vitesse.

Slides:



Advertisements
Présentations similaires
LES NOMBRES PREMIERS ET COMPOSÉS
Advertisements

Aires et périmètres.
Distance inter-locuteur
Matériels Composants physiques de l’ordinateur.
Eric Maisonnave, Laurent Terray
Master de recherche informatique Université de Montpellier 2
Codage de la parole Ivan Magrin-Chagnolleau, CNRS
ACTIVITES Le calcul littéral (3).
CLUSTERING Grappe d'ordinateurs.
26/03/2017 Fonctionnement d ’un cluster sous AIX grâce à HACMP : High Availability Cluster Multi-Processing Raphaël Bosc, IR5.
Journées franciliennes 2006 Moussa ELKIHEL (LAAS-CNRS;UPS Toulouse )
A abstraction b assembleur c nombre binaire d bit e cache f UC g puce h compilateur i famille dordinateurs j contrôle k chemin de données l défaut m dé
Bibliothèques Scientifiques
Informatique parallèle hautes performances
Mathador Flash Cycles 2 et 3 Deux formules de jeu : Partie Flash - Qui calculera le plus vite Principe du « Compte est bon » au plus.
Parallélisation d’un Algorithme CNFT
Architecture de machines Principes généraux
IPSLCM5 Couplé « physique » NEMO bleu : océan
Conception et Analyse du Réseau en Présence dIncertitude Professeur Amar Ramudhin, ing. Ph.D.
Chaire UNESCO - Calcul numérique intensif
Systèmes-Réseau-Virtualisation-Stockage
LES NOMBRES PREMIERS ET COMPOSÉS
Test bilan de calcul mental N°1 :
Les écritures fractionnaires
Les systèmes multiprocesseurs Ph. Sèvre le 19/12/08.
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
J-L Dufresne Responsable du pôle de modélisation Pôle de modélisation de l'IPSL: travaux en cours en vue de la préparation du prochain rapport du GIEC.
Amélioration du parallélisme du code de climat de l'IPSL.
CNRM Atmosphère globale (ARPEGE). Atmosphère régionale (ALADIN). Océan global et régional (OPA). Assemblage et emboîtements à faire. CERFACS Coupleurs.
Point sur le modèle couplé IPSL (CM et ESM)
LE PARALLELISME DANS LE MODELE CLIMATIQUE DE L’IPSL
Architectures de grappes de PC
Mathématiques SN Les VECTEURS Réalisé par : Sébastien Lachance.
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
Lyon, 24/04/2007 Ce que l'application a besoin de connaître: Paramètres physiques par scénario de 150 ans Nombre et numéro d'ordre des mois à effectuer.
SUJET D’ENTRAINEMENT n°4
L’adaptativité pour un solveur de l’équation de Vlasov
Simulation de problèmes couplés d’hydro-géologie :
Importance du réseau dans des architectures MIMD Tout échange entre les processeurs nécessite un transfert de données via le réseau.
1 Modèle pédagogique d’un système d’apprentissage (SA)
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Chapitre 11 Activités.
Règles calcul au quotidien  4 = ?. Règles calcul au quotidien  4 = ?
Quelques petits problèmes pour vous exercer
PSI : actualités PSI : PRISM Sustained Initiative Accord de gré à gré entre CNRS, CERFACS, ECMWF, Met-Office, MPI-M et M&D pour poursuivre le partage d’expertise.
Présentation rapide d’
8INF856 Programmation sur architectures parallèles
Point sur le modèle couplé IPSL (CM et ESM) Branville mai 2008 Marie-Alice Foujols Olivier Marti et groupes Cplipsl et Esci.
Point sur le couplé // CSPOLE 16 juin 2006 Marie-Alice Foujols - Olivier Marti.
Le point sur la parallélisation du couplé Adapter les codes aux architectures multiprocesseurs des futures machines afin d’améliorer les temps de restitution.
Addition de nombres à un ou deux chiffres Mathématiques – Calcul mental  Entraînement n° 2.
Calcul parallèle => partitionner les données en sous-groupes associés aux processeurs. P0 P2 P1.
Modélisation du climat à l’IPSL: existant, objectifs et enjeux à 4 ans
Discussion technique 1 4 ème Réunion des Utilisateurs de Méso- NH Discussion Technique Juan Escobar (LA), Isabelle Mallet (CNRM) avril 2007 LA,
D. E ZEGOUR Institut National d ’Informatique
Environnement des modèles Contraintes liées au parallélisme Utilisation de plusieurs machines Liens couplé/forcé.
Introduction aux solutions Microsoft pour le HPC.
Clustering. Le Clustering est une technique qui consiste à assembler virtuellement plusieurs machines afin de les faire travailler en parallèle. Cela.
Couplé parallèle Etat des lieux. Objectifs Couplé parallèle en production à l’arrivée de la nouvelle machine vectorielle IDRIS (entre février et avril.
Point sur l'utilisation des moyens de calcul à court terme et stratégie à moyen terme Marie-Alice Foujols Pôle de modélisation du climat IPSL.
Ressources calcul 2008 GENCI PRACE IDRIS : brodie NEC SX-8 - vargas IBM Power6 CCRT : mercure NEC SX-8R - GIEC NEC SX-9 platine Bull Itanium / Nehalem.
Introduction aux architectures parallèles
Plateforme de Calcul Intensif “HPC” de l’lnstitut Pytheas M. Libes, C. Pinazo Juin 2015.
L’arrivée des versions parallèles des modèles de l’IPSL Adapter les codes aux architectures multiprocesseurs des futures machines afin d’améliorer les.
LE COUPLE DE FORCES Définition : deux forces de sens opposé, de même direction sur deux lignes d ’action différentes et d ’intensité égale.
Lyon, 24/04/2007 Portage et déploiement de l'application Climat sur Eric Maisonnave.
Plateforme de Calcul Intensif “HPC” de l’lnstitut Pytheas M. Libes UMS 3470 Pytheas C. Pinazo UMR 7294 MIO Juin 2015.
Novembre 2003 Simulation numérique en vibro-acoustique par couplage de deux codes parallèles Unité de Recherche Calcul à Haute Performance François-Xavier.
Ecole Informatique 2010 La Programmation des Architectures Multi-cœurs Cécile Barbier Fatih Bellachia Alain Masserot.
Transcription de la présentation:

MGV * : quelques prévisions de performances * Modèle à Grande Vitesse

Configurations testées Configurations : uniquement LMDZ forcé. LMDZ 96x72x19. LMDZ 72x45x19. LMDZ 44x43x(19 ou 15). Calculateurs Mercure : Nec SX6 et SX8 vectoriels. Tantale : scalaire, cluster de nœuds réseau Infiniband, assemblé par HP, système Linux. Compilateur : pgi. X, scalaire, cluster de nœuds réseau Infiniband, système Linux.

Rappels : temps mono CPU ORCA2 - LMD 72x45x19 sur SX6 : 880s/an, environ 6 ans/jour. ORCA4 - LMD 44x43x19 sur SX8 : Environ 20 ans/jour -> 50 jours/millénaire

La parallélisation Dynamique : Découpage en bandes de latitudes : communication par MPI -> mémoire distribuée, intra ou inter nœud. Découpage vertical : communication par OpenMP -> mémoire partagée, sur un nœud. Scalabilité limité : il faut au moins 3 bandes de latitude par processeur. Physique Découpage mono-dimensionnel : on réparti les points également sur les processeurs. Communications MPI et OpenMP.

Pas dentrée/sortie …. :-) SX6 et SX8 : 1 à 8 processeurs testés. Projection sur 32 (OpenMP). Scalaire : 1 à 16 processeurs testés. Projection sur 64 (OpenMP). En italique : projections, pas testé. Unité : jours / millénaire simulé. Performances

LMDZ 96x72x19 #CPUSX6OptéronItaniumSX ?22 ?

LMDZ 72x45x19 #CPUSX6OptéronItaniumSX X2 ? Pas assez de points ,5 64

LMDZ 44x43x19 #CPUSX6OptéronItaniumSX OpteronX2 ? SX6 x 2 ? ? 16 Pas assez de points ?8 ? 64

LMDZ 44x43x15 #CPUSX6OptéronItaniumSX Opt. x 2 ? SX6 x 2 ? Pas assez de points ? 64

Comparatif SX8 #CPUs x72x x45x x43x ,5 44x43x ,5

Et après ? Il faut coupler … NEMO sur un jeu de processeurs différent Il faut être raisonnable sur les I/O … Il faut un coupleur parallèle OASIS 3 (bidouille) OASIS 4