Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parJuliette Larcher Modifié depuis plus de 10 années
1
MGV * : quelques prévisions de performances * Modèle à Grande Vitesse
2
Configurations testées Configurations : uniquement LMDZ forcé. LMDZ 96x72x19. LMDZ 72x45x19. LMDZ 44x43x(19 ou 15). Calculateurs Mercure : Nec SX6 et SX8 vectoriels. Tantale : scalaire, cluster de nœuds Optéron@2,4GhZx4, réseau Infiniband, assemblé par HP, système Linux. Compilateur : pgi. X, scalaire, cluster de nœuds Itanium@1,5Ghzx4, réseau Infiniband, système Linux.
3
Rappels : temps mono CPU ORCA2 - LMD 72x45x19 sur SX6 : 880s/an, environ 6 ans/jour. ORCA4 - LMD 44x43x19 sur SX8 : Environ 20 ans/jour -> 50 jours/millénaire
4
La parallélisation Dynamique : Découpage en bandes de latitudes : communication par MPI -> mémoire distribuée, intra ou inter nœud. Découpage vertical : communication par OpenMP -> mémoire partagée, sur un nœud. Scalabilité limité : il faut au moins 3 bandes de latitude par processeur. Physique Découpage mono-dimensionnel : on réparti les points également sur les processeurs. Communications MPI et OpenMP.
5
Pas dentrée/sortie …. :-) SX6 et SX8 : 1 à 8 processeurs testés. Projection sur 32 (OpenMP). Scalaire : 1 à 16 processeurs testés. Projection sur 64 (OpenMP). En italique : projections, pas testé. Unité : jours / millénaire simulé. Performances
6
LMDZ 96x72x19 #CPUSX6OptéronItaniumSX8 12901800900145 216090045080 49048024045 85023912025 1612864 32179 6443 ?22 ?
7
LMDZ 72x45x19 #CPUSX6OptéronItaniumSX8 11301025X2 ?65 2 51833 44225521 83114316 Pas assez de points 3211485,5 64
8
LMDZ 44x43x19 #CPUSX6OptéronItaniumSX8 1385 OpteronX2 ? SX6 x 2 ? 2185 4100 87339 ? 16 Pas assez de points 322513 ?8 ? 64
9
LMDZ 44x43x15 #CPUSX6OptéronItaniumSX8 150297 Opt. x 2 ? SX6 x 2 ? 230150 41880 81248 16 Pas assez de points 324162-3 ? 64
10
Comparatif SX8 #CPUs1832 96x72x192905017 72x45x191303111 44x43x19100248,5 44x43x1550123,5
11
Et après ? Il faut coupler … NEMO sur un jeu de processeurs différent Il faut être raisonnable sur les I/O … Il faut un coupleur parallèle OASIS 3 (bidouille) OASIS 4
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.