MGV * : quelques prévisions de performances * Modèle à Grande Vitesse
Configurations testées Configurations : uniquement LMDZ forcé. LMDZ 96x72x19. LMDZ 72x45x19. LMDZ 44x43x(19 ou 15). Calculateurs Mercure : Nec SX6 et SX8 vectoriels. Tantale : scalaire, cluster de nœuds réseau Infiniband, assemblé par HP, système Linux. Compilateur : pgi. X, scalaire, cluster de nœuds réseau Infiniband, système Linux.
Rappels : temps mono CPU ORCA2 - LMD 72x45x19 sur SX6 : 880s/an, environ 6 ans/jour. ORCA4 - LMD 44x43x19 sur SX8 : Environ 20 ans/jour -> 50 jours/millénaire
La parallélisation Dynamique : Découpage en bandes de latitudes : communication par MPI -> mémoire distribuée, intra ou inter nœud. Découpage vertical : communication par OpenMP -> mémoire partagée, sur un nœud. Scalabilité limité : il faut au moins 3 bandes de latitude par processeur. Physique Découpage mono-dimensionnel : on réparti les points également sur les processeurs. Communications MPI et OpenMP.
Pas dentrée/sortie …. :-) SX6 et SX8 : 1 à 8 processeurs testés. Projection sur 32 (OpenMP). Scalaire : 1 à 16 processeurs testés. Projection sur 64 (OpenMP). En italique : projections, pas testé. Unité : jours / millénaire simulé. Performances
LMDZ 96x72x19 #CPUSX6OptéronItaniumSX ?22 ?
LMDZ 72x45x19 #CPUSX6OptéronItaniumSX X2 ? Pas assez de points ,5 64
LMDZ 44x43x19 #CPUSX6OptéronItaniumSX OpteronX2 ? SX6 x 2 ? ? 16 Pas assez de points ?8 ? 64
LMDZ 44x43x15 #CPUSX6OptéronItaniumSX Opt. x 2 ? SX6 x 2 ? Pas assez de points ? 64
Comparatif SX8 #CPUs x72x x45x x43x ,5 44x43x ,5
Et après ? Il faut coupler … NEMO sur un jeu de processeurs différent Il faut être raisonnable sur les I/O … Il faut un coupleur parallèle OASIS 3 (bidouille) OASIS 4