La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

CNRM Atmosphère globale (ARPEGE). Atmosphère régionale (ALADIN). Océan global et régional (OPA). Assemblage et emboîtements à faire. CERFACS Coupleurs.

Présentations similaires


Présentation au sujet: "CNRM Atmosphère globale (ARPEGE). Atmosphère régionale (ALADIN). Océan global et régional (OPA). Assemblage et emboîtements à faire. CERFACS Coupleurs."— Transcription de la présentation:

1 CNRM Atmosphère globale (ARPEGE). Atmosphère régionale (ALADIN). Océan global et régional (OPA). Assemblage et emboîtements à faire. CERFACS Coupleurs OASIS V3 et V4. La sphère et la dynamique des fluides Système parfaitement conservatif : les algorithmes utilisables sont restreints par les conservations imposées : masse, énergie, moment cinétique, enstrophie… Solution : Diminuer le pas de temps : gaspillage énorme en temps de calcul sur les régions équatoriales. Application dun « filtre » aux hautes latitudes pour lisser les fluctuations de courtes longueurs donde. méthode qui « naime pas » le parallélisme. La parallélisation du cœur dynamique de LMDZ Le cœur dynamique calcule et intègre les termes des équations de Navier-Stockes, le transport des traceurs et la dissipation. Filtre des hautes latitudes => domaines de calcul inhomogènes De nombreux échanges par pas de temps loptimisation des communications est critique. MPI : décomposition de domaines en bandes de latitude Élimine le problème du filtre, simplifie la parallélisation du schéma dadvection. Échange de « halos » de données entre processus proches voisins Open MP : parallélisation des boucles sur les indices verticaux. Les boucles sur les indices verticaux sont les plus externes. La parallélisation des boucles est plus simple et performante. Elle nentre pas en conflit avec la vectorisation Calcul Intensif pour le CLimat et l'Environnement La parallélisation de la partie physique de LMDZ, dORCHIDEE et dINCA Lensemble de ces codes suivent le même principe : les mailles sur une colonne datmosphère sont indépendantes les unes des autres Hormis les I/Os, pas ou peu de communications par pas de temps. Loptimisation des communications nest pas critique. Distribution des données en vecteur de mailles sur lesquelles repose une colonne datmosphère. A Chaque processus MPI est assigné un vecteur de mailles, que se partage lensemble des tâches OpenMP lancées au sein du processus. Les stratégies de parallélisation des modèles « Le projet CICLE a pour objet de développer une nouvelle génération de modèles capables de tirer pleinement parti des supers calculateurs actuels et futurs afin de réaliser des simulations frontières qui permettront des avancées majeures tant dans la compréhension des phénomènes physiques que dans nos capacités de prédiction. » Océan (OPA). Glace de mer (LIM). Atmosphère (LMDZ). Surface continentale et végétation (ORCHIDEE). Chimie Atmosphérique et Aérosols (INCA). Le modèle couplé de lIPSL Acteurs IPSL Les difficultés de la parallélisation liées aux spécificités des modèles La faible taille des grilles utilisées Une simulation classique couvre ~ 200 ans par pas de temps de ~60 s => ~ 100 000 000 pas de temps/simulation. Utilisation de grilles de faibles tailles : Résolution moyenne : 96x72x19 => ~130 000 mailles. Haute résolution (1°) : 360x180x55 => 3 500 000 mailles. Limitation rapide des performances du parallélisme : les latences et les coûts en bande passante se font rapidement sentir : Grille 96x72x19 : 16 proc : 8000 mailles /proc. Grille 360x180x19 : 500 proc : 7000 mailles/proc. 5 codes développés indépendamment, couplés à chaque pas de temps. Utilisation du coupleur parallèle OASIS La parallélisation mixte : MPI/OpenMP Deux points singuliers : x tend vers 0 aux pôles : un défi majeur à la stabilité numérique => Instabilité CFL (Courant – Freedich-Lewy). Quelques détails sur les performances… LMDZ4 1° 55 niveaux verticaux (360x180x55) : Résultats sur platine (CCRT) et sur le « Earth Simulator » : 1 jour (1920 itérations) CPUs PlatineES TempsSpeed-upTempsSpeed-up 1(25056 s)1(2280 s)1 2(12528 s)2(1140 s)2 4(6264 s)4570 s4 8(3132 s)8307 s7.42 161566 s16169 s13.5 32727 s34.599 s23 64381 s65.864 s35.6 128229 s109.447 s48.6 256118 s212.3 48086 s291.3 Processus MPITâches OMPCPU utilisés Platine TempsSpeed-up 1113392 s1 248388 s8.7 4416174 s19.5 6424122 s27.8 843297 s34.7 1044085 s39.8 1244878 s43.5 1445671 s47.6 1646465 s52.0 2449650 s66.6 Simulation ½° : 720x360x19 LMDZ/INCA : Résolution standard 96x72x19 Temps et Speed-up pour 480 itérations (1 journée) Résolution 360x180x55 : Années simulées / mois en fonction du nombre de processeurs Résolution 360x180x55 : courbe de speed-up SX8/Itanium Paralléliser les composantes. Coupler les composantes parallèles. Emboîter modèles régionaux et globaux. Revisiter les interfaces entre composantes. Réaliser des simulations de démonstration. La complexité du modèle couplé CIGC - 05 - 004 http://dods.ipsl.jussieu.fr/omamce/CICLE


Télécharger ppt "CNRM Atmosphère globale (ARPEGE). Atmosphère régionale (ALADIN). Océan global et régional (OPA). Assemblage et emboîtements à faire. CERFACS Coupleurs."

Présentations similaires


Annonces Google