La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

ANR PARMAT Optimisation & Parallélisation Lakimoca A. De Backer LMPGM, Université Lille 1 EDF-MMC Mars 2009.

Présentations similaires


Présentation au sujet: "ANR PARMAT Optimisation & Parallélisation Lakimoca A. De Backer LMPGM, Université Lille 1 EDF-MMC Mars 2009."— Transcription de la présentation:

1 ANR PARMAT Optimisation & Parallélisation Lakimoca A. De Backer LMPGM, Université Lille 1 EDF-MMC Mars 2009

2 Parallélisation Lakimoca Lakimoca est un code de simulation de l'évolution spatio-temporelle du dommage d'irradiation à léchelle (100 nm) 3, qui est utilisé pour létude du vieillissement des aciers Les simulations actuelles arrivent à saturation Début de loptimisation, octobre 2008 : Etude préliminaire sur la cinétique du code Bibliographie sur les stratégies de parallélisation Débroussaillage du « First Passage » Optimisation « au coup par coup »

3 Lakimoca Monte Carlo Cinétique dobjets While (t < t end ) choix_evenement mise_a_jour(t) case 1 : mouvement 2 : emission 3 : irradiation bcq dobjets mais peu fréquent recombinaison Link Cell if (necessaire) delete(obj) « dégringoler » le bas des listes if (necessaire) recalculer sum_proba parcourir la liste dobjets recalculer Link Cell U×Γ totale i ème événement ΓiΓi Γ totale 0

4 Deux régimes en fonction du rapport, r = irradiation / diffusion Basse température, 100 K---Haute température, 573 K ~ 1---~ t >>--- t << peu ditérations---beaucoup ditérations beaucoup dobjets---peu dobjets Etude préliminaire Entrée: Irradiation, Taux fixe Sortie: Annihilation Recombinaison Taux lié à la diffusion: Fonction de la température Fer % défauts, irradiation faible, temps longs

5 Temps physique en cours de simu Temps, dpa et nombre de défauts augmentent très vite t >> Mais car il y a de plus en plus dobjets t = 1/( irradiation + i )

6 Tous les défauts mobiles disparaissent avant loccurrence dune nouvelle irradiation t << Mais car le nombre dobjets diminue jusquà la nouvelle cascade

7 Optimisation Basse température ou forte irradiation beaucoup dobjets parallélisation Haute température accélération de la diffusion First Passage Pourquoi paralléliser à HT ? Pour une boîte plus grande Condition aux limites périodiques = « irradiation pulsée » très peu de gros amas = statistique tronquée densité de dislocations trop grande MAIS que deviendra la cinétique du code ???

8 Parallélisation Partition de la boîte en super-cellules, SC N Monte Carlo simultanés Communications entre les PE pour le transfert dobjets et la mise à jour du « link cell » t sont différents dans chaque SC Chaque nouvelle itération désynchronise les SC Evénements aux frontières peuvent corrompre lhistoire : conflits de causalité

9 Réponses de la bibliographie Synchronisation des PE grâce aux « barrières » à t + delta_t nombre ditérations différent sur chaque PE Synchronisation forcée par ajout de lévénement nul de probabilité adaptée Traitement des conflits de causalité analyse de lhistoire à posteriori

10 Que faire en cas de conflits Rejet de lhistoire corrompue et redémarrage au « premier » conflit Boucle de relaxation compte tenu de la connaissance de lhistoire, S. G. Eick …B. D. Lubachevsky, 1993 Evénement nul E. Martinez … J. Marian, 2007 Évé. nul SC i SC j Γ i = Γ max

11 Algorithme asynchrone B. D. Lubachevsky « seuls les traînards travaillent » « virtual time horizon » temps Site / objet (a) 1 à la fois temps Site / objet (b) avance multiple Autorisé à avancer Autorisés à avancer Evénement Interaction Corruption !

12 Time Warp Tous les PE avancent « à leur rythme » Optimisme : passage de messages dinformations et de démentis Hybrid Asynchrone Zone « bouclier » sur les bords et on attend les voisins si on doit la modifier pas applicable à Lakimoca Y. Shim, J. G. Amar, J. Comput. Phys. 212 (2006)

13 Stratégie pour Lakimoca Boucle MC ~ 2 s Temps de communication ~ latence Blue Gene ~ 10 s / cluster ~ 200 s 10 / 100 itérations « isolées » Est-ce réaliste ? taux de passages de frontière ? quels sont les problèmes ?

14 Purement lié à la diffusion ~ 2 – 20 % des événements occasionnent un changement de SC Plus de 80 % retraversent la frontière après moins de 10 sauts Elargissement de la frontière SC 1 SC 2 Zone fantôme SC 2 : Suit ses objets jusque là Voit jusque là SC 1 : Suit ses objets jusque là Voit jusque là double compétence

15 Corruption de lhistoire t j = 1/( irradiation + i ) non modifié « à temps » Recombinaison non réalisée et/ou t j non modifié à temps Événement lié au nouvel objet non traité SC i où t = t i SC j où t = t j > t i

16 Stratégie didentification du « vrai conflit inévitable » Mémorisation de lhistoire Utilisation de lévénement nul: –une « réserve » pour les modifications de j –Correction des événements non-traités Correction de lhistoire a posteriori Accepter un « biais » par rapport au KMC séq hypothèse : peu de « vrais conflits »

17 Accélération de la diffusion First Passage, … V. V. Bulatov, … Phys. Rev. Let. 97, (2006). domaines de protection probabilité de First Passage position anticipée construction dun échéancier

18 Lakimoca domaine de protection probabilité de First Passage construction dun échéancier position anticipée taille limitée par la présence de pièges et optimum « non - géométrique » car plusieurs ordre de grandeur de diffusion calculée par Monte Carlo sur le réseau discret facile et flexible assez perturbant pour Lakimoca Ok avec « cube » anticipé et probabilités cumulées pour tirage aléatoire rapide MAIS donné lidée de « micro-sauts » (plutôt que « macro-sauts ») … ! Probabilités différentes de celle du first passage ! ! Question de la disparité des probabilités de diffusion !

19 Micro-saut idée : remplacer x sauts discrets par un grand + t = x t – sites voisins non-équiprobables + sélection rapide : probabilité cumulée datteindre le cube de dimension a a a en x sauts + nombre dappels à recomb() réduit dun facteur x – comment évaluer la valeur de x autorisée + on accède facilement aux distances aux plus proches objets lors du dernier appel de la fonction recomb() +

20

21 Profilage au cas par cas Observations pragmatiques : quels sont les fonctions les plus coûteuses pour chaque nouvelles simulations Suppression de certains appels à sqrt() Prise en compte contiguïté des données en mémoire (dans la parcours des tableaux) Suppression de lappel systématique à une partie de la fonction recomb() grâce à un critère de distance vis-à-vis de « grands » objets peu mobiles Groupement dobjets pour accélérer la recherche de lévénement MC … en cours

22 flux de dpa/s T=473K box 100x100x1000 VersionTemps de calcul o sec o120e (après optimisation)720 sec % cumulative self self total time seconds seconds calls s/call s/call name choix_event calc_obj_sum_proba delete_obj recomb one_move LC_find_ncell i_ii_recomb lkmc_obj_steps do_one_event sink_grain_boundary LC_chg_cell Simulation de 1200 à 1220 secondes Travail en cours (grouping method) pour optimiser choix_event() Irradiation aux électrons lame mince (surface en z)

23 Irradiation aux électrons lame mince flux de dpa/s T=473K box 200x200x1000 VersionTemps de calculTemps de calcul 100x100x x200x1000 o sec6135 sec (3252 sec si x4) o120e (après optimisation)720 sec5308 sec (2280 sec si x4) BOX 100x100x1000 % cumulative self self total time seconds seconds calls s/call s/call name choix_event calc_obj_sum_proba delete_obj recomb one_move LC_find_ncell i_ii_recomb lkmc_obj_steps do_one_event sink_grain_boundary LC_chg_cell Simulation de 1200 à 1220 secondes Scaling avec la taille de boite

24 Irradiation en volume flux de cascade T = 573 K Simulation de à secondes VersionTemps de calcul o sec o120e (après optimisation)376 secgain facteur 6 Irradiation sous flux de neutrons


Télécharger ppt "ANR PARMAT Optimisation & Parallélisation Lakimoca A. De Backer LMPGM, Université Lille 1 EDF-MMC Mars 2009."

Présentations similaires


Annonces Google