La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Projet R&D GridCL Evaluer la pertinence d’insérer des accélérateurs « many-core » au sein de nos Grilles de calcul, couplés à des technologies logicielles.

Présentations similaires


Présentation au sujet: "Projet R&D GridCL Evaluer la pertinence d’insérer des accélérateurs « many-core » au sein de nos Grilles de calcul, couplés à des technologies logicielles."— Transcription de la présentation:

1 Projet R&D GridCL Evaluer la pertinence d’insérer des accélérateurs « many-core » au sein de nos Grilles de calcul, couplés à des technologies logicielles portables telles qu’OpenCL, pour les besoins scientifiques du labex P2IO. David Chamont, Gilles Grasseau, Andréa Sartirana, Matthew Nguyen, Jocelyn Peidnoir, Mathieu de Naurois, Philippe Busson (LLR), Sébastien Binet (LAL), Christophe Suire, Christophe Diarra, Luz Guevara (IPNO), Irène Buvat (IMNC), Elie Soubrie, Claude Mercier (IAS), Pierre-François Honore, Philippe Gras, Sophie Ferry, Pierrick Micout, Jean-Pierre Meyer (CEA), Olivier Brand-Foissac (LPT).

2 Matériel en cours d’acquisition 2013/06/21David Chamont & Gilles Grasseau2

3 NVidia K20 versus Intel Xeon Phi 2013/06/21David Chamont & Gilles Grasseau3  NVidia K20 (GK110) oGeneral Purpose Graphical Processor Unit (GPGPU) oInstructions propriétaires o2496 coeurs o13 threads x 192 VLSIMD = 2496 ofréquence de 706 MHz o1170 GFlops (puissance crête double) o5 Go de mémoire à 208GB/s.  Intel Xeon Phi (5110P) oAccelerator Processeor Unit (APU) oInstructions x86 + instructions vectorielles propriétaires. o60 cœurs o240 threads x 8 VLSIMD = 1920 ofréquence de 1053 MHz o2021 GFlops (puissance crête double) o8 Go de mémoire à 320GB/s.  Carte mère bi-processeur Intel Sandy- Bridge E5-2650 oInstructions x86 + AVX o16 cœurs (2x8) o16 threads x 4 VLSIMD = 64 ofréquence de 2.6 GHz (3.3 en turbo) o320 GFlops (puissance crête double) o90 Go de mémoire

4 Approches logicielles  Niveau de programmation oLangages de programmation (OpenCL, CUDA, instructions vectorielles)  Performances maximales  Cout de maintenance maximum aussi… oDirectives (OpenACC, OpenHMPP, etc)  Plus haut niveau et plus simple  Plus portable ?  Exige aujourd’hui des compilateurs payants (OpenACC, PGI) oBibliothèques  Prêt à servir  Que faire du patrimoine logiciel existant ? oTransformation automatique ? oTout réécrire ? oProbablement inévitable de réorganiser les structures de données… quoiqu’il arrive, les modifications apportées pour la prallélisation sont également très bénéfique à la version séquentielle. 2013/06/21David Chamont & Gilles Grasseau4

5 NVidia K20 versus Intel Xeon Phi 2013/06/21David Chamont & Gilles Grasseau5  NVidia K20 oaccélérateur (copie host  device) oCUDA, OpenACC, OpenCL oBibliothèques CUDA (CuBlas,... ) oC++ (abstrait) : thrust, ArrayFire  Intel Xeon Phi oCarte autonomone (boot) ohost => Xeon Phi (accélérateur) oHost (accélérateur) <= Xeon Phi ocompilateurs, outils : potentiellement tout Unix(x86) oOpenCL, OpenACC

6 Activités GridCL  Acquisition d’une plateforme (D. Chamont, P.-F. Honoré, O. Brand-Foissac)  Applications pilotes actives oIntégration dans la grille VO GridCL (A. Sartirana) oBDT : parallélisation avec OpenMP (tests sur 8 coeurs). Nécessite une réorganisation de données (A. Sartirana) oCMSTracking des ions lourds, transformation du Kalman Filter et exploration d’algorithmes alternatifs (M. Nguyen) oSDO traitement d’images satellitaires (TI). Exploitation hybride avec OpenCL (C. Mercier) oCTA traitement de signaux de télescope, les apports d’OpenCL (M. de Naurois) oSHOC banc de test de performances sur APU (J. Piednoir) oAcquisition d’une plate-forme GridCL  Séminaires et présentations récentes oRené brun (29 avril) oLCG-France (fin mai) oCAPS, NVIDIA et INTEL à la JIIMP (4 juin)  Atelier OpenMP/MPI/OpenCL aux JDEVs (septembre) 2013/06/21David Chamont & Gilles Grasseau6

7 Perspectives technologiques 2013/06/21David Chamont & Gilles Grasseau7  Matériel oAugmentation du nombre de cœurs oAllongement des vecteurs oPCIe 3 oConvergence CPU/GPU  Logiciel oOpenMP 4

8 Perspectives GridCL 2013/06/21David Chamont & Gilles Grasseau8  Plateforme oCartes mère avec co-processeur intégré ? oAccélérateur bas de gamme mais PCIe 3 (AMD Radeon, Nvidia Titan ?  Pistes d’applications oBDT, RootFit en OpenACC ? oGeant4/Gate en OpenCL sur Xeon Phi ?  Dissémination oProposition de travaux pratiques P2IO ? oProposition d’école informatique IN2P3 ? oParticipation/Animation du groupe parallélisation/accélérateurs IN2P3 ?


Télécharger ppt "Projet R&D GridCL Evaluer la pertinence d’insérer des accélérateurs « many-core » au sein de nos Grilles de calcul, couplés à des technologies logicielles."

Présentations similaires


Annonces Google