Ordonnancement d’applications intensives embarquées sur GPUs ADDA CHAHRAZED addachahrazed@gmail.com Encadreur: Mr A.E.BENYAMINA Co-Encadreur: Mr L.Loukil et Mr P.BOULET
Plan 1. Introduction 2. Travaux connexes 3. Conclusion
INTRODUCTION
1. Introduction Problématique: GILR PI PR Algorithme d’ordonnancement ? Algorithme d’ordonnancement ? CPU GPU GPGPU (Architecture Hétérogène)
1. Introduction Mes Présentations: : 5 exposés Voir le lien: AASGaspard
Travaux connexes
système hétérogène tels que (GPU+ FAPGA+CPU) [1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. 2012 système hétérogène tels que (GPU+ FAPGA+CPU) Satisfaction de deux critères (Max tps de performance, Min consommation d’énergie) ) Ordonnancement basée(liste de priorité de taches)
[1] Qiang Liu and Wayne Luk2 [1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. 2012 Ordonnancement fonction basée sur le temps d’exécution et consommation d’énergie sous forme un mode de programmation linéaire
Dependency Resolution. 2012 [2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with Dependency Resolution. 2012 Calcul intensif sur GPUs Satisfaction de critère (minimiser le temps d’exécution) Ordonnancement basée(priorité de dépendance) Ordonnancement fonction basée sur DCounter.
Calcul intensif sur GPUs [3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU Accelerators in Medical Imaging. 2012 Calcul intensif sur GPUs Satisfaction de critère (minimiser le temps d’exécution) Ordonnancement basée(priorité de dépendance) et LDF (Latest Deadline First ))
système hétérogène tels que (GPUs+CPUs) [4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback. Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en télécommunication. 2013 système hétérogène tels que (GPUs+CPUs) Satisfaction de deux critères (minimiser le temps de réponse ) Traitement d’un seul image (détection de coins et contour) Traitement de plusieurs images (détection de coins et contour) Ordonnancement basée sur (CUDA et OpenGl) Ordonnancement basée sur (StarUP)
Calcul intensif sur GPUs [5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet DOLPHIN. 2010 Calcul intensif sur GPUs Satisfaction de critère (Max tps de performance, Min consommation d’énergie) ) Ordonnancement basée(Algorithmes évolutionnaires) )
Calcul intensif sur GPUs [6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†. Heterogeneous Task Scheduling for Accelerated OpenMP. 2012 Calcul intensif sur GPUs Satisfaction de critère (Max tps de performance) Ordonnancement basée(Algorithmes génétique)
2. Travaux connexes Articles plateformes Algorithme d’ordonnancement Critère d’optimisation Langage de programmation Remarque [Qiang et al 2012] CPUs-GPUs-FPGAs Programmation linéaire Maximiser efficacité énergétique du système , Max tps performance C++ [Tzeng et al 2012 ] GPUs Statique(résolution de dépendance) minimiser le temps d’exécution - [Membarth et al 2012] Dynamique (en fonction des priorités et LDF (Latest Deadline First )) minimiser le temps de réponse CUDA, opencl [Mahmoudi et al 2013] CPUs-GPUs 1.Ordonnandement par CUDA 2.Odonancement effectué par StarUP+ les algorithmes de traitement d’image 1.CUDA+OpenGL 2.StarUP Traitement 1.Pour une seul image 2. Pour plusieurs images
2. Travaux connexes Articles plateformes Algorithme d’ordonnancement Critère d’optimisation Langage de programmation Remarque [Qiang et al 2011] CPUs-GPUs- Statique Algorithmes évolutionnaires Max tps Performance, Min consom D’énergie OpenCL [Thomas et al 2012] génétiques Performance OpenMP
Conclusion
3. Conclusion Proposition: Partie1: Commence par un graphe à un seul niveau GILR PI PR Algorithme d’ordonnancement Statique Algorithme d’ordonnancement Statique évolutionnaires (PSO et dijkstra ) Travail de Mr Aroui (Branch & Bound) GP GPU GPGPU (Architecture Hétérogène)
Référence bibliographique [1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. School of Electronic Information Engineering, Tianjin University, 300072 Tianjin, China 2 Department of Computing, Imperial College London, SW7 2AZ London, UK. 2012 [2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with Dependency Resolution. 2012 [3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU Accelerators in Medical Imaging. Hardware/Software Co-Design, Department of Computer Science, University of Erlangen-Nuremberg, Germany. Siemens Healthcare Sector, H IM AX, Forchheim, Germany. 2012
Référence bibliographique [4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback. Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en télécommunication. Université de Mons, Faculté Polytechnique. Service d’informatique 20, Place du Parc 7000 Mons, Belgique.2013 [5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet DOLPHIN. 2010 [6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†. Heterogeneous Task Scheduling for Accelerated OpenMP. Center for Applied Scientific Computing, Lawrence Livermore National Laboratory, Livermore, CA 94551 USA. 2012