Ecole Nationale d’Ingénieurs de Sfax Méthodologie de conception des architectures multi-core hétérogènes sur puce Présenté par : Mariem MAKNI Lundi 7 Novembre 2016
Plan Introduction Présentation de la LTE/4G. Introduction à la carte FPGA Xilinx Zynq Exécution de la LTE sur multi-cores Résultats Conclusions Mariem MAKNI 07/11/2016 2
Plan Introduction Présentation de la LTE/4G. Introduction à la carte FPGA Xilinx Zynq Exécution de la LTE sur multi-cores Résultats Conclusions Mariem MAKNI 07/11/2016 3
Brique Lego NXT L’évolution de la technologie et la percée importante Introduction Contexte L’évolution de la technologie et la percée importante de la capacité d’intégration. L’augmentation de la complexité des applications récentes: L’évolution du besoin en termes de puissance de traitements. Brique Lego NXT Architectures hautement parallèles : Intégrant un nombre important de processeurs et de composants matériels sur une même puce. Mariem MAKNI 07/11/2016 4
Brique Lego NXT Contraintes fortes : Performances Énergie Surface Introduction Contexte Traitement de signal … Contraintes fortes : Performances Énergie Surface Temps de mise sur le marché Brique Lego NXT Audio Video Mariem MAKNI 07/11/2016 5
Architecture multicore homogène: Introduction Contexte Architecture multicore homogène: - Les processeurs sont identiques Architecture multicore hétérogène: - Différents types de processeurs - Accélérateurs matériels Mariem MAKNI 07/11/2016 6
MIMO-OFDM Tx/Rx pour LTE 4G Introduction Problématique MIMO-OFDM Tx/Rx pour LTE 4G Puissance de calcul, une haute performance et une grande flexibilité Proposer une architecture matérielle adéquate pour fournir le niveau de performance demandé par cette application Mariem MAKNI 07/11/2016 7
Etudier l’intérêt des architectures parallèles hétérogènes sur puce. Introduction Objectifs Etudier l’intérêt des architectures parallèles hétérogènes sur puce. Proposer et concevoir une nouvelle architecture multicore hétérogène typique qui intègre différents types de processeurs. Evaluer les performances de cette architecture (utilisation logique, temps d’exécution, consommation d’énergie) pour l’exécution de l’application LTE 4G. Mariem MAKNI 07/11/2016 8
Plan Introduction Présentation de la LTE/4G. Introduction à la carte FPGA Xilinx Zynq Exécution de la LTE sur multi-cores Résultats Conclusion Mariem MAKNI 07/11/2016 9
LTE MIMO-OFDM SYSTEM LTE 4G LTE 4G ?homogènes LTE (Long Term Evolution) s'agit de la nouvelle norme de téléphonie mobile qui offre des connexions à internet de très haut débit. Cette technologie représente la quatrième génération des normes de téléphonie mobile (4G). Elle est adaptée aux nouveaux services (vidéo surveillance, etc). L'un des éléments clés de la technologie LTE est l'utilisation de la modulation OFDM (Orthogonal Frequency Division Multiplexing). Mariem MAKNI 07/11/2016 10
MIMO: Multiple-Input Multiple-Output: LTE MIMO-OFDM SYSTEM OFDM Tx/Rx MIMO: Multiple-Input Multiple-Output: Une technique de multiplexage utilisée dans les réseaux sans fil et les réseaux mobiles. Permet des transferts de données à plus longue portée et avec un débit plus élevé Utilise plusieurs antennes tant au niveau de l'émetteur (Tx) que du récepteur (Rx). Mariem MAKNI 07/11/2016 11
LTE MIMO-OFDM SYSTEM OFDM Tx/Rx OFDM? OFDM est une technique de modulation multi-porteuse, elle divise le spectre en des sous-porteuses orthogonales pour transmettre les données. MIMO-OFDM est une technologie récente et moderne: Permet de fournir une haute vitesse de transmission de données pour les réseaux de communication modernes sans fil. Les techniques multi-antennes MIMO-OFDM sont pressenties pour les futurs systèmes de téléphonie mobile en raison de leur robustesse et de leur efficacité spectrale. Mariem MAKNI 07/11/2016 12
OFDM : principe Mariem MAKNI LTE MIMO-OFDM SYSTEM 07/11/2016 13 LTE OFDM Transmission Serial to Parallel converter Modulator IFFT Parallel To Serial converter Input Bit Stream Add cyclic prefix Channel LTE OFDM Reception Remove cyclic prefix Parallel to Serial converter Demodulator FFT Serial to Parallel converter Output Bit Stream Mariem MAKNI 07/11/2016 13
Architectures multi-cores parallèles haute performance Exemples des architectures multicores KALRAY MPPA (256 cores) Architectures multi-cores parallèles haute performance TILERA processors: TILE-GX (72 cores) STMicroelectronics, CEA STHORM (69 cores) INTEL Xeon-Phi (60 cores) Mariem MAKNI 07/11/2016 14
Plan Introduction Présentation de la LTE/4G Introduction à la carte FPGA Xilinx Zynq Exécution de la LTE sur multi-cores Résultats Conclusion Mariem MAKNI 07/11/2016 15
Brique Lego NXT ZC702 board Mariem MAKNI LTE MIMO-OFDM SYSTEM Outils 07/11/2016 16
Brique Lego NXT Vivado vs. ISE LTE MIMO-OFDM SYSTEM Vivado vs. ISE Les nouveaux outils de Xilinx Vivado offrent de nombreux avantages: Réduction du temps de compilation. Une meilleure utilisation des ressources. Des compilations plus rapides pour les cibles Zynq 7000 et SoC Zynq utilisant précédemment Xilinx ISE. Brique Lego NXT Mariem MAKNI 07/11/2016 17
Brique Lego NXT Mariem MAKNI LTE MIMO-OFDM SYSTEM Architecture Zynq 07/11/2016 18
Brique Lego NXT Un processeur Softcore :homogènes LTE MIMO-OFDM SYSTEM Processeur Softcore / Hardcore Un processeur Softcore :homogènes Un processeur Hardcore :homogènes Un softcore est une implémentation de processeur disponible sous forme de description haut niveau, dans un langage de description matérielle comme le VHDL ou le Verilog. Architecture très flexible : - La source disponible peut ainsi être modifiée à volonté. - Peut être reconfiguré pour s'adapter aux contraintes de chaque utilisation (périphériques, performances, ressources, consommation, fonctions etc.). Un hardcore est implanté dans le circuit électronique en « dur » et ne peut être modifié, il est vendu validé (sans bug) et optimisé en taille et en vitesse pour une cible technologique donnée. Il est plus performant que le processeur du type softcore. Brique Lego NXT Mariem MAKNI 07/11/2016 19
Plan Introduction Présentation de la LTE/4G. Introduction à la carte FPGA Xilinx Zynq Exécution de la LTE sur multi-cores Résultats Conclusion Mariem MAKNI 07/11/2016 20
AXI Shared Interconnect LTE MIMO-OFDM SYSTEM Architecture hétérogène Brique Lego NXT Dual core ARM cortex A9 Timer PS DDR3 Memory Controller UART Memory RS232 M_AXI_GP0 PL Mbze0 Local Memory M_AXI_DP Mbze1 Mbze2 Mbze3 AXI Shared Interconnect AXI Memory Interconnect Block BRAM AXI4 MDM Mbze AXI Periph AXI-BRAM Controller Mariem MAKNI 07/11/2016 21
Plan Introduction Présentation de la LTE/4G. Introduction à la carte FPGA Xilinx Zynq Exécution de la LTE sur multi-cores Résultats Conclusion Mariem MAKNI 07/11/2016 22
Résultats Profilage Exécuter le profilage de l’application LTE MIMO-OFDM Tx/Rx sur le processeur hardcore ARM. Résultat du Profilage de OFDM Tx sur un seul ARM avec la modulation QPSK IFFT Mariem MAKNI 07/11/2016 23
Résultats Profilage Résultat du Profilage de OFDM Rx sur un seul ARM avec la modulation QPSK FFT Brique Lego NXT Mariem MAKNI 07/11/2016 24
Parallel to Serial converter Résultats Flot de tâche de l’application Flot de tâches de l’application LTE MIMO-OFDM Tx (transmission) Des symboles OFDM à transmettre Matrice des nombres complexes à transmettre de taille (600x14x2) Input Pack data, add DC and reorder Remplissage de la structure « Tmp »de taille (28672) à partir de la matrice d’entrée tmp[28672] IFFT processing exécuté par la fonction consommatrice : static void MWDSPCG_R2DIT_TBLS_Z() Brique Lego NXT Add cyclic prefix (CP) & Parallel to Serial converter Ajout d’un préfixe cyclique (CP) au début de chaque symbole OFDM Output[30720] Output Mariem MAKNI 07/11/2016 25
Résultats de synthèse Occupation sur FPGA Figure 1. Occupation (en %) des différentes Configurations de Microblaze (m = {1,2,4,8,9}) Mariem MAKNI 07/11/2016 26
ARM , m Microblaze) (n = {1,2}, {m = 1,2,4,8,9}) Résultats de synthèse Puissance (watt) Figure 2. La consommation de puissance (en Watt) des différentes implémentations (n ARM , m Microblaze) (n = {1,2}, {m = 1,2,4,8,9}) Mariem MAKNI 07/11/2016 27
Résultats Temps d’exécution (en ms) Figure 3. Temps d’exécution (en ms) de l’application OFDM_Tx (transmission) sur (n ARMS, m Microblazes) (n={1, 2}, m={1,2,3,4,5,6,7,8,9}) en utilisant différents modulations {QPSK , 16QAM, 64QAM} Mariem MAKNI 07/11/2016 28
m Microblazes) (n={0,1, 2}, m={0,1,2,3,4,5,6,7,8,9,10}) Résultats Energie (Joules) Figure 4. Consommation d’Energie (en Joules) de l’application LTE-MIMO OFDM_Tx (Transmision) sur sur (n ARMS, m Microblazes) (n={0,1, 2}, m={0,1,2,3,4,5,6,7,8,9,10}) Mariem MAKNI 07/11/2016 29
Plan Introduction Présentation de la LTE/4G. Introduction à la carte FPGA Xilinx Zynq Exécution de la LTE sur multi-cores Résultats Conclusion Mariem MAKNI 07/11/2016 30
Conclusion La conception d’un système de traitement du signal optimisé à la fois en termes de: Performances (temps de réponse) Réalisation (coût, consommation, etc.) Nécessite l’utilisation d’une architecture matérielle constituée d’une structure de processeurs hétérogènes pour fournir le niveau de performance demandé par les applications. Les architectures multicores hétérogènes sont bien adaptées pour répondre au mieux: Aux exigences, contraintes et de diversité dans les types de traitements intensifs de données et contrôle). Brique Lego NXT 31
Démo Brique Lego NXT
Merci pour votre attention Brique Lego NXT