La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 1 UMR 6164 Optimisations Mémoire dans la Méthodologie AAA pour Code Embarqué sur Architectures.

Présentations similaires


Présentation au sujet: "INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 1 UMR 6164 Optimisations Mémoire dans la Méthodologie AAA pour Code Embarqué sur Architectures."— Transcription de la présentation:

1 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 1 UMR 6164 Optimisations Mémoire dans la Méthodologie AAA pour Code Embarqué sur Architectures Parallèles RAULET Mickaël 18 mai 2006 Mitsubishi ITE - Equipe Software Radio IETR/INSA - Groupe Image INRIA – Groupe AOSTE

2 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 2 Plan Introduction –Objectifs –Problématique SynDEx Minimisation mémoire Applications Conclusions perspectives

3 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 3 Introduction : Objectifs Développement dune méthodologie de prototypage rapide pour architectures complexes – Diminution du temps de développement pour le portage sur une cible multi-composants (PC, DSP et/ou FPGA) Développement dapplications dans le domaine de lembarqué (téléphonie mobile, décodeurs de salons) – Réalisation de démonstrateurs

4 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 4 Prototypage rapide dapplications de traitement du signal et images pour systèmes embarqués temps réel sur architectures distribuées hétérogènes –Méthodologies pour passer rapidement (automatiquement) dune description de haut niveau de lapplication à une implantation exécutable –Méthodologie AAA (Adéquation Algorithme Architecture) Introduction : Problématique

5 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 5 Introduction : Problématique Prototypage rapide dapplications de traitement du signal et images pour systèmes embarqués temps réel sur architectures distribuées hétérogènes –Applications fortement orientées données

6 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 6 Introduction : Problématique Prototypage rapide dapplications de traitement du signal et images pour systèmes embarqués temps réel sur architectures distribuées hétérogènes –Minimisation des ressources et exécution suffisamment rapide

7 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 7 Introduction : Problématique Prototypage rapide dapplications de traitement du signal et images pour systèmes embarqués temps réel sur architectures distribuées hétérogènes –Distribution/ordonnancement des traitements

8 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 8 Introduction : Problématique Prototypage rapide dapplications de traitement du signal et images pour systèmes embarqués temps réel sur architectures distribuées hétérogènes –Mise en oeuvre conjointe de composants cible variés –Travaux essentiellement sur cibles multi-composants

9 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 9 Introduction : Problématique Systèmes multi-composants Systèmes embarqués –Limitation mémoire Traitement du signal, télécommunications et vidéo –Consommation mémoire importante Nécessité dune optimisation mémoire Nécessité dune méthodologie adaptée

10 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 10 SynDEx : Présentation SynDEx : Synchronized Distributed Executives –Logiciel de CAO niveau système pour applications distribuées temps réel et embarquées –INRIA Rocquencourt projet AOSTE (Y. Sorel) Fonctionnalités –Partitionnement/ordonnancement automatiques dune application sur une architecture cible –Algorithme glouton basée sur une minimisation de la latence (optimisation orientée vitesse) –Génération dun exécutif distribué indépendant de la cible

11 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 11 SynDEx : Caractéristiques Approche globale Modèle unifié de graphes –Algorithme : parallélisme potentiel –Architecture : parallélisme disponible –Implantations : transformations de graphes Adéquation –Choix dune implantation optimisée But –Génération automatique dexécutifs taillés sur mesure aux applications, basés sur un ordonnancement hors-ligne des calculs et des communications

12 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 12 SynDEx : Caractéristiques Graphe dArchitecture Graphe d Algorithme Adéquation rootDSP1FIFOs Opéra -tions Graphe Temporel - Niveaux hiérarchiques - Conditionnement - Répétition

13 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 13 SynDEx : Caractéristiques Exécutif supporte : –lexécution de lalgorithme sur larchitecture –lordonnancement, les communications et les synchronisations Taillé sur mesure : –Minimisation du surcoût spatial et temporel –Implantation optimisée (latence) –Sans inter-blocage, garantie ordre total du graphe dalgorithme Basé sur macro-code –Indépendant du processeur –Supportant des architectures hétérogènes, portabilité Basé sur des bibliothèques génériques dépendantes –des processeurs (DSP, PC, FPGA…) –des communicateurs (SAM=FIFO, RAM)

14 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 14 Plan Introduction SynDEx –Présentation –Caractéristiques –Chaîne de développement Minimisation mémoire Applications Conclusions perspectives

15 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 15 SynDEx : Chaîne de développement Algorithme Architecture Exécutifs Spécifiques Exécutifs Génériques Adéquation Télécommunication –UMTS –MC-CDMA Vidéo –LAR –MPEG4 Plate-formes –Sundance –Pentek Composant –DSP –FPGA Bibliothèques Prototypage rapide et domaine dapplications

16 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 16 SynDEx : Chaîne de développement Exemple de topologie : Sundance Plusieurs types de processeurs et de communicateurs Framegrabber Module FPGA Module DSP

17 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 17 SynDEx : Chaîne de développement Génération de code Générique larchitecture Dépendant de lapplication Dépendant de Type de media Dépendant du Type de processeur Dépendant du SynDEx.m4x C62x.m4x C64x.m4x Pentium.m4x Fpga.m4x SDB.m4x(C62x, C64x, Fpga ) CP.m4x(C62x, C64x, Fpga ) BUS_PCI_RAM.m4x (Pentium,C62x, C64x) BUS_PCI_SAM.m4x (Pentium,C62x, C64x) TCP.m4x (Pentium,C62x) Bifo.m4x (C62x,Fpga) Bifo_DMA.m4x (C62x,Fpga) ApplicationName.m4x Arborescence des bibliothèques

18 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 18 SynDEx : Chaîne de développement Développements de nombreuses bibliothèques Vérification fonctionnelle –Ajout de fonction daffichage de limage directement sous SynDEx Display générique Webcam Vérification et exploration architecturale TCP –facilitant la vérification fonctionnelle de lapplication séparation de codeur-décodeur –possibilité de décrire des architectures complexes (multi-PC) plateformes de test et de vérification

19 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 19 Plan Introduction SynDEx Minimisation mémoire –Objectifs –Principes dallocation –Mono-composant –Multi-composants Applications Conclusions perspectives

20 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 20 Minimisation mémoire : Objectifs AlgorithmeArchitecture Adéquation Génération de Code Minimisation des allocations de buffers

21 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 21 allocD Minimisation mémoire : Principes dallocation Une allocation (buffer) allouée pour chaque sortie

22 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 22 o2 opr1 Ram D/P o1 o4 o3 all.Po1 all.Po2 all.Po4 all.Po3 all.D_o1o2 all.D_o2o3 all.D_o1o2 all.D_o2o3 all.D_o3o4 all.Po1 all.Po2 all.Po4 all.Po3 all.Dlo1 all.Dlo2 all.Dlo4 all.Dlo3 all.Dlo1 all.Dl2 all.Dlo4 all.Dlo3 all.D_o3o4 ESPACE MEMOIRE RAM données données communiquées locales programmes Minimisation mémoire : Mono-composant

23 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 23 b a ce d f Graphe d intervalles Minimisation mémoire : Mono-composant Coloriage de graphe –Approche classique –minimisation des buffers (« registre ») Tri par ordre croissant des dates de début Méthode gloutonne Minimum de couleur Buffers de même type et de même taille 3 couleurs = 3 buffers TfTd Durée d allocation du registre Légende a c b d e f Graphe dintervalles

24 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 24 Minimisation mémoire : Mono-composant Autre Méthode mono-composant –Minimisation « tétris » Basée également sur la durée de vie des buffers Basée uniquement sur des buffers de même type Minimum 6 couleurs = 6 registres

25 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 25 Plan Introduction SynDEx Minimisation mémoire –Objectifs –Principes dallocation –Mono-composant –Multi-composants Applications Conclusions perspectives

26 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 26 Minimisation mémoire : Multi-composants Considération des buffers communiqués inter-processeurs –Diminution accrue de lespace mémoire Durée de vie des buffers communiqués liée au modèle de synchronisation de SynDEx

27 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 27 Opr1Com1aCom2aOpr2 processeur1processeur2 RAM D/P SAM RAM D/P sendreceive sendreceive inout calc1 calc2 in calc1 out calc2 allocD allocP allocDl allocP allocDl allocP allocDl allocP allocDl Minimisation mémoire : Multi-composants Distribution/ordonnancement

28 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 28 in calc out sendreceive Opr1Comr1aComr2aOpr2 processeur1processeur2 RAM D/P SAM RAM D/P all.Pin all.Dlin all.Pcalc all.Dlcalc all.Pout all.Dlout all.Din/calc all.Dcalc/out all.Din/calc loop endloop in_ini in_end out_ini out_end Minimisation mémoire : Multi-composants

29 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 29 in send Opr1Comr1a processeur1 RAM D/P loop endloop in send Pre-E Pre-F Suc-E Suc-F in send Pre-E Pre-F Suc-E Suc-F s_full Pre-F Suc-F Suc-E Pre-E s_empty Minimisation mémoire : Multi-composants Schéma de principe dans SynDEx Durée de vie du buffer sur un cycle Pas de réutilisation possible des buffers communiqués inter-processeurs

30 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 30 Minimisation mémoire : Multi-composants send Opr1Comr1a processeur1 RAM D/P loop endloop in1 Suc-E Pre-E s_empty s_full Pre-F Suc-F Durée de vie du buffer minimale Calcul in1 send loop endloop Calcul Pre-F Suc-F Pre-E Suc-E Communications bloquantes Modèle SynDEx

31 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 31 Minimisation mémoire : Multi-composants send Opr1Comr1a processeur1 RAM D/P loop endloop in1 Suc-E Pre-E s_empty s_full Pre-F Suc-F Durée de vie du buffer = adéquation Calcul in1 send loop endloop Calcul2 Calcul1 Pre-F Suc-F Pre-E Suc-E Communications comme sur le graphe temporel

32 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 32 Minimisation mémoire : Multi-composants Solution : –Modifications du modèle SynDEx –Sans changement de lordre total –Avec prise en compte des temps de communications Sans changement de la latence –Optimisations de la mémoire avec un gain important

33 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 33 Minimisation mémoire : Multi-composants Principe de la réutilisation

34 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 34 Minimisation mémoire : Conclusion Minimisation mémoire mono-composant efficace –Minimisation « registre » –Minimisation « tétris » Minimisation mémoire multi-composants –Prise en compte des buffers communiqués inter-processeurs Optimisation supplémentaire de la génération de code –Opérations implicites générant des « recopies » de buffers à buffers : Explode – implode Conditionnement Retard ou mémoire

35 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 35 Plan Introduction SynDEx Minimisation mémoire Applications –UMTS –MPEG-4 –LAR Conclusions perspectives

36 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 36 Applications : UMTS FDD Troisième génération de téléphone portable Caractéristiques –Débits maximum 2 Mbits/sec –Temps réel 10ms par trame –1 trame = 15 slots

37 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 37 init Applications : UMTS (Tx) init trame slot trame par trame slot par slot

38 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 38 Applications : UMTS Minimisation UMTS Portage sur un C6203 à 512 ko de RAM Automatique Mieux que manuellement Gain de 7 Très proche dun gain attendu de 7.5 Minimisation de toutes les recopies Diminution du temps ModulationDémodulation SynDEx Registre Tétris Tétris multi-composant Gain maximum77

39 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 39 Applications : MPEG-4 Successeur de MPEG-2 Norme composée de sous-parties –Partie 2 = Vidéo Norme complexe (boîte à outils) –Scène composée dobjets –Images de synthèse –Images naturelles –…

40 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 40 Application : Décodeur MPEG-4 Décodeur images I (Intra) existant : –Description bas niveau Granularité fine 3 niveaux dabstraction de description –Niveau image haut niveau Image I, P et B –Niveau macrobloc niveau intermédiaire 16 * 16 pixels –Niveau bloc bas niveau 6 blocs dans un macrobloc –4 blocs de luminance –2 blocs de chrominance

41 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 41 Application : Décodeur MPEG-4 Description gros grain Description niveau Image –Images I –Images P –Images B Base des descriptions plus détaillées –Description niveau intermédiaire –Description bas niveau Séquence Vidéo Image BImage I Affichage Image Image P

42 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 42 Application : Décodeur MPEG-4 Description gros grain affichage Récupération de limage dans le flux Mémorisation image Choix du type de décodage dimage Vop_coding_type = 0 Vop_coding_type = 1 Vop_coding_type = 4 Image IImage BImage P

43 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 43 Application : Décodeur MPEG-4 Description gros grain Description de haut niveau –Gros grain –Résultats sur DSP (C6416 à 400 MHz) Extension de ces résultats sur DSP à 1GHz Temps moyen avec communications QCIF : 5 ms CIF : 12 ms 640*480 : 30 ms

44 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 44 Application : Décodeur MPEG-4 Description grain fin Décodeur bas niveau grain fin –Granularité du décodeur : VLC inverse (VLC = codage à longueur variable) Scan inverse (scan = balayage) DCT inverse (DCT = transformée discrète en cosinus) … –Possibilité de parallélisme Basée sur –Description haut niveau –Description images I bas niveau

45 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 45 Application : Décodeur MPEG-4 Description grain fin Schéma hiérachiques : Séquence Vidéo Image PImage I Description haut niveau Niveau macrobloc Niveau bloc Macrobloc I MB INTRA I VLC inverse MB Blocs Luminance I Bloc Cb IBloc Cr I X1 IX2 IX3 IX4 IXCb IXCr I Description Images I bas niveau Macrobloc P MB non codé Blocs Luminance non codés Bloc Cb Non codé Bloc Cr Non codé MB Codé MB INTERMB INTERQMB INTER4V Interpolation MB Blocs Luminance P Bloc Cb PBloc Cr P X1PX2 PX3 PX4 PXCb PXCr P cbp Xn = 0cbp Xn = 1 MB INTRA PMB INTRAQ P Description Images P bas niveau

46 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 46 Complexité SynDEx du décodeur bas niveau –Nombre dopérations proportionnel au nombre de macroblocs –Temps pour générer lexécutif –Temps pour générer lexécutif (QCIF > 12 h !) –Longueur de lexécutif –Longueur de lexécutif Nombre dopérations Nombre dopérations taille de la vidéo (1) nombre d'opérations 1 MB493 5 MB MB MB MB MB (1) en nombre de macroblocs MB Description intermédiaire niveau macrobloc Application : Décodeur MPEG-4 Description grain fin

47 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 47 Application : Décodeur MPEG-4 Description gros grain Décodeur MPEG-4 sur 2 processeurs : –description de haut niveau (352*288) Gain de 54 recopies Minimisation mémoire : –Gain de 1,6 (Granularité de lapplication trop forte) Decodeur MPEG4processeur 1processeur 2 SynDEx Registre Tétris multi-composants Gain maximum1,6

48 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 48 Application : Décodeur MPEG-4 Description gros grain Haut niveau taille 80*64 haut niveau sans optimisationTétris gain :1,07 taille 80*64 niveau intermédiaire sans optimisationTétris gain :11 taille 176*144 niveau intermédiaire sans optimisationTétris gain :52 taille 80*64 bas niveau sans optimisationTétris gain :10 Niveau intermédiaire Bas niveau

49 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 49 Applications : LAR Méthode développé au sein du laboratoire Image Méthode basée contenu Méthode hiérarchique –Images fixes –Fort taux de compression

50 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 50 Application : CODEC LAR

51 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 51 Application : CODEC LAR Slice

52 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 52 Codec LAR sur 2 Processeurs –Div_pic = 1 –117 opérations –352*288 CODEC LARprocesseur 1processeur 2 SynDEx sans optimisation optimisation Tétris multi-composants Gain32,1 Codec LAR sur 2 processeurs –Div_pic = 2 –239 opérations –352*288 CODEC LARprocesseur 1processeur 2 SynDEx sans optimisation Registre Tétris multi-composants Gain3,93 Application : CODEC LAR

53 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 53 Plan Introduction SynDEx Minimisation mémoire Applications Conclusions perspectives

54 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 54 Conclusions perspectives : Optimisation mémoire Conclusion –Génération de code automatique embarquée –Post-traitement mémoire efficace –Codage dans loutil SynDEx Temps de minimisation efficace pour trouver la solution Perspectives –Mise en place de la cache Travaux de F. Urban –Mise en place des algorithmes génétiques Minimisation multi-critères

55 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 55 Conclusions perspectives : Optimisation mémoire AlgorithmeArchitecture Adéquation Génération de Code Mise en place dune heuristique multi-critère : Algorithme Génétique

56 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 56 Conclusions perspectives : Applications Conclusion –Diversité des applications –Complexité des applications Niveau de granularité différent Perspectives –Intégration dun décodeur MPEG4-AVC dans un terminal (projet –Extension du LAR (LAR vidéo) –Extension de la méthodologie AAA pour des systèmes multi-couches (G. Roquier) Alliant vidéo et télécommunications

57 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 57

58 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 58 Utiliser intelligemment les mémoires suivant lapplication –Traitement sur des données en mémoire interne : Plus rapide quavec des données en mémoire externe Pour le décodeur MPEG-4 : –Objectif : placement mémoire optimal sur les DSP Buffers touchant au flux mémoire interne Buffers image mémoire externe : temps de décodage Utilisation du QDMA (accélération des transferts mémoires) Application : Décodeur MPEG-4 Minimisation mémoire

59 RAULET Mickaël – 18 mai 2006 INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 59 Utilisation du QDMA pour le décodeur : –Transferts mémoires externe-interne et externe-externe Mémorisation de limage, recopie dans les buffers de sortie de limage Image Bloc 8x8 Transfert du bloc 8x8 dans limage Transfert du bloc 8x8 de limage dans le bloc Bloc 8x8 Image Isolement dun macrobloc dans une image Stockage dun bloc dans limage Application : Décodeur MPEG-4 Minimisation mémoire


Télécharger ppt "INSTITUT DÉLECTRONIQUE ET DE TÉLÉCOMMUNICATIONS DE RENNES 1 UMR 6164 Optimisations Mémoire dans la Méthodologie AAA pour Code Embarqué sur Architectures."

Présentations similaires


Annonces Google