La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Julien Denoulet – Université Pierre et Marie Curie – Paris UPMC-SYEL IEF – AXIS ESIEE-A2SI Workshop AMINA 2008 – Monastir – 13-15/11/08.

Présentations similaires


Présentation au sujet: "Julien Denoulet – Université Pierre et Marie Curie – Paris UPMC-SYEL IEF – AXIS ESIEE-A2SI Workshop AMINA 2008 – Monastir – 13-15/11/08."— Transcription de la présentation:

1 Julien Denoulet – Université Pierre et Marie Curie – Paris UPMC-SYEL IEF – AXIS ESIEE-A2SI Workshop AMINA 2008 – Monastir – 13-15/11/08

2  Introduction  Modèle de calcul: Réseaux Associatifs  Architecture: Maille Associative  Evaluation algorithmique  Conclusion Workshop AMINA 2008 – Monastir – 13-15/11/08

3

4  Grande diversité des algorithmes et de leurs modes opératoires Traitements de bas niveau ◦ Implique souvent un point et son voisinage proche ◦ Mouvements de données réguliers et systématiques Traitements de plus haut niveau ◦ Implique des zones de forme et taille non-connues a priori ◦ Mouvements de données irréguliers et non-prédictibles  L’optimisation d’une chaîne de traitements sur une même plate-forme matérielle est un problème complexe Workshop AMINA 2008 – Monastir – 13-15/11/08 INTRO

5  Le parallélisme constitue une solution appropriée ◦ Multiplication des ressources de calcul  Parallélisme Massif de Données (SIMD) ◦ On attribue une unité de calcul à un petit nombre de pixels ◦ Permet de s’approcher de la géométrie des Images Workshop AMINA 2008 – Monastir – 13-15/11/08 INTRO

6  Architecture dédiée au traitement d’images ◦ Massivement parallèle ◦ Reconfigurable ◦ Asynchrone (partiellement) ◦ Idée force:  Adapter les structures de calcul et de communication aux mouvements de données rencontrés en analyse d’image Workshop AMINA 2008 – Monastir – 13-15/11/08 INTRO

7 Les Réseaux Associatifs [Mérigot, ] Workshop AMINA 2008 – Monastir – 13-15/11/08

8  Réseau de processeurs élémentaires (Pe) ◦ 1 Pe représente 1 pixel de l’image  Reliés par un graphe d’interconnexion GB ◦ GB = Graphe de base ◦ Orienté, symétrique ◦ Topologie quelconque Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

9  Les traitements se font sur un sous-graphe G de GB ◦ G est dynamiquement reconfigurable ◦ Il est possible d’activer/désactiver le lien entre 2 Pe voisins Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

10  Les traitements se font sur un sous-graphe G de GB ◦ G est dynamiquement reconfigurable ◦ Il est possible d’activer/désactiver le lien entre 2 Pe voisins  Représentation de: ◦ Régions connexes Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

11  Les traitements se font sur un sous-graphe G de GB ◦ G est dynamiquement reconfigurable ◦ Il est possible d’activer/désactiver le lien entre 2 Pe voisins  Représentation de: ◦ Régions connexes ◦ Contours Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

12  Les traitements se font sur un sous-graphe G de GB ◦ G est dynamiquement reconfigurable ◦ Il est possible d’activer/désactiver le lien entre 2 Pe voisins  Représentation de: ◦ Régions connexes ◦ Contours ◦ Graphes/Arbres orientés Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

13  Les traitements se font sur un sous-graphe G de GB ◦ G est dynamiquement reconfigurable ◦ Il est possible d’activer/désactiver le lien entre 2 Pe voisins  Représentation de: ◦ Régions connexes ◦ Contours ◦ Graphes/Arbres orientés  Codage local à l’aide d’une variable parallèle Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

14  Primitives locales: Opérations élémentaires ◦ Calcul local effectué simultanément dans chaque Pe ◦ Opérateurs logiques et arithmétiques standards  Primitives de calcul global: ASSOCIATION ◦ Primitive conjuguant ressources de calcul et de communication ◦ Combinaison de la valeur locale d’une variable parallèle avec celles des voisins  Dans un sous-graphe G donné  Par un opérateur associatif et commutatif (OR, ET, PLUS, MIN, MAX…)  Jusqu’à convergence des résultats locaux Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

15  But: Calcul de la valeur maximale de chaque région Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

16  But: Calcul de la valeur maximale de chaque région Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

17  Points clés du modèle ◦ Reconfigurabilité ◦ Associations  Une architecture basée sur les Réseaux Associatifs devra implémenter efficacement ces deux points Workshop AMINA 2008 – Monastir – 13-15/11/08 MODÈLE

18 La Maille Associative

19  Codage local des sous-graphes: Registre 8 bits ◦ 1 = Présence d’un arc incident venant du voisin ◦ 0 = Pas d’arc incident  Utilisation de portes ET pour masquer les voisins Nord-Ouest Ouest Sud-Ouest Sud Sud-Est Est Nord-Est Nord OPÉRATEURS ASSOCIATIFS Registre Mgraphe VoisinsVoisins Workshop AMINA 2008 – Monastir – 13-15/11/08 ARCHI

20  Codage local des sous-graphes: Registre 8 bits ◦ 1 = Présence d’un arc incident venant du voisin ◦ 0 = Pas d’arc incident  Utilisation de portes ET pour masquer les voisins  Seules les données avec un bit graphe=‘1’ sont transmises et contribuent au calcul Nord-Ouest Ouest Sud-Ouest Sud Sud-Est Est Nord-Est Nord OPÉRATEURS ASSOCIATIFS Registre Mgraphe VoisinsVoisins Workshop AMINA 2008 – Monastir – 13-15/11/08 ARCHI

21  Implémentation ASYNCHRONE des associations  Le réseau de communication est asynchrone ◦ Libre circulation des données ◦ Convergence du calcul assurée par les propriétés des opérateurs  Taille du réseau: 1 bit ◦ Opérations série ◦ Coût matériel minimal Workshop AMINA 2008 – Monastir – 13-15/11/08 ARCHI

22  Architecture SIMD massivement parallèle  Topologie: Grille 2D, 8-Connexité  Processeur Élémentaire ◦ Couche Synchrone  ALU pour calculs locaux  Mémorisation ◦ Couche Asynchrone  Gestion des associations  Reconfigurabilité du réseau Workshop AMINA 2008 – Monastir – 13-15/11/08 ARCHI

23  [Dulac ]  Maille de 4×4 Pe  Technologie: CMOS 1µm – Horloge: 50 MHz  Surface d’un Pe: ◦ 1500 transistors ◦ Couche asynchrone: 10% ◦ Banc mémoire (128 bits): 60%  Temps de calcul des associations (images 512×512 – données 8 bits) ◦ OR = 800 ns ◦ MAX = 1,6 µs ◦ PLUS = 21,3 µs Workshop AMINA 2008 – Monastir – 13-15/11/08 ARCHI

24  Ressources mémoire: ◦ La taille du banc devrait être doublée [Guezguez-99] ◦ Augmentation significative du coût matériel  L’implémentation se fait au dépend de la puissance de calcul des Pe ◦ Taille du chemin de données réduite ◦ Nombre et complexité limitée des opérateurs Workshop AMINA 2008 – Monastir – 13-15/11/08 ARCHI

25  Principe: ◦ 1 Pe a la charge de N pixels (Pe physique) ◦ N est appelé degré de virtualisation  1 Pe physique contient N Pe virtuels  Conséquences immédiates: ◦ Partage des ressources de calcul ◦ Sérialisation des opérations ◦ Activation successive des N Pe virtuels Processeur Physique 1 VPe1 Processeur Physique 2 VPe2 VPe3 VPe4 VPe1 VPe2 VPe3 VPe4 Workshop AMINA 2008 – Monastir – 13-15/11/08 ARCHI

26  Virtualisation des Pe [Denoulet, 2002] ◦ Uniquement dans la couche synchrone  Regroupement des ressources mémoires et des ressources de calcul  ALU remplacé par un ALU vectoriel SIMD ◦ Gain en surface de 25% si N=1024 ◦ 140 millions de transistors pour une Maille 256x256 Workshop AMINA 2008 – Monastir – 13-15/11/08 ARCHI

27

28  Quel est l’impact de la virtualisation sur les performances du circuit?  Architecture adéquate pour du traitement d’images temps réel?  Besoin d’un simulateur haut niveau de la Maille Associative prenant en compte les caractéristiques de son architecture Workshop AMINA 2008 – Monastir – 13-15/11/08 ALGO

29 ► ANET [Sicard, ] – Environnement de programmation des Réseaux Associatifs – Développement algorithmique C++ à haut niveau ► Couche Matérielle [Denoulet, 2004] – Inclut une configuration d’architecture de la Maille – Fournit un temps de calcul au cycle près de chaque instruction  Calcul online du temps d’exécution d’un algorithme sur une architecture donnée Workshop AMINA 2008 – Monastir – 13-15/11/08 ALGO

30  Estimation initiale du mouvement ◦ Par rapport à une image de référence ◦ Algorithme Σ-Δ [Manzanera,Richefeu-2004]  Relaxation markovienne de l’estimation initiale [Lalande 1990, Caplier 2001] ◦ Iterated Conditional Modes (ICM) ◦ Minimisation d’une fonction d’énergie  Energie de modèle  Energie d’adéquation Workshop AMINA 2008 – Monastir – 13-15/11/08 ALGO

31  Traitement implémenté sur: ◦ Maille Associative (Techno 90 nm, F=500 MHz, Virtu N=1024) ◦ PowerPC G4 (F = 1 GHz) ◦ [Lacassagne,Denoulet,Manzanera,Mérigot ] Workshop AMINA 2008 – Monastir – 13-15/11/08 ALGO G4Maille Cadences (images/s) ~1200~25000

32  Maille Associative ◦ Parallélisme massif ◦ Reconfigurabilité ◦ Asynchronisme  Virtualisation des processeurs ◦ Réduction significative de la taille du circuit ◦ Performances compatibles avec traitements temps réel Workshop AMINA 2008 – Monastir – 13-15/11/08 CONCLUSION

33  Aspects matériels - Virtualisation ◦ Augmentation de la puissance de calcul des Pe ◦ Bancs mémoire dynamique ◦ Remplacement des Pe synchrones par des cœurs de µP standards  Aspects algorithmiques ◦ Traitement d’image 3D ◦ Réseaux Associatifs Virtuels Workshop AMINA 2008 – Monastir – 13-15/11/08 CONCLUSION

34

35  Images 256x256  Maille 256x256, techno 90 nm, fréquence = 500 MHz ◦ Archi 1: Non virtualisée ◦ Archi 2: Virtualisation (N=1024) + ALU SIMD 128 bits Workshop AMINA 2008 – Monastir – 13-15/11/08 ALGO AlgorithmeArchi 1Archi 2 Filtre Sobel0,5 µs14,6 µs Egalisation Histogramme 22 µs780 µs Split & Merge Segmentation 0,25 – 0,56 ms5,97 – 14,82 ms Watershed Segmentation 9,05 µs421 µs [Denoulet, ]


Télécharger ppt "Julien Denoulet – Université Pierre et Marie Curie – Paris UPMC-SYEL IEF – AXIS ESIEE-A2SI Workshop AMINA 2008 – Monastir – 13-15/11/08."

Présentations similaires


Annonces Google