INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel ASIP Design and Synthesis for Non Linear Filtering in Image Processing Quelques notes sur l’article par Fanucci et al., DATE *** Toutes les figures, contenu, etc. sont tirés directement de l’article. Utilisation uniquement dans le cadre d’un cours universitaire. ***
Survol de l’article Conception d’un ASIP mieux que DSP (Digital Signal Processor), plus efficace mieux qu’un ASIC sur mesure (maintenir la flexibilité du logiciel) Algorithme de traitement vidéo non-linéaire: retinex (ajustement du contraste) Accès mémoire Besoins en calcul: linéarisation des équations non-linéaires calcul d’adresse automatisé boucle sans pénalité Architecture à pipeline résolution des dépendances de données élimination des dépendances de contrôle 2 INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel
Algorithme retinex: effet 3 INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel
Algorithme retinex: description 4 INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel
Flot de conception 5 INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel
Linéarisation de la fonction Gamma INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel clear all; clf; y = 0:255; gam = 0.4; gdey = 255 * (y / 255).^ (gam * (1 + y / 255)); plot(y, gdey); grid on; xlabel('y'); ylabel('\Gamma(y)'); title(['gamma = ' num2str(gam)]); axis([ ]); set(gca, 'XTick', 0:16:256); set(gca, 'YTick', 0:16:256); yiyi offset Q slope K ………
Pipeline Mémoire séparée pour les instructions. Deux RAM pour résultats intermédiaires. Une ROM pour le calcul des opérations non-linéaires linéarisées. 7 INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel X RAM Y RAM X RAM Y RAM coefficients
Jeu d’instructions Opérations non-linéaires linéarisées. Calcul automatique d’adresses: accès toujours selon le même patron. extension du mot d’instruction. Boucles sans pénalités: nombre d’itérations est fixe, dépend de la taille de l’image. Résumé: 42 instructions opérations non-linéaires linéarisées: 9 arithmétique: 11 conversion de couleurs: 6 accès mémoire: 9 initialisation: 6 boucle: 1 8 INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel
Autres considérations Pixels exprimés avec 8 bits. Résultats intermédiaires représentés avec 14 bits. ‘Bypass’ pour contourner les dépendances de données dans le pipeline. 9 INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel
Performance CMOS 130 nm, 1.2 V. Real time YUV, 24 fps, CIF (352 × 288). PSNR 30.7 dB p/r à l’algorithme original. 17 nJ/pixel. 10 INF8505: processeurs embarqués configurables Département de génie informatique et génie logiciel