1 Mise en œuvre d’un contrôleur UDMA-4 pour la machine RDISK Steven Derrien Équipe R2D2.

Slides:



Advertisements
Présentations similaires
Checkpoint et Rollback pour systèmes multi-core (1/2)
Advertisements

Martin Guibert Pereira Helder Steven Ly Aiman Krissane.
Coupe de France de Robotique 2007 Candidat n°4 – Steven LY BTS IRIS – PROMOTION
STRIE Systèmes Temps-Réel et Informatique Enfouie
votre besoin Double Compétence Qualité, Sécurité,
Evaluation dheuristiques pour lalignement de séquences génomiques Stéphane Guyetant Séminaire Symbiose du 23/01/03.
PLATEFORME Système Intégrés 19 mars 2002 Objectifs Architecture Les Projets et contrats Statut Perspectives PLATEFORME «Systèmes intégrés»
Implantation des Systèmes Embarqués Étude de cas - Projet
Gestion de la tolérance de pannes
People want to do X, but computers can only do Y. This leads to a problem. My job is to explain how this problem can be solved.
Plan Présentation de la Solution. Le Protocole MESI
Informatique parallèle hautes performances
simulateur de réseau de machines UML connectées par WiFi mode ad-hoc
La haute disponibilité
Brasseur Raccordement
Introduction Créer un réseau local :
N Formation de base et formation continue en microtechnologies Services aux entreprises Activités du Groupe de Microélectronique et Microsystèmes ä FUSE:développement.
SIMATIC S7-400 CPU S7-400 Innovation Sommaire
Topic: CP Advanced Name: P. BRASSIER Department: A&D.
Module de formation Introduction
Coupe de France de Robotique 2007 Candidat n°4 – Steven LY BTS IRIS – PROMOTION
Les mesures comparatives réalisées entre VxWorks et INtime donnent un net avantage au premier. L'expérience et la volonté de Wind River de garder un RTOS.
Présenté par :BENLAZREG med amine HADJ slimane anis
™.
Réalisée par :Samira RAHALI
Applications du perceptron multicouche
Le projet en STI2D Initier le projet Délimiter les champs du possible
Services fournis par le SI et technologies associées
L’IEEE
UTT : Un serveur Intranet
PLIC APPLE S OUTENANCE DE MI - SEMESTRE Application MR GREEN 1.
Progrès dATLAS en 2002 Mariane M. Brinet. Groupe Argon Liquide (physiciens): Alain Blondel, Imma Riu, Manuel Díaz Groupe SCT (physiciens) :Allan Clark,
Projet région Thématique prioritaire n°10 Calculs Scientifiques Logiciels Rhône-Alpes : Grille pour le Traitement dInformations Médicales (RAGTIME ?)
LES RESEAUX INDUSTRIELS
LEGO EPISODE III LEGO: simulations climatiques avec DIET E.Maisonnave, V.Pichon.
MICROLOR Le savoir partagé
Power PC embarqués et accélérateurs matériels pour des cibles de type FPGA Julien Dubois.
SECURITÉ / OPTIMISATION
Les systèmes mono-puce
Test et Testabilité des Circuits Intégrés Digitaux
Matthieu SIMON - Juin Contribution à la mise en œuvre de systèmes de vision pour la robotique. P rogrammable A nalog R etina-like I mage S ensor.
Noyau Linux et multi-processeur sur plateforme embarquée ST50 Vendredi 18 Mars 2005 – Thomas Petazzoni.
D. E ZEGOUR Institut National d ’Informatique
Steven Derrien Équipe R2D2
Nicolas Dumont Dayot pour le groupe LAr du LAPP
Système slow-control au LAPP
Améliorer la performance des organisations en apportant à toutes les équipes la meilleure compréhension de leur activité pour des décisions plus rapides.
Les Composants Logiques et d’Interfaces. 9 Octobre 2001 © astrium 2 La Stratégie Astrium SAS Vélizy Les Composants Logiques l Série 4000 : -Composants.
1 Université Henri Poincaré, Nancy 1 La préemption appliquée aux FPGAs Soutenance de rapport bibliographique de DEA Faculté des Sciences Vandoeuvre-lès-Nancy.
23/10/ Houdeng-Goegnies La BOURSE 23/10/ Houdeng-Goegnies aux idéesaux besoinsaux expertises.
Rapports M1 Terrain Géophysique Le rapport doit tenir en 25 pages maximum ; les tableaux de mesures peuvent être en annexe (non comprises dans les 25 pages).
SUNDANCE Multiprocessor Technology Ltd. Yann CLIN Stage effectué de février à juin Superviseur technique: Jocelyn SEROT Superviseur industriel: Emmanuel.
6 mois plus tard ….
Bilan réunion 17/10/2014 Voir avec le CEA le type de chip qu’ils ont fait fondre: une version 3D (rétine+réseau neurones), ou une version 2D avec rétine.
Composants à réseaux logiques programmables
Plate-forme bioinformatique de OUEST-genopole® Amnesix : Serveur de sauvegardes Stockage réseau Sun StorEdge(4 To) Matrix Cluster Alambix : Sun Fire
Systèmes et Logiciels Embarqués : l'informatisation des objets Gestion de l'énergie (bâtiment intelligent) Ferroviaire (trains, métro autom.,...) Equipements.
Les autorisations NTFS sont
Deug 11 Systèmes d ’Information : cours 2a Michel de Rougemont Université Paris II Matériels et Logiciels.
EQUIPEMENT RESEAU Licence NTI RIOS Frédéric – GANZOUAI Mohamed.
Nicolas Dumont Dayot pour le groupe ATLAS-LAPP 14/10/2013
Architecture et technologie des ordinateurs II
Utilisation de la plateforme DomoLeaf en mode Responsable
Gestion d’un Parc Informatique
Salles Pédagogiques en mode Terminal Serveur Enseignement et libre-service.
29 mars 2006J-P Meyer1 Evaluation des besoins en infrastructures et réseau  Evaluation des besoins en infrastructures  Evaluation des besoins réseau.
TOUT SAVOIR SUR L’OFFRE INFORMATIQUE NOTRE PARTENAIRE : DELL.
Architectures Matérielles Spécialisées pour la Bioinformatique Dominique Lavenier CNRS / IRISA.
PetaSky: Expérimentations avec HadoopDB et Hive 1 Amin Mesmoudi.
BABAR Georges Vasseur CEA Saclay, DSM/IRFU/SPP Workshop sur l’analyse des données au centre de calcul de Lyon 17 avril 2008.
Transcription de la présentation:

1 Mise en œuvre d’un contrôleur UDMA-4 pour la machine RDISK Steven Derrien Équipe R2D2

2 Contexte n Prototype RDISK de « disque intelligent » Disque dur couplé à un FPGA Traitement de banques de données génomiques Banques accédées essentiellement en lecture n Collaboration avec le Prof. A. Postola Queensland University (Brisbane) Application de simulation « Monte carlo » Possibilité de stage en Australie (à confirmer) n Objectif du mini-projet Améliorer les performances du contrôleur disque – Intégration d’un mode « écriture rapide » – Mise en œuvre du protocole UDMA-4

3 Hard drive 40 GB IDE 5000 RPM 15MB/s avg BW ~ 80$ (en 2001) Xilinx FPGA portes System on a Chip ~ 25$ (en 2001) 100Mbits Ethernet ~ 6$ / puce ~ 50 Mbps 15MB/S 150KB/s to 5MB/s Un prototype RDISK

4 Le principe n Filtrage en matériel (co-processeur) Reconfiguration du FPGA pour chaque appli Filtre spécialisé sur le FPGA Filtre très sélectif (<1%) parallel disk access ( disks) hardware filter switch Host post-processing (performed only on relevant data)

5 RDISK : Le Système Mono Puce 16 bit CPU (15%) Filtre matériel (50% ~ portes) IDE Ctrl (15%) Eth. Ctrl (3%) SDRAM CTRL (10%)

6 Le protocole IDE n Plusieurs normes +/- performantes IDE, UDMA, aujourd’hui SATA Transfert en mode blocs L’unité adressable est le secteur n Principe d’un transfert en mode IDE 1. Ecriture dans les registres de(s) des secteur à lire/écrire. 2. Attente active (lecture de registre d’état) 3. Ecriture de 256 mot sur 16bits 4. Attente active (lecture de registre d’état) 5. Si le transfert concerne plusieurs secteurs on repart en 3

7 Le contrôleur IDE (actuel) Cet automate traite les requêtes d’E/S provenant du CPU, et gère des écritures allant jusqu’à 255 secteurs Cet automate gère les aspects liés au « timing » des signaux du bus IDE

8 Le contrôleur IDE (actuel) n Lecture autonome Lecture de blocs de 128ko Envoyés directement vers le filtre (FIFO) n Limites Seulement des lectures rapides – Les écritures doivent se faire secteur par secteur Transferts en mode PIO-4 – Débit maximum ~15Mo/sec n Améliorations Ecriture rapide par PIO command Gestion de l’UDMA par PIO transfert

9 Le protocole UDMA n La version PIO est limité à 15Mo/sec Insuffisant pour certaines applications Moins rapide que sur un PC n Le mode UDMA permet jusqu’à 66Mo/sec Protocole plus récent / + complexe Nécessite un double connecteur Données échangées sur double front d’un signal

10 n Pour l’écriture : le FPGA qui envoie HSTROBE n Pour la lecture : le Disque envoie DSTROBE Le problème du « source synchronous » Facile à mettre en œuvre avec une bascule « Toggle » Problème : il faut stocker dans un registre les données sur chaque front montant et descendant du signal « DSTROBE ».

11 Le problème du « source synchronous » n Solution 1 : On utilise le signal DSTROBE comme une horloge, qui commande deux registres connectés au bus DD, et qui fonctionnent respectivement sur front montant et descendant. En pratique, cela ne marche pas, car le signal DStrobe est trop bruité pour servir d’horloge, et risque de provoquer des erreurs. Il faut tout faire de manière synchrone avec un seule horloge interne au FPGA

12 n Solution 2 : On échantillonne les données du bus Il y a une relation liant les périodes (a) et (b), on doit donc échantillonner avec un fréquence élevée Pour le projet, le max est 100MHz, et on est « limite » Le problème du « source synchronous » t t+1 t+2 Si à l’instant t+2, on détecte un front sur le signal DSTROBE échantillonné, on sait que la donnée était présente à t. (a) (b)

13 Travail à effectuer n Gestion des écritures dans PIOCommand Modifier le (les) automates VHDL Ajout d’une FIFO pour les données à écrire Valider le fonctionnement sur la carte Gestion du mode UDMA- x Gestion avec sur-echantillonnage (clkx4) Essayer d’aller le + loin (UDMA 4, 5 voire 6) Validation sur de gros volumes de données

14 Bu du cache xr C 82D2 sw r2,2(r13) sw r2, 2(sp) 001E 83D4 sw r3,4(r13) sw r3, 4(sp) loop: D2 lw r2,2(r13) lw r2, 2(sp) D4 lw r3,4(r13) lw r3, 4(sp) add r2,r3,r2 add r2,r2,r and r0,r0 sw r2, 4(sp) D4 sw r2,4(r13) 002A 83D2 sw r3,2(r13) sw r3, 2(sp) 002C D002 imm 0020 br loop 002E A000 jal r0,0(r0) 002E A000 jal r0,0(r0) est perdue Problème : le signal prev_addr devrait commander du cache