Université de Perpignan Via Domitia

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
17 B. Goossens D. Defour17 B. Goossens D. Defour Prédiction des retours Le prédicteur adresse une pile (mémoire à 2 ports)
Licence pro MPCQ : Cours
Distance inter-locuteur
Le pluriel des noms
Architecture des processeurs généralistes haute performance
Les numéros
ACTIVITES Les fractions (10).
Est Ouest Sud 11 1 Nord 1 Laval Du Breuil, Adstock, Québec I-17-17ACBLScore S0417 Allez à 1 Est Allez à 4 Sud Allez à 3 Est Allez à 2 Ouest RndNE
Sud Ouest Est Nord Individuel 36 joueurs
Les identités remarquables
Les Prepositions.
VIRAGES SYMETRIQUES EN PALIER, MONTEE ET DESCENTE
Objectifs Nous allons concevoir une mise en œuvre contenant un noyau de jeu d’instructions. Nous verrons comment l’architecture de jeu d’instructions.
Les éléments de mémorisation
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
Construction des 3 hauteurs
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Ecriture simplifiée d'une somme de relatifs
Description du fonctionnement d'un système 1 Clic Clic
2 1. Vos droits en tant quusagers 3 1. Vos droits en tant quusagers (suite) 4.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES COHESION CULTURELLE ET EXPANSION DES IDEES SUR LE TERRITOIRE EUROPEEN.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
ARCHITECTURE GLOBALE CAPTAGE Traitement DES des données GRANDEURS
Synchronisation et communication entre processus
Titre : Implémentation des éléments finis sous Matlab
Académie de Créteil - B.C Quest-ce quune Inscription 1)1 action + 1 stagiaire + 1 client 2)Parcours individuel (avec son Prix de Vente) 3)Un financement.
INDUSTRIE sa Tel : 0033(0) Fax : Projet: SKIP CAPSULES – v.1 Client: CARDIVAL HEALTH.
CONCEPTION ET SIMULATION DE CIRCUITS ÉLECTRONIQUES
LES NOMBRES PREMIERS ET COMPOSÉS
La Saint-Valentin Par Matt Maxwell.
Unit 4: Les animaux Unit 4: Les animaux.
1 INETOP
Calculs et écritures fractionnaires
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Notre calendrier français MARS 2014
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Titre : Implémentation des éléments finis en Matlab
C'est pour bientôt.....
Les Nombres 0 – 100 en français.
Veuillez trouver ci-joint
Résoudre une équation du 1er degré à une inconnue
GIF-3002 SYSTÈMES MICRO- PROCESSEURS ET INTERFACES
SUJET D’ENTRAINEMENT n°4
Aire d’une figure par encadrement
Équipe 2626 Octobre 2011 Jean Lavoie ing. M.Sc.A.
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
SUJET D’ENTRAINEMENT n°1
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
* Source : Étude sur la consommation de la Commission européenne, indicateur de GfK Anticipations.
Nom:____________ Prénom: ___________
CALENDRIER-PLAYBOY 2020.
Les Chiffres Prêts?
Médiathèque de Chauffailles du 3 au 28 mars 2009.
Chapitre 3 :Algèbre de Boole
Transcription de la présentation:

Université de Perpignan Via Domitia Architecture B. Goossens et D. Defour Dali Université de Perpignan Via Domitia B. Goossens 1 D. Defour

Quelques systèmes actuels Plan du cours Introduction Technologie Circuiterie Micro-architecture Quelques systèmes actuels B. Goossens 2 D. Defour

Quelle machine? un PC de base? B. Goossens B. Goossens 3 3 D. Defour D. Defour

Quelle machine? Une station bi-processeur? B. Goossens B. Goossens 4 4 D. Defour D. Defour

Quelle machine? Un serveur réseau? B. Goossens B. Goossens 5 5 D. Defour D. Defour

Quel processeur? Intel P4? B. Goossens B. Goossens 6 6 D. Defour D. Defour

Quel processeur? AMD Athlon 64? B. Goossens B. Goossens 7 7 D. Defour D. Defour

Quel processeur? P4 Hyperthreading? B. Goossens B. Goossens 8 8 D. Defour D. Defour

Quel processeur? AMD Opteron? B. Goossens B. Goossens 9 9 D. Defour D. Defour

Pour répondre à ces questions, il faut connaître: les standards de bus (FSB, AGP, PCI, PCIx, USB) la micro-architecture des contrôleurs (CM, CIO) la micro-architecture du processeur (pipeline, exécution ooo, spéculation, hiérarchie mémoire, E/S) Comprendre la micro-architecture suppose qu’on connaisse: la technologie (CMOS) et les portes de base la circuiterie (mémoire, calcul, transmission, contrôle) B. Goossens B. Goossens 10 10 D. Defour D. Defour

Un transistor nMOS passe bien les ‘0’ Technologie CMOS Transistor nMOS Transistor pMOS Un transistor nMOS passe bien les ‘0’ Un transistor pMOS passe bien les ‘1’ B. Goossens B. Goossens 11 11 D. Defour D. Defour

Combien de transistors sur une puce? Une puce est un carré de côté w, surface s La finesse de gravure l permet d’y dessiner w/4l lignes et w/4l colonnes, soit w²/16l² cellules Dans chaque cellule, on peut déposer 1 transistor Plus la logique du circuit est régulière, plus le remplissage est dense (matrice mémoire) P4: s = 237 mm², l = 90 nm, 178M de transistors Athlon 64: s = 193 mm², l = 130 nm, 106M de tr. DDR2 512Mb: s = 70 mm², l = 90 nm, 512M de tr. Conso P4: 130W, Athlon: 90W, DDR2: 1W B. Goossens B. Goossens 12 12 D. Defour D. Defour

Porte de transfert CMOS Quand d = 0 et p = 1, le transistor pMOS passe d en s Quand d = 1 et p = 1, le transistor nMOS passe d en s La porte de transfert passe bien les ‘0’ et les ‘1’ B. Goossens B. Goossens 13 13 D. Defour D. Defour

Portes logiques CMOS Inverseur Xor Et Ou B. Goossens B. Goossens 14 14 D. Defour D. Defour

Porte de transfert CMOS Multiplexeur Une porte de transfert passe une variable Une porte logique passe une constante Une porte de transfert affaiblit son entrée Une porte logique amplifie son entrée B. Goossens B. Goossens 15 15 D. Defour D. Defour

Portes CMOS B. Goossens B. Goossens 16 16 D. Defour D. Defour

Séparateur CMOS: le verrou Deux inverseurs en série Quand h = 1 (verrou passant), s = e Quand h = 0 (entrée stable), s mémorise e Quand e’ remplace e (h stable), s conserve e B. Goossens B. Goossens 17 17 D. Defour D. Defour

Séparateur CMOS: le verrou Verrou passant quand h = 0 B. Goossens B. Goossens 18 18 D. Defour D. Defour

Séparateur CMOS: la bascule Quand h = 1 (#v non passant), s est isolé de e Quand h = 0 (v non passant), s est isolé de e Quand h monte, le dernier e devant v passe en s B. Goossens B. Goossens 19 19 D. Defour D. Defour

Séparateurs CMOS B. Goossens B. Goossens 20 20 D. Defour D. Defour

Lecture: d = #d = Z et a = 1 alors q = m Cellule mémoire SRAM Lecture: d = #d = Z et a = 1 alors q = m Ecriture: d = m’ et #d = #m’ et a = 1 Quand a = 0, la cellule n’est pas accédée En écriture, ce qui est écrit est aussi lu B. Goossens B. Goossens 21 21 D. Defour D. Defour

Lecture: d = Z et a = 1 alors d = q Cellule mémoire DRAM Lecture: d = Z et a = 1 alors d = q Ecriture: d = q’ et a = 1 alors q = q’ La lecture est destructrice (suivie d’une réécriture) Quand a = 0, la cellule n’est pas accédée La charge mémorisée en q disparait progressivement Le contenu de la cellule doit être rafraichi (lecture puis réécriture) B. Goossens B. Goossens 22 22 D. Defour D. Defour

Recherche: a = 0 et d = m’ alors si m == m’ alors s = Z (succès) Cellule mémoire: CAM Recherche: a = 0 et d = m’ alors si m == m’ alors s = Z (succès) sinon s = 0 (échec) Remplacement: a = 1 et écriture en SRAM B. Goossens B. Goossens 23 23 D. Defour D. Defour

Cellule mémoire: plusieurs ports Fifo: un port de lecture et un port d’écriture Registre: n ports de lecture et m ports d’écriture Attention: la surface de la cellule est proportionnelle au carré du nombre de ports (temps d’accès) B. Goossens B. Goossens 24 24 D. Defour D. Defour

Cellules mémoires B. Goossens B. Goossens 25 25 D. Defour D. Defour

Circuit: diviser pour régner Comparateur d’égalité B. Goossens B. Goossens 26 26 D. Defour D. Defour

Circuit: comparateur d’ordre a < b  si ab < bb alors ah £ bh sinon ah < bh a £ b  si ab £ bb alors ah £ bh sinon ah < bh B. Goossens B. Goossens 27 27 D. Defour D. Defour

Circuit: décodeur (nom -> position, x -> 2x) y[3,0] = (x1x0 , x1#x0 , #x1x0 , #x1#x0) B. Goossens B. Goossens 28 28 D. Defour D. Defour

Circuit: codeur (position -> nom, 2x -> x) y=11 x=0011 y=01 x=0000 #z=0 x=0110 y=10 y1 = (x3x2 != 0) y0 = si #z1 alors code(x3x2) sinon code(x1x0) #z = (x != 0) B. Goossens B. Goossens 29 29 D. Defour D. Defour

Circuit: démultiplexeur La donnée d est aiguillée vers la voie sx B. Goossens B. Goossens 30 30 D. Defour D. Defour

Circuit de séparation asynchrone: le verrou Pour v: si h = 1 alors s = e Pour #v: si h = 0 alors s = e B. Goossens B. Goossens 31 31 D. Defour D. Defour

Circuit de séparation synchrone: le registre Pour b: quand h monte, e passe en s Pour #b: quand h descend, e passe en s B. Goossens B. Goossens 32 32 D. Defour D. Defour

Un traitement peut être subdivisé (pipeliné). Pipeline Un traitement peut être subdivisé (pipeliné). Un morceau (le producteur) est séparé de son successeur (le consommateur) par un registre. Cela permet d’augmenter la fréquence des traitements. B. Goossens B. Goossens 33 33 D. Defour D. Defour

Circuit de calcul: additionneur calcule a+b+0 a+b+1 Additionneur 4 bits, composable pour extension B. Goossens B. Goossens 34 34 D. Defour D. Defour

Circuit de calcul: additionneur s0 = a + b s1 = a - #b = a + b + 1 Dans N: r0, retenue de a + b, r1 = (a >= #b) Dans Z: d0, dépassement de capacité de a + b Dans Z: d1, dépassement de capacité de a - #b B. Goossens B. Goossens 35 35 D. Defour D. Defour

Circuit de calcul: décaleur à gauche g = r * 2x décalage signé ou non selon s/#ns (e.g.: (-1)*2 = -2) B. Goossens B. Goossens 36 36 D. Defour D. Defour

Circuit de calcul: décaleur à droite d = r / 2x décalage signé ou non selon s/#ns (e.g.: (-1)/2 = -0,5) B. Goossens B. Goossens 37 37 D. Defour D. Defour

Circuit de calcul: multiplieur Le produit est une somme de produits partiels Chaque produit partiel est soit 0 soit a décalé Produit 32 bits * 32 bits: 31 additions en série! B. Goossens B. Goossens 38 38 D. Defour D. Defour

Circuit de calcul: multiplieur Une seule addition à retenue r3,2: réducteur 3 vers 2 ((a, b, c) -> (r, s)) Réduire la hauteur (base élevée redondante) B. Goossens B. Goossens 39 39 D. Defour D. Defour

Circuit de calcul: calcul flottant Norme IEEE 754 f = (-1)s * 2e-b * (1 + m/(2p)) En simple précision, p = 23 et b = 127 En double précision, p = 52 et b = 1023 (b est le biais; ainsi (e1,m1) < (e2,m2)  f1<f2) Circuits de calcul spéciaux B. Goossens B. Goossens 40 40 D. Defour D. Defour

Circuit de calcul: addition flottante alignement mantisses m1 + m2, m1 + m2 + 1 normaliser e, m, e’, m’ s’il faut arrondir: choisir (s’, e’, m’) sinon choisir (s, e, m) B. Goossens B. Goossens 41 41 D. Defour D. Defour

Circuit de calcul: division flottante table de quotients en base redondante (2) adressée par des préfixes de D et d (3) calcul du reste (4) boucler 13 fois (sp) ou 28 fois (dp) (5) q = q+ - q- corriger r B. Goossens B. Goossens 42 42 D. Defour D. Defour

Unité fonctionnelle: unité entière Deux opérations en // TC: tables d’opérandes Opérateur: 2 sources et un code d’opération Sélection en sortie B. Goossens B. Goossens 43 43 D. Defour D. Defour

Unité fonctionnelle: unité flottante Deux opérations en // (arith, conversion) Opérateur: 2 sources et une opération Sélection en sortie B. Goossens B. Goossens 44 44 D. Defour D. Defour

Circuit de mémoire SRAM 64 bits en 32*2 a[4,2]: ligne a[1,0]: mot écrire = 0: t_2 fermés écrire = 1: d aiguillé lecture permanente maintenir a tant que écrire = 1 B. Goossens B. Goossens 45 45 D. Defour D. Defour

Circuit de mémoire deux ports Ports l et e séparés VRAM FIFO B. Goossens B. Goossens 46 46 D. Defour D. Defour

Circuit de mémoire cache e/#r = 1: écriture; e/#r = 0: recherche #pre: préchargement ei = 0: échec en ligne i; e != 0: succès B. Goossens B. Goossens 47 47 D. Defour D. Defour

Cache totalement associatif Une CAM contient les étiquettes Une RAM contient les données cachées La recherche se fait dans toutes les entrées en // B. Goossens B. Goossens 48 48 D. Defour D. Defour

Cache associatif de degré 4 La recherche se fait dans l’ensemble adressé Associativité de degré 1, 2, 4 ou 8 Degré != 1: choix de l’entrée remplacée Degré 1: conflits fréquents dans les petits caches B. Goossens B. Goossens 49 49 D. Defour D. Defour

Banc de registres 2m registres de 2b bits 3 ports de lecture (i, j, k) d’écriture (d) B. Goossens B. Goossens 50 50 D. Defour D. Defour

Exemple de processeur élémentaire Instruction: mot de contrôle (op, d, j, k) h = 1: lecture instruction h = 0: écriture résultat B. Goossens B. Goossens 51 51 D. Defour D. Defour

Instruction Rx = Rx op Rx h = 1: port d fermé, ports j et k passants h = 0: ports j et k fermés, port d passant B. Goossens B. Goossens 52 52 D. Defour D. Defour

Instructions de calculs booléens (conditions), entiers, flottants Architecture: ISA Instructions de calculs booléens (conditions), entiers, flottants scalaires, vectoriels Instructions de transferts conditionnels, inconditionnels mémoire-registre, registre-registre Instructions de sauts immédiats, indirects avec lien, sans lien, retours Instructions systèmes appels systèmes, mode privilégié B. Goossens B. Goossens 53 53 D. Defour D. Defour

Une instruction contrôle les unités du processeur (u.f. pour les calculs, hmd pour les transferts mémoire, calcul cp pour les sauts) Elle adresse ses sources et sa destination (numéros de registre, adresse mémoire) Elle paramètre son unité de calcul et en choisit le résultat (calcul signé ou non, simple ou double précision, + ou -, source constante ou registre, ...) C’est un quadruplet éventuellement conditionnel ([si p] dest = sg opération sd) Toutes les instructions modifient cp (i suivante) B. Goossens B. Goossens 54 54 D. Defour D. Defour

Codage des instructions Coder les adresses (variables en mémoire, cibles de sauts) Coder les constantes (initialisation, comparaison, 0, 1, -1, 0.0, 1.0, -1.0) Coder les registres (numéro, type) Coder les opérations (type, opérateur, modifieur) Coder le type d’instruction (calcul, accès mémoire, saut, système) B. Goossens B. Goossens 55 55 D. Defour D. Defour

Codage des instructions Quatre vertus pour un ‘bon code’: compact même taille pour toutes les instructions même nombre de sources et destinations pour toutes les instructions (en général, 1d et 2s) sauts évitables, repérables et prédictibles (instructions conditionnelles, type d’instruction, suggestion de prédiction statique) B. Goossens B. Goossens 56 56 D. Defour D. Defour

R1 = R2 + R3 /* calc, int, d1, sg2, sd3, op+ */ Exemple R1 = R2 + R3 /* calc, int, d1, sg2, sd3, op+ */ R1 = R1 + 1 /* calc, int, d1, sg1, sdk1, op+ */ F1 = F2 + F3 /* calc, fl, d1, sg2, sd3, op+sp */ R1 = M2[R2 + R3] /* mém, int, d1, sg2, sd3, opl2 */ SI R1<‘Z’ VERS e /* saut, int, e, sg1, sdk’Z’, op< */ APPEL f /* saut, int, d31, -, sdkf, opcall */ RETOUR /* saut, int, -, sg31, -, opret */ VERS R3 /* saut, int, -, sg3, -, opgoto */ APPELSYS fs /* saut, sys, rsys, -, sdkfs, opcall */ RETOURSYS /* saut, sys, -, rsys, -, opret */ SI P (R1 = R2) /* calc, int, d1, sg2, -, op=cond */ B. Goossens B. Goossens 57 57 D. Defour D. Defour

Processeur spéculatif ooo de degré 4 B. Goossens B. Goossens 58 58 D. Defour D. Defour

B. Goossens B. Goossens 59 59 D. Defour D. Defour

B. Goossens B. Goossens 60 60 D. Defour D. Defour

B. Goossens B. Goossens 61 61 D. Defour D. Defour

Prédiction de la direction des sauts conditionnels La direction prédite p est choisie parmi deux prédictions issues de prédicteurs spécialisés et basées sur le cp et sur le comportement antérieur des sauts conditionnels B. Goossens B. Goossens 62 62 D. Defour D. Defour

Une table de compteurs 2 bits à saturation Prédicteur hybride Une table de compteurs 2 bits à saturation adressée par la partie basse de cp (la table est un cache sans étiquette) Le bit fort du compteur adressé fixe le choix compteur++  p0 != p1 et p1 correcte compteur--  p0 != p1 et p0 correcte B. Goossens B. Goossens 63 63 D. Defour D. Defour

L’historique est un mot de 12 bits correspondant Prédicteur local L’historique est un mot de 12 bits correspondant aux 12 dernières directions d’un saut Le motif obtenu adresse un cache de compteurs Le bit fort issu du cache est la prédiction compteur++/--  saut pris/saut non pris Le prédicteur local prédit bien les sorties de boucles B. Goossens B. Goossens 64 64 D. Defour D. Defour

L’historique global est un mot de 12 bits formé Prédicteur global L’historique global est un mot de 12 bits formé des directions des 12 derniers sauts conditionnels Le mélange de cp et de l’historique adresse un cache de compteurs deux bits à saturation Le bit fort du compteur adressé est la direction prédite compteur++/--  saut pris/saut non pris Le prédicteur global prédit bien les sauts corrélés B. Goossens B. Goossens 65 65 D. Defour D. Defour

Prédiction des retours Le prédicteur adresse une pile (mémoire à 2 ports) On empile à chaque appel, on dépile à chaque retour (attention: pas de détection de débordement) B. Goossens B. Goossens 66 66 D. Defour D. Defour

B. Goossens B. Goossens 67 67 D. Defour D. Defour

B. Goossens B. Goossens 68 68 D. Defour D. Defour

B. Goossens B. Goossens 69 69 D. Defour D. Defour

B. Goossens B. Goossens 70 70 D. Defour D. Defour

B. Goossens B. Goossens 71 71 D. Defour D. Defour

B. Goossens B. Goossens 72 72 D. Defour D. Defour

B. Goossens B. Goossens 73 73 D. Defour D. Defour

B. Goossens B. Goossens 74 74 D. Defour D. Defour

Le cache de trace du P4 contient des blocs de micro-instructions, mais pas de traces contenant des sauts prédits. B. Goossens B. Goossens 75 75 D. Defour D. Defour

Réordonnancement dynamique On sait extraire les instructions en // Peut-on les exécuter en //? Il faut construire l’ordre partiel des instructions B. Goossens B. Goossens 76 76 D. Defour D. Defour

Dépendances LAE, EAE et EAL Dépendance LAE: 2 dépend de 1 Dépendance EAE: 4 dépend de 1 Dépendance EAL: 4 dépend de 3 B. Goossens B. Goossens 77 77 D. Defour D. Defour

Graphe des dépendances LAE, EAE et EAL Les dépendances EAE et EAL sont de fausses dépendances. On les élimine en dédoublant le registre de destination: c’est le renommage. B. Goossens B. Goossens 78 78 D. Defour D. Defour

Renommage des registres Pour matérialiser les r registres de l’architecture on dispose de q (q>r) registres de renommage Chaque destination est associée à un registre de renommage disponible (allocation) B. Goossens B. Goossens 79 79 D. Defour D. Defour

B. Goossens B. Goossens 80 80 D. Defour D. Defour

B. Goossens B. Goossens 81 81 D. Defour D. Defour

Renommage de l’instruction: F-RAT[d] = RR alloué Validation de l’instruction: R-RAT[d] = RR validé B. Goossens B. Goossens 82 82 D. Defour D. Defour

Après renommage: lecture en RR des sources prêtes allocation d’une station d’attente réception des résultats LAE lancement exécution pipelinée envoi du résultat Après exécution: validation en ordre B. Goossens B. Goossens 83 83 D. Defour D. Defour

Dans chaque table de stations d’attente, une instruction parmi celles qui sont prêtes est choisie pour démarrer son exécution. B. Goossens B. Goossens 84 84 D. Defour D. Defour

Chaque résultat est distribué à toutes les stations d’attente et copié partout où une dépendance LAE est détectée B. Goossens B. Goossens 85 85 D. Defour D. Defour

Le traitement des instructions est pipeliné B. Goossens B. Goossens 86 86 D. Defour D. Defour

Deux IP, deux BdR-arch, files doubles. Multithreading SMT Deux IP, deux BdR-arch, files doubles. B. Goossens B. Goossens 87 87 D. Defour D. Defour

Deux modes d’exécution: simple et double thread. Fonctionnement SMT Deux modes d’exécution: simple et double thread. En mode simple, le thread actif utilise toutes les ressources. En mode double, les files sont partitionnées et un thread ne peut empiéter sur sur l’autre. L’extraction se fait à tour de rôle tant que les deux threads sont demandeurs. Quand un thread est en attente, l’autre peut utiliser sa moitié des ressources. Les caches sont partagés. B. Goossens B. Goossens 88 88 D. Defour D. Defour

Les adresses manipulées par le processeur sont Les accès à la mémoire Les adresses manipulées par le processeur sont celles produites par le compilateur: ce sont des adresses virtuelles à traduire en adresses physiques. Les caches peuvent contenir des adresses virtuelles ou des adresses physiques. B. Goossens B. Goossens 89 89 D. Defour D. Defour

La traduction d’adresse est un parcours en mémoire B. Goossens B. Goossens 90 90 D. Defour D. Defour

Le TLB est un cache totalement associatif Il cache des couples (av, ar) Il est accédé en moins d’un cycle B. Goossens B. Goossens 91 91 D. Defour D. Defour

La hiérarchie mémoire se compose de caches (SRAM), de mémoire (DDR2) et du disque. Tailles: 16K, 1M, 1G, 200G Temps d’accès: 0,5ns, 2ns, 45ns/2ns, 5ms Rapport Fmém/Fcycle: 2, 8, 180/8, 20.106 B. Goossens B. Goossens 92 92 D. Defour D. Defour

Les E/S sont mappées en mémoire Les contrôleurs assurent l’interface avec les organes périphériques et le processeur Les échanges se font par interruption B. Goossens B. Goossens 93 93 D. Defour D. Defour

AGP 8x: 133Mhz (2,1GO/s) ATA: async (133MO/s) FSB: 800Mhz (6,4GO/s) AGP 8x: 133Mhz (2,1GO/s) ATA: async (133MO/s) PCI express: 2,5Ghz (2,5Gb/s * 1 à 32 bits) USB2: 480Mhz (48MO/s) PCI: 266Mhz (2,1GO/s) B. Goossens B. Goossens 94 94 D. Defour D. Defour