FTFC'2003 Une technique de réduction de la puissance dissipée par l'horlogerie des circuits complexes rapides François ANCEAU francois.anceau@polytechnique.fr.

Slides:



Advertisements
Présentations similaires
Mercredi 8 janvier 2003© ALKAEST Conseil DESS « Gestion des Nouvelles Technologies de lEnergie » INSTN-CEA, mercredi 8 janvier 2002 Chaufferies collectives.
Advertisements

SURVEILLANCE ET PREVENTION DES INFECTIONS DU SITE OPERATOIRE (ISO)
FORMATION DE FAISCEAU.
Les systèmes embarqués
Distance inter-locuteur
TECHNOLOGIE DES ORDINATEURS
Le double d’un multiple de opérations en 5 minutes Per1_6
La vision des DRH de leur rôle dans la stratégie de l’entreprise - Trajectoires RH Master MRH Lille 8 Octobre 2004 La vision des DRH de leur rôle dans.
Architecture des processeurs généralistes haute performance
Les frontières ouvertes
« Extraction des connaissances
Eureka avril MAJORCALL – « Client Relation Management for Call Centers » Eurekâ Project !2990 Corebridge- -ENST-
DIMENSIONNEMENT DES DURCISEMENTS CEM SIMPLIFIÉ
GIACRI-MAUBORGNE Marie-Laure CEA Saclay DSM/DANIA/SPhN
Page : 1 / 8 Conduite de projet Examen du 3 juin 1988 Durée : 4 heures Le support de cours est toléré La notation tiendra compte très significativement.
Performances 1 Évolution : Performance. Performances 2 Évolution : Mémoire.
Performances 1 Objectifs : Comment mesurer, décrire et résumer les performances et décrire les principaux facteurs qui déterminent les performances dun.
Exercice Notre programme s'exécute en 10 secondes sur A, qui dispose d'une horloge à 100Mhz. Nous tentons d'aider un concepteur à construire une machine.
Architecture Systèmes
Auto Apprentissage Le DSP
Identités remarquables : introduction Les 3 identités remarquables
ANTENNES COMPACTES POUR TÉLÉCOMMUNICATIONS (DOMAINE DÉCIMÉTRIQUE)
« Modélisation de lapprentissage des mots écrits avec un réseau de type ART » Stage de fin détude de DESS de Sciences Cognitives Appliquées Effectué
Flow de conception (4h)-demo
- DESS IGSI – Conception objet des SI -Etude de cas – Marie-Laure POITOU.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
RW Conseil Les technologies de la sécurité au service de lutilisateur 1 Introduction aux systèmes à base de cartes multiapplicatives.
Plan Évolution Système On Chip Difficultés de la testabilité des SOCs
LE SON & L’ AUDITION Dr CHAKOURI M.
Colloque iFRAP17 septembre La loi Dutreil : Un début de solution Pierre BERGER Avocat Associé (Cabinet FIDAL)
Raffaele Noro Institute for computer Communications and Applications
Rapport du projet 53 François Barre, Vincent Borrel, Guillaume Dupuy,
Étude du gain d’un milieu amplificateur à Boîtes Quantiques
RELATION COÛT-VOLUME-BÉNÉFICE
Colloque iFRAP17 septembre Présentation du Livre Blanc Objectif : 15 milliards deuros investis par Business Angels Didier Salavert Chef dentreprise.
DEC RÉPUBLIQUE ET CANTON DE NEUCHÂTEL Main-dœuvre: quel enjeux pour la région frontalière Sylvain Babey – Service de lemploi/NE.
Les besoins en CAN pour les applications d'imagerie
Ecole IN2P3 des Accélérateurs
Sherbrooke le 3 avril Aspects économiques liés à lintégration des services de maintien à lautonomie Volet Implantation et fonctionnement Danièle.
Architecture des Ordinateurs
Un système expert flou pour stabiliser le réseau électrique
VOL LENT A DIFFERENTES CONFIGURATIONS
Société Française de Médecine Générale
Réponse fréquentielle de la FTBO H(p)
Les Pourcentages.
Méthode de sélection pour un taureau inséminateur dans la race Holstein Le 10 Octobre 2003 Landraud B. Lavedan F. Le Tual J.
Luminaires résidentiels Specifications ENERGY STAR ® Ajouts aux critères dadmissibilité Pierrette LeBlanc, Office de lefficacité énergétique 4 juin, 2008.
Styles dinteraction dans les PocketPC: analyses et comparaisons Roberto Ortelli, Juillet 2003.
Observation des raies cyclotron de Vela X-1 par le spectromètre
La statistique descriptive
Plan Problématique Fautes de délai Techniques de test « at-speed »
3ème partie: les filtres
Exercice 11-1.
TP n°2 sur Did’Acsyde.
La fonction inversement proportionnelle
Exposé processeurs INTEL
Copyright 2011 – Les Chiffres Copyright 2011 –
Koeln - 15 and 16 May Services de logistique privés et publics à Venise et Padoue Champs de recherche Equal – Logicomp IT-G-VEN-018 Gilberto Gobbo.
Informatique 1. Les applications de l’informatique
Lycée ELKHAWARIZMI De SAFI
L’ISF : Casse-tête pour les chefs d’entreprises
Cours 1 1 Java. Cours 1 2 Plan général 1.Introduction 2.Les types primitifs, évaluation d’expressions 3.Instructions for, if…. 4.Introduction de l’objet,
 Sois très attentif !!!!  Tu vas voir défiler des questions de calcul ou des petits problèmes.  Tu auras 20 secondes pour répondre à chaque question.
Informatique 1. Les applications de l’informatique
André Seznec Caps Team IRISA/INRIA 1 Processeurs Hautes Performances Panorama et Nouveaux Défis André Seznec IRISA/INRIA
Droite Performance d’un régénérateur optique à base de SOA insensible à la polarisation G. GIRAULT, M. GAY, L. BRAMERIE, V. RONCIN, J.C. SIMON Good morning.
ARPO: architecture des processeurs superscalaires,VLIW et optimisation André Seznec et François Bodin.
INTRODUCTION.
INTRODUCTION.
ARPO: architecture des processeurs superscalaires,VLIW et optimisation André Seznec et François Bodin.
Transcription de la présentation:

FTFC'2003 Une technique de réduction de la puissance dissipée par l'horlogerie des circuits complexes rapides François ANCEAU francois.anceau@polytechnique.fr htt://lmi17.cnam.fr/~anceau/Doc.html

Evolution de la complexité Nb Tr 100 000 000 Pentium 4 Celeron 10 000 000 PPC620 Pentium II PPC601 Pentium-Pro Pentium MC68040 1 000 000 I486 INTEL MC68020 I386 MOTO / IBM 100 000 I286 MC 68000 I8086 10 000 MC6800 I8008 I4004 1 000 1966 1971 1976 1981 1986 1991 1996 2001

Evolution des performances 10000 PENTIUM 4/1,5G 1000 PPC 750/350 PENTIUM II/330 ALPHA/300 PPC 604/133 PENTIUM-PRO/133 Intel Millions d'instructions exécutées par seconde (specint 92) ALPHA/150 PENTIUM/133 100 PPC PPC 601/66 PENTIUM/66 DEC 486/50 486/25 10 386/16 1 84 86 88 90 92 94 96 98 00 02

Evolution technologique Taille des motifs minimaux (microns) prédiction Intel 25nm

Evolution de la fréquence d'horloge (X86) (Ghz) 50 Ghz prédiction Intel 24Ghz 10 Ghz F horloge Micro Intel X86 Fréquence interne Fréquence bus Fréquence externe Utilisation de multiplieurs de fréquence internes

Evolution de la consommation Croissance très rapide de la puissance dissipée Inversion de la tendance pour le P4 Northwood

Croissance de la puissance consommée d'après Fred Pollack, Intel Cœur de réacteur nucléaire Puissance dissipée W/cm2 P4 Willamette P4 Northwood PII PIII Plaque de cuisson P Pro Pentium I386 I486 Familles technologiques 1.5µ 1µ 0.7µ 0.5µ 0.35µ 0.25µ 0.18µ 0.13µ 0.1µ 0.07µ

Deux classes de processeurs 80 Pentium 4 Willamette 0.18µ 70 0.25µ 0.12µ Processeurs de forte puissance 40 50 60 Pentium 4 Northwood Puissance consommée W 30 20 Pentium III 500Mhz 10 Processeurs de faible consommation Pentium 4 M 500 1000 1500 2000 2500 3000 Performance Mips

Demandes du marché Performance Faible consommation Le marché est très demandeur en terme de performances Pour y répondre, les constructeur produisent des "monstres" dont la consommation dépasse le raisonnable (ex P4 75W à 1,5Ghz, ALPHA…..) Faible consommation Le marché demande aussi des processeurs consommant très peu (portables, processeurs inclus (embeeded)) Pour répondre, les constructeurs utilisent des techniques de réduction de la consommation (ex PIII 1W 500Mhz, ARM,…)

zones fonctionnelles isochrones Zones isochrones Zones d'un circuit complexe synchrone qui peuvent être excitées par une seule source d'horloge On cherche à associer zones isochrones et fonctionnalité La taille des zones isochrones diminue lorsque la technologie maigrit (mais leur taille relative reste identique). Dans l'approche SOC, les zones isochrones étaient préalablement des circuits séparés. zones fonctionnelles isochrones

Communication entre zones isochrones voisines écarts de phase dans la distribution de l'horloge HM T1 T2 L'écart de phase entre deux bascules de deux zones isochrones synchrones voisines est comparable à celui à l'intérieur d'une même zone isochrone. H1 H2 T11 T21 écart de phase de l'horloge distribuée dans la zone isochrone T3 B1 B2 bascule temps de propagation du signal zone isochrone 1 zone isochrone 2

Dialogue entre zones isochrones Dépend de la différence de phase entre les horloges des zones isochrones Si l'écart de phase entre les horloges des blocs isochrones est très faible: Les échanges synchrones deviennent possibles entre zones isochrones voisines. Le circuit devient une vaste zone isochrone pour les communications locales.

Techniques de distribution de l'horloge L'objectif est d'amener l'horloge en phase et avec une puissance suffisante au niveau de chaque zone isochrone. Il faut réaliser une distribution dite équilibrée. Plusieurs techniques sont possibles: Distribution arborescente Distribution en anneaux Distribution par plans / grilles Distribution en H …….. Distribution en "H"

Distribution de l'horloge (1) f0 zone isochrone f0 fex multiplieur à PLL arbre de distribution (équilibré)

Distribution de l'horloge (2) f0 déphaseur programmable zone isochrone f0 fex multiplieur à PLL Une batterie de déphaseurs programmables est utilisée pour compenser les écarts de phase de l'arbre de distribution arbre de distribution

Distribution (simplifiée) de l'horloge du Pentium 4* déphaseur  (47) zones isochrones c 100 Mhz 2Ghz (3) arbres binaires de distribution PLL plot de test l'écart de phase total entre deux zones isochrones est inférieur à 50ps * A Multigigahertz Clocking Scheme for the Pentium 4 Microprocessor, IEEE journal of Solid State Circuits, nov 2001

Gain de puissance consomme de 40 à 70% de la puissance dissipée L'arbre de distribution de l'horloge consomme de 40 à 70% de la puissance dissipée il doit être "temporellement précis" La division par N de la fréquence de l'horloge transmise permet de gagner un facteur N sur la puissance qu'il consomme (CMOS) L'arbre de distribution doit garder les mêmes caractéristiques électriques il doit conserver la même "précision temporelle" même géométrie même dimensionnement des transistors => même consommation par transition La puissance consommée par les PLL de rétablissement de la fréquence peut être comparée à celle des rephaseurs

Réduction de la fréquence distribuée f0/N multiplieur à PLL zone isochrone fex multiplieur à PLL Approche dite "Multi-PLL" arbre de distribution

Exemple de gain envisageable P4 Northwood Puissance dissipée totale 50 w (à 2,2 Ghz) Puissance dissipée par le réseau de distribution de l'horloge => de 20 à 35 w Puissance dissipée par un réseau à F/10 => 2 à 3,5 w Puissance dissipée par le circuit modifié => 32 à 19 w

Synchronisation inter zones isochrones diviseur zone isochrone i-1 C f0/N f0 horloge distribuée C C C  VCO Zone isochrone i /N Le circuit devient un vaste système asservi dont il faut surveiller la stabilité! C C multiplieur diviseur zone isochrone i+1

Conclusions La technique proposée ne se veut pas être un moyen de réaliser des circuits "basse consommation", mais de limiter la puissance dissipée par les circuits rapides tout en ne nuisant pas à leur performance. Elle peut être couplée avec une technique de resynchronisation dynamique Elle n'est pas exclusive des autres techniques de réduction de la consommation.