ASSEMBLEUR (ARM).

Slides:



Advertisements
Présentations similaires
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
Advertisements

LES NOMBRES PREMIERS ET COMPOSÉS
[number 1-100].
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Premier programme en C :
Architecture de machines Le microprocesseur
Distance inter-locuteur
ARCHITECTURE INTERNE d’un MICROPROCESSEUR
Portée des variables VBA & Excel
Plan du cours : 2ème Partie
1 UMLV 1. Introduction 2. Hachage ouvert 3. Hachage fermé 4. Implémentation des fonctions Méthodes de hachage.
Jacques Lonchamp IUT Nancy Charlemagne – DUT Informatique 1A
Cours n°2M2. IST-IE (S. Sidhom) UE 303 Promo. M2 IST-IE 2005/06 Conception dun système d'information multimédia Architecture trois-tiers : PHP/MySQL &
Interface Matériel/logiciel
Interface Matériel/logiciel
C.
Objectifs Nous allons concevoir une mise en œuvre contenant un noyau de jeu d’instructions. Nous verrons comment l’architecture de jeu d’instructions.
Le jeu d ’instructions Introduction Un jeu d ’instruction classique
Les structures de données
Chap. 1 Structures séquentielles : listes linéaires
Introduction : Compilation et Traduction
ESIEE Paris © Denis BUREAU I N Initiation à la programmation avec le langage Java.
Système d’exploitation : Assembleur
Initiation à la programmation et algorithmique cours 3
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
Chapitre 8 : L’architecture de base des ordinateurs
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
Système d’exploitation : Assembleur
ARCHITECTURE GLOBALE CAPTAGE Traitement DES des données GRANDEURS
44 Contrôle du déroulement du programme. 4-2 Objectifs A la fin de ce cours, vous serez capables de : Utiliser les constructions de prise de décision.
Architecture et technologie des ordinateurs II
Olivier DERUELLE Erwan FOUYER Maxime JOUIN Rodolphe LOUE
Architecture et technologie des ordinateurs II
Synchronisation et communication entre processus
RESUMES Module II1 SOMMAIRE CYCLE 1 : Saisir – Afficher – Données
LE MICROPROCESSEUR 8086/8088 Architecture externe du 8086
ASSEMBLEUR (ARM) ARM-meste-2005.
F Copyright © Oracle Corporation, Tous droits réservés. Créer des programmes avec Procedure Builder.
LES NOMBRES PREMIERS ET COMPOSÉS
Architecture Fondamentale des Microprocesseurs
Les pointeurs Enormément utilisé en C/C++ ! Pourquoi? A quoi ça sert?
Les pointeurs Modes d’adressage de variables. Définition d’un pointeur. Opérateurs de base. Opérations élémentaires. Pointeurs et tableaux. Pointeurs et.
©Frédéric Bastien 2006 Université de Montréal 1 LISATek LISATek pour concevoir des processeurs.
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
1.1 LES VECTEURS GÉOMÉTRIQUES
Architecture et technologie des ordinateurs II
L’essentiel du langage C
L'Unité centrale (CPU) Le CPU doit être rapide (mesuré en temps de CPU) UNITE DE CONTROLE Générer les signaux de control/temps Contrôler le décodage/exécution.
Lycée ELKHAWARIZMI De SAFI
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
1 Notations Asymptotiques Et Complexité Notations asymptotiques : 0 et  Complexité des algorithmes Exemples de calcul de complexité.
2.1 - Historique Chapitre 2 : Introduction au langage C++
Les bases de l’assembleur
Le langage C Rappel Pointeurs & Allocation de mémoire.
Cours Architecture des Systèmes Informatiques
LES PILES ET FILES.
Notions de pointeurs en C
Architecture Des Ordinateurs Microprocesseur Et Mémoire
Les Chiffres Prêts?
Chapitre 9 : La machine MIASM
1 Formation à l’usage éco-performant de votre pc 1 ère Partie.
9 décembre 2014J.Callot L.Piedfort1 Chapitre_1 K60 Evolution des machines Introduction au K60 Liaison série.
Cours Architecture des Systèmes Informatiques
3-Présentation d’un µP simple
Architectures des ordinateurs
Architecture et technologie des ordinateurs II
1. Spoon Christophe Delagarde, septembre 1998 I.U.T., Université de la Méditerrainée 2.
Patricia Renault UPMC 2005/2006
Transcription de la présentation:

ASSEMBLEUR (ARM)

Introduction (1) Le cours d’architecture a illustré la conception d’un microprocesseur avec pour outil de modélisation les FSM  le mot placé dans IR (mot instruction) contient toute l’information sur le travail a accomplir (+ opérandes)   Comment éviter l’écriture directe du mot instruction + opérande (ex : E1A0 0271) pour coder un algorithme ?  utilisation d’un mnémonique + opérandes réduisant l’effort de codage (ex : movnes R0,R1,ROR R2 )  le mnémonique + op n’est qu’une représentation différente de la même information  le microprocesseur n’utilise que la première représentation, c’est l’opération d’assemblage qui traduit (c’est un compilateur qui génère un code du premier type) le code assembleur en code machine

Introduction (2) L’ensemble (mnémonique + opérandes) constitue le langage ASSEMBLEUR Rem : pour un même microprocesseur  plusieurs langages assembleurs possibles (ils se distinguent surtout par les directives, macros, les pseudo-instructions …) (org 300), (a : ds.b 1), ( .data)

Points clefs du ARM Architecture load-store Instructions de traitement à 3 adresses Instructions conditionnelles (et branchement) Load et store multiples APCS (ARM Procedure Call Standard) En un cycle horloge: opération ALU+shift Interfaçage avec coproc. simplifié (ajout de registres, de type, …) Combine le meilleur du RISC et du CISC On le trouve dans la GBA, routeurs, Pockets PC, PDA, …

Que manipule-t-on ? Des registres Des adresses Des données Des instructions assembleurs (32 bits) Des directives Des pseudo-instructions

Des registres (mode User) 16 Registres de 32 bits : R0-R10, R12 : généraux R11 (fp) Frame pointer R13 (sp) Stack pointer R14 (lr) Link register R15 (pc) Program counter Current Program Status Register 31 28 27 8 7 6 5 4 0 N Z C V Pas utilisés IF T Mode

Des adresses et données 232 bytes de mémoire maxi Un word = 32 bits Un half-word = 16 bits Un byte = 8 bits Little endian (0x01AA  Ad+ AA 01) En hexa (0x0F), déc (15), bin (0b00001111)

Organisation mémoire adresse bit31 bit0 23 22 21 20 19 18 17 16 word16 15 14 13 12 Half-word14 Half-word12 11 10 9 8 word8 7 6 5 4 Byte6 3 2 1 byte3 byte2 byte1 byte0 adresse

Chaque instruction est codée sur 32 bits (uniquement) !!!

Cond (toutes les instructions !)

OpCode (data processing)

Environnement de Prog. ldrb R0,te ldrb R1,boul adc R0,R0,R1 .text  directive .globl _main _start:  label b _main _main:  code op opmrs R0,CPSR  opérandes #attention à la taille des immédiats !! ldr R1,=0xDFFFFFFF and R0,R0,R1 msr CPSR_f,R0 #autre solution:pas de masquage, on force tous les bits # msr CPSR_f,#0xD ldrb R0,mys ldrb R1,re adds R0,R0,R1 strb R0,de ldrb R0,te ldrb R1,boul adc R0,R0,R1 strb R0,gom mov pc,lr .align mys: .space 1 te: .space 1 re: .space 1 boul: .space 1 de: .space 1 gom: .space 1 .ltorg .end

Environnement de Prog. En « cross-compilant » (outil GNU) En « linkant » (outil GNU) En simulant le processeur ARM  EmBest Ide

ARM-meste-2005

Les directives principales Les directives sont des intructions pour l’assembleur (compilateur) uniquement, elles commencent par « . ». .align: permet d’aligner en mémoire des données de types différents .byte 0x55 .align sinon erreur à l’assemblage .word 0xAA55EE11 .ascii: permet de saisir des caractères (sans le NULL) . ascii "JNZ" insère les octets 0x4A, 0x4E, 0x5A .asciz: comme .ascii mais insère à la fin le caractère NULL . Asciz "JNZ" insère les octets 0x4A, 0x4E, 0x5A, 0x00

Les directives principales .byte: déclare une variable type octet et initialisation var1: .byte 0x11 var2: .byte 0x22,0x33 .hword: déclare une variable type deux octets et initialisation var3: .hword 0x1122 var4: .hword 0x44 .word: déclare une variable type word (32bits) et initialisation var5: .word 0x11223344 .space: déclare une variable de taille quelconque (pas d’ initialisation) var6: .space 10 réserve 10 octets

Les directives principales .equ: associe une valeur à un symbol .equ dix, 5+5 mov R3,#dix .global (ou .globl): l’étiquette (symbol) est visible globalement .global _start _start est reconnue par le linker GNU _start doit apparaître le code principal .text, .data, .bss : début de section text, data, bss (pour le linker) .end : fin du code source .ltorg : insère « ici » les constantes temporaires pour LDR = ldr R1,=0x11111111 .ltorg

Pseudo-instructions NOP: No operation. En ARM est remplacé par MOV R0,R0 LDR = : charge dans un registre une valeur immédiate ou une addresse ldr R0,=42  mov R0, #42 ldr R1,=0x9988CDEF  ldr R1,[PC, #4] (pipeline !!!) nop .ltorg c’est ici que l’on trouve #0x9988CDEF

Pseudo-instructions ldr R3,var3  ldr R3,[PC, #0] charge dans R3 la valeur de var3 str R4,=var3  str R4,[PC, #0] écrit en mémoire l’adresse de var3 charge l’adresse de var3 var3: .word 0xAAAAAAAA .ltorg on trouve ici l’adresse de var3 REM: l’adresse de var3 est connue par l’assembleur, on peut mieux faire

Pseudo-instructions ADR : charge dans un registre l’adresse d’une variable (load/store) adr R4, var5  add R4,PC,#4 (des fois sub !!!) ldr R6,[R4] nop var5: .word 0xBBBBBBBB PAS de .ltorg car l’adresse n’est pas en mémoire REM: les valeurs immédiates sont limitées en taille, si les variables sont dans .data  adrl ou ldr =

Module de décalage Cela s’explique grâce au registre à décalage -Le registre à décalage peut réaliser des rotations à droite également -Ne rajoute pas de cycle horloge -Ne s’utilise pas en tant qu’instruction -Permet de charger des constantes >8b -Permet des MUL rapides Opérande 1 Opérande 2 Registre à décalage C’est l’ALU

Module de décalage En fait 12 bits disponibles Ils sont décomposés en 4 bits de rotations et 8 bit de valeur immédiate C’est à dire: 0-255 [0-0xFF] sur 8 bits et 0 rotation Mais encore: 256, 260, …, 1020 [0x100-0x3FC]=[0x40-0xFF] ROR #30 0x3FC: 0xFF: 0xFF ror #1 ……. 0xFF ror #30 1 1 1 1

Module de décalage Et ainsi: 1024, 1040, …, 4080 [0x400-0xFF0]=[0x40-0xFF] ROR #28 4096, 4160, …, 16320 [0x1000-0x3FC0]=[0x40-0xFF] ROR #26 Ex: mov R1, #0x1000  mov R1,#40,26 (pas une vraie syntaxe) mov R2, #0xFFFFFFFF  mvn R2,#0 mov R2, #0x11111111  génère une erreur !!! ldr R2, # 0x11111111  on a déjà vu, pas d’erreur De plus LDR gère le registre à décalage  on utilise si possible LDR pour charger des constantes

Module de décalage Remplace un MUL avantageusement (MOV, ADD, SUB, RSB) Ex1: R0 = R1*5  R0 = R1+(R1*4)  add R0, R1, R1 lsl #2 Ex2: R2 = R3*105  R2 = R3*15*7  R2 = R3*(16-1)*(8-1)  R2=(R3*16) - R3 puis R2=(R2*8)-R2  rsb R2, R3, R3, lsl #4 puis rsb R2, R2, R2, lsl #3 N’est pas remplacé par l’Assembleur !!!

Instructions On les rassemble en 3 groupes: Mouvements de données Opérations de traitements (arith. & log.) Instructions de contrôles

Instructions Règles pour le traitement des données: Les opérandes sont 32 bits, constantes ou registres Le résultat 32 bits dans un registre 3 opérandes: 2 sources et 1 destination En signé ou non signé Peut mettre à jour les Flags (S) Le registre destination peut être un des registres sources

Instructions (Data Flow) Des LDR (indirect pour source), STR (indirect pour destination) Des MOV (constantes ou registre) Les LDR sont souvent remplacés par des MOV (sauf adressage indirect) LDR R1,R2  Error MOV R1,R2  OK LDR R1,=0x00FFFFFF  ldr r1, [pc, #4] LDR R1,=1020  mov r1, #1020 LDR R1,[R2]  ldr r1, [r2]

Instructions (Data Flow) En fait LDR/STR  LDR/STR simple (un seul registre) SWAP simple LDR/STR multiple (une liste de registres) On utilise un registre contenant une adresse mémoire  registre de base LDR R0,[R1]  On charge dans R0 le word (32bits) mem[R1] STR R0,[R1]  On range dans mem[R1] (4 octets) R0 L’adresse est placée dans R1 avec un ADR ou LDR (voir directives)

Instructions (Data Flow) Si R1 « pointe » (ADR R1,tab) sur une zone mémoire (vecteur, matrice) Rem: une zone mémoire = vecteur, matrice, tableau, … ADD R1, R1, #2  R1 pointe maintenant sur le prochain half-word LDRH R0, [R1]  R0 reçoit le half-word : R0=mem16[R1] On peut utiliser une pré-indexation (R1 est modifié avant le transfert): LDRH R0, [R1,#2]  R0=mem16[R1+2]  R1 mis à jour ??? Quelle syntaxe ???

Instructions (Data Flow) ? Rem: [R1,#4] ne modifie pas R1 ?

Instructions (Data Flow) Si on veut modifier R1 « automatiquement »  auto-incrémentation LDRH R0, [R1,#2]!  R0=mem16[R1+2] puis R1=R1+2 Si R1 pointe toujours sur le prochain élément à charger (pile)  post-indexation LDRH R0,[R1],#2  R0=mem16[R1] puis R1=R1+2 Si l’offset est variable, un registre peut le remplacer LDRH R0,[R1,R2]!  R0=mem16[R1+R2] puis R1=R1+R2

Instructions (Data Flow) Résumé: LDR R0,[R1]  indirect LDR R0, [R1, #offset]  indirect pré-indexé LDR R0, [R1, #offset]!  indirect pré-indexé et auto-incrémenté LDR R0, [R1], #offset  indirect post-indexé et auto-incrémenté LDR R0, [R1, -R2]!  indirect pré-indexé et auto-incrémenté LDR R0, [R1], -R2  indirect post-indexé et auto-incrémenté

Instructions (Data Flow) Encore plus complexe : format Word

Instructions (Data Flow) Un LOAD/STORE particulier: SWAP SWP R1,R2,[R3]  R1 mémoire[R3] mémoire[R3] R2 Pour échanger le contenu de la mémoire avec un registre  SWP R2, R2, [R3]

Instructions Logiques Elles opèrent bit à bit (Elles sont très utilisées pour les E/S) Des instructions en soit: -TST, TEQ (and et eor)  pas de destination, CPSR mis à jour -AND, EOR, ORR, BIC (and not)  destination, CPSR mis à jour si {S} Des instructions indirectes: MOV R2,R1 LSL #5 , MOV R3,R4 LSR R6  LSL, LSR, ASR, ROR, RRX

Instructions Logiques LSR: logical shift right ASR: arithmetic shift right ROR: rotate right RRX: rotate right extended Un seul bit  remplacé par ROR #0 C C C C

Instructions Arithmétiques Elles permettent l’addition, la soustraction, la multiplication Elles peuvent prendre en compte le flag C (retenue) et le mettre à jour -ADD, ADC: addition, addition plus C -SUB, SBC, RSB, RSC: soustraction, soustraction –NOT(C), inversée, … SUBS R1,R2,R3  R1=R2-R3 RSBS R1,R2,R3  R1=R3-R2 -multiplications

Multiplications MUL rd,r1,r2  rd=r1*r2 sur 32bits MLA rd,r1,r2,r3 rd=r1*r2 + r3 sur 32bits Signés: SMULL rdlo,rdhi,r1,r2  rd=r1*r2 sur 64bits SMLAL rdlo,rdhi,r1,r2,r3 rd=r1*r2 + r3 sur 64bits NON Signés: UMULL rdlo,rdhi,r1,r2  rd=r1*r2 sur 64bits UMLAL rdlo,rdhi,r1,r2,r3 rd=r1*r2 + r3 sur 64bits

Instructions Arithmétiques Un exemple de MLA: MOV R11, #20 MOV R10, #0 LOOP: LDR R0,[R8], #4 LDR R1,[R9], #4 MLA R10,R0,R1,R10  R10=R10+R0*R1 SUBS R11,R11,#1  SUB et CMP car {S} BNE LOOP  C’est le produit scalaire de deux vecteurs

Instructions Arithmétiques Les flags sont mis à jour avec {S}  on peut également utiliser CMP (SUBS) ou CMN (ADDS) CMP R1,#5  R1-5 : les flags sont mis à jour, résultat non stocké Utilisé avant une instruction conditionnelle (ARM) Utilisé avant un branchement conditionnel (B{cond} ou B{cond}L) Associé aux structures de contrôles REM: TST (and) et TEQ (eor) pour comparaisons logiques

Inst./struct. de contrôles Elles déroutent le cours normal du programme Basées sur le couple (CMP, B{cond}) Tests complexes (CMP{cond}) (voir TD) Elles cassent le pipeline (peut mieux faire ?) Elles servent à réaliser Les alternatives (if, case) Les itérations (for, while, repeat) Les procédures (BL)  normalisation

Inst./struct. de contrôles If: CMP R0,R1  CMP Rn,<Operand2 BHS Else Then: B Endif Else: Endif: If Then Else: If R0 < R1 Then Else

Inst./struct. de contrôles Case Of: Case R2 Of -2: -3: Otherwise: Case: mDeux: CMP R2,#-2 (remplacé par CMN R1,#2) !! BNE mTrois B Endcase mTrois: CMP R2,#-3 BNE Otherwise B Endcase Otherwise: Endcase:

Inst./struct. de contrôles While do: While R3  R1 do While: CMP R3,R1  CMP Rn,<Operand2> BLT Endwhile  si Rn LT Operand2 en signé # BLO Endwhile  si Rn LO Operand2 en nonsigné do: B While Endwhile:

Inst./struct. de contrôles For: For R3 = 1 to nfin do LDR R3,=nfin For: SUBS R3,R3,#1  décrémentation de 1 BNE For Endfor:

Appels de procédures, les Piles Les procédures sont appelées avec Branch + Link (BL) Les paramètres sont passés par: Adresses (noms de variables) Par registres (taille et nombre limités) Par adresse dans des registres (nombre limité) Par adresse ou valeur dans la pile  notion de pile

Appels de procédures, les Piles .globl _start .globl _main _start: B _main _main: MOV R1,#2 MOV R2,#3 BL proc  branchement à proc et LR (R14)=PC-4 (Pipeline) STR R3,res Nombre de registres limité  utilisation des piles (C, JAVA) proc: ADD R3,R1,R2 MOV PC,LR

Appels de procédures, les Piles LDR et STR n’utilisent qu’un seul registre LDM et STM utilisent plusieurs registres LDMIA R1,{R0,R2,R4} (r0=mem32[r1], r2=mem32[r1+4], r4=mem32[r1+8]) De même STMIA R1,{R0,R2,R4} (mem32[r1]=r0, mem32[r1+4]=r2, mem32[r1+8]=r4) R4 R3 R2 R1 Adresse de base R0 mémoire

Appels de procédures, les Piles L’instruction LDMIA est en fait LDM + I + A LDM : Load Multiple I : Incrémentation de l’adresse de base A: l’adresse de base est incrémentée après utilisation (offset temporaire) Si LDMIA R1 !, {R2-R9} alors on charge 8 registres (32 octets) et l’offset est définitif (R1=R1+32) après utilisation Le I+A peut se remplacer par: Increment-After LDMIA STMIA Increment-Before LDMIB STMIB Decrement-After LDMDA STMDA Decrement-Before LDMDB STMDB

Appels de procédures, les Piles STMIA r9!,{r0,r1,r5} R1 R9 R0 R9’ R5 R1 STMIB r9!,{r0,r1,r5} R0 R9 STMDA r9!,{r0,r1,r5} R9 R5 R1 R0 R9’ STMDB r9!,{r0,r1,r5} R9 R5 R1 R9’ R0

Appels de procédures, les Piles Ces instructions permettent l’implémentation de Piles (PUSH et POP) : PUSH : STMIA POP : LDMDB Le sommet de pile est un emplacement vide et on empile vers les add A ou B ???  Pas si simple Dans la terminologie ARM, les instructions de piles sont des STM STMIA  STMED (E: emplacement Empty; D: adresses Descending) LDMIB  LDMED Et R13 (SP) est considéré comme le pointeur de pile

Appels de procédures, les Piles On obtient alors les couples (PUSH/POP) possibles avec: emplacement Empty (E),Full (F) adresses Descending (D),Ascending (A) STMFA/LDMFA STMFD/LDMFD STMEA/LDMEA STMED/LDMED Ces piles sont utilisées pour le passage de paramètres aux procédures avec normalisation (ARM Procedure Call Standard) ou non

Appels de procédures, les Piles Utilisation efficace des piles en appel de procédure : On passe les paramètres par la pile, ou les registres La procédure sauvegarde tous les registres de travail (le prog appelant ne voit pas les changements) La procédure sauvegarde le LR (elle peut appeler une autre procédure) La procédure restaure les registres sauvegardés avant le retour

Appels de procédures, les Piles .globl _start .globl _main _start: B _main _main: MOV R1,#2 MOV R2,#3 (A) STMED R13!,{R1,R2} (B) BL proc (F) ADD R13,R13,#8 (G) STR R3,res proc: STMED R13!,{R1-R2,R14} LDR R1,[R13,#16] LDR R2,[R13,#20] ADD R3,R1,R2 (C) LDMED R13!,{R1-R2,R14} MOV PC,R14 Rem: (C) et (D) peuvent être remplacé par: LDMED R13!,{R1-R2,PC} R13 (C) (B),(D) (A),(G) AD+ 4 octets R1 R2 R14

Appels de procédures,APCS (réduit) Le APCS (ARM Procedure Call Standard) fournit un mécanisme standardisé permettant d’associer des routines C, assembleur, … En définissant: Restrictions sur l’utilisation des registres Convention d’utilisation de la pile Convention de passage de paramètres Structuration du contexte de la procédure dans la pile Il existe plusieurs versions de APCS

Appels de procédures, APCS Les registres prennent des noms particuliers: R10 : SL (stack limit) R11 : FP (frame pointer) R12 : IP (scratch register) R13 : SP (stack pointer) R14 : LR (link register) R15 : PC Et R0-R3 : A1-A4 arguments de proc/registres de travails/résultats R4-R9 : V1-V6 variable registre

Appels de procédures, APCS La pile (et les différents registres) permet de conserver une structure d’appel pour les appels imbriqués: Sauvegarde PC LR SP FP … Contexte p4 Sauvegarde PC LR SP FP … Contexte p3 Sauvegarde PC LR SP FP … Contexte p2 Sauvegarde PC LR SP FP … Contexte p1

Appels de procédures, APCS Exemple int somme(int x1, int x2, int x3, int x4, int x5) { return x1+x2+x3+x4+x5; } //extern int somme(int x1, int x2, int x3, int x4, int x5); int __main() { somme(2,3,4,5,6); } .text .global somme .type somme,function somme: mov ip, sp stmfd sp!, {fp, ip, lr, pc} sub fp, ip, #4 sub sp, sp, #16 str r0, [fp, #-16] str r1, [fp, #-20] str r2, [fp, #-24] str r3, [fp, #-28] ldr r2, [fp, #-16] ldr r3, [fp, #-20] add r3, r2, r3 ldr r2, [fp, #-24] add r3, r3, r2 ldr r2, [fp, #-28] ldr r2, [fp, #4] mov r0, r3 ldmea fp, {fp, sp, pc} .global __main __main: mov ip, sp stmfd sp!, {fp, ip, lr, pc} sub fp, ip, #4 sub sp, sp, #4 mov r3, #6 str r3, [sp, #0] mov r0, #2 mov r1, #3 mov r2, #4 mov r3, #5 bl somme ldmea fp, {fp, sp, pc}

Appels de procédures, APCS Restauration des registres somme: mov ip, sp SP(1) stmfd sp!, {fp, ip, lr, pc} SP(2) (STMDB) sub fp, ip, #4 FP(1) . FP(1) ldmea fp, {fp, sp, pc} SP(1) (LDMDB) SP(2) FP(1) SP(1) AD+ 4 octets FP IP (sp(1)) LR PC

Appels de procédures, APCS .text .global somme .type somme,function somme: mov ip, sp SP(3) stmfd sp!, {fp, ip, lr, pc} SP(4) sub fp, ip, #4 FP(2) sub sp, sp, #16 SP(5) str r0, [fp, #-16] str r1, [fp, #-20] str r2, [fp, #-24] str r3, [fp, #-28] ldr r2, [fp, #-16] ldr r3, [fp, #-20] add r3, r2, r3 ldr r2, [fp, #-24] add r3, r3, r2 ldr r2, [fp, #-28] ldr r2, [fp, #4] mov r0, r3 ldmea fp, {fp, sp, pc} SP(3) __main: mov ip, sp SP(1) stmfd sp!, {fp, ip, lr, pc} SP(2) sub fp, ip, #4 FP(1) sub sp, sp, #4 SP(3) mov r3, #6 str r3, [sp, #0] mov r0, #2 mov r1, #3 mov r2, #4 mov r3, #5 bl somme ldmea fp, {fp, sp, pc} SP(1) SP(5) SP(4) FP(2) SP(3) SP(2) FP(1) SP(1) R3so R2so R1so R0so FPso IPso LRso PCso R3ma Fpma IPma LRma PCma

Appels de procédures, APCS Dans ce cas, on passe l’adresse du résultat !!! (5 arguments) void somme(int x1, int x2, int x3, int x4, int *x) { *x= x1+x2+x3+x4; } int __main() { int c; somme(2,3,4,5,&c); } .text .global somme .type somme,function somme: mov ip, sp SP(3) stmfd sp!, {fp, ip, lr, pc} SP(4) sub fp, ip, #4 FP(2) sub sp, sp, #16 SP(5) str r0, [fp, #-16] str r1, [fp, #-20] str r2, [fp, #-24] str r3, [fp, #-28] ldr r2, [fp, #-16] ldr r3, [fp, #-20] add r2, r2, r3 ldr r3, [fp, #-24] add r2, r2, r3 ldr r3, [fp, #-28] ldr r3, [fp, #4] str r2, [r3, #0] ldmea fp, {fp, sp, pc} SP(3) __main: mov ip, sp SP(1) stmfd sp!, {fp, ip, lr, pc} SP(2) sub fp, ip, #4 FP(1) sub sp, sp, #4 SP(3) sub r3, fp, #16 str r3, [sp, #0] mov r0, #2 mov r1, #3 mov r2, #4 mov r3, #5 bl somme ldmea fp, {fp, sp, pc} SP(1)

Procédures particulières Les Exceptions et les Interruptions auxquelles on associe: Des modes particuliers (autres que normal user mode) privilégiés Des valeurs particulières des bits [4:0] du CPSR De nouveaux registres Elles sont générées: Comme étant un résultat d’une instruction (SWI, instruction illégale, erreur mémoire en FETCH) Par un effet de bord d’une instruction (erreur mémoire data, division par zéro) En réponse à un signal extérieure (reset, Fast Interrupt FIQ, Normal interrupt)

Procédures particulières De nouveaux registres

Procédures particulières Quand une exception est levée: Le mode système est modifié (fonction du type) PC est sauvegardé dans le R14 correspondant CPSR est sauvegardé dans un Save Processor Status Register (SPSR) Utilise la notion de priorité Force le PC à l’adresse de l’exception correspondante (Branch) Cette adresse est stockée dans un tableau d’adresses (vecteurs) Le microprocesseur « détermine » quel vecteur pour quelle exception (reset: premier vecteur du tableau donc 0x00000000, …)