匯編基礎(chǔ)教程

匯編基礎(chǔ)教程


16位和32位的80x86匯編語言的區(qū)別

需要注意的是匯編不是一種語言,不同平臺有不同的匯編語言對應(yīng),因?yàn)閰R編和操作系統(tǒng)平臺相關(guān),所以匯編語言沒有移植性。對于IA-32架構(gòu)平臺而言,選用的是32位80386匯編語言,也就是說本教程討論的操作系統(tǒng)平臺是32位的,可執(zhí)行文件的格式也是32位而不是64位或16位的。
實(shí)際分析中讀者要知道研究的程序是運(yùn)行在什么平臺上,以選擇相應(yīng)的匯編語言,對應(yīng)IA-32架構(gòu)而言,IA-16架構(gòu)的匯編語言原理其實(shí)和IA-32的匯編語言一樣,學(xué)習(xí)過16位的80x386匯編語言的讀者只需花一點(diǎn)時(shí)間就可以轉(zhuǎn)到32位80386匯編語言上。

什么是IA-32?
IA-32(Intel Architecture),英特爾體系架構(gòu),英特爾從486開始采用,也就叫X86-32架構(gòu),

16位操作系統(tǒng)與32位操作系統(tǒng)的80x86匯編語言主要區(qū)別如下:

  1. 16位操作系統(tǒng)中的中斷調(diào)用相當(dāng)于32位操作系統(tǒng)中的API調(diào)用。16位操作系統(tǒng)中的段地址和偏移地址在32位中消失了,在32位操作系統(tǒng)中統(tǒng)一采用平坦的內(nèi)存地址模式尋址

  2. 16位操作系統(tǒng)中的程序運(yùn)行在RING0級,也就是說普通程序和操作系統(tǒng)程序運(yùn)行在同一個(gè)級別并且擁有最高權(quán)限,而32位操作系統(tǒng)中的程序一般只擁有RING3級運(yùn)行權(quán)限,程序的所有操作都受到操作系統(tǒng)控制,若程序要獲得RING0操作特權(quán)只能通過驅(qū)動程序?qū)崿F(xiàn)

  3. 16位操作系統(tǒng)的可執(zhí)行文件格式和32位操作系統(tǒng)的可執(zhí)行文件格式不同,在32位的Windows操作系統(tǒng)中,可執(zhí)行文件的格式叫PE格式,32位的Windows操作系統(tǒng)運(yùn)行在CPU的保護(hù)模式之上,而16位的系統(tǒng)則運(yùn)行在CPU的實(shí)模式上。


了解EAX、EBX、ECX和EDX寄存器以及對應(yīng)的16位寄存器

IA-32架構(gòu)中一共有4個(gè)32位寄存器,用于保存臨時(shí)數(shù)據(jù),它們分別是EAX、EBX、ECX和EDX。
這4個(gè)32位寄存器的通用寄存器名字前面都有一個(gè)“E”字母,含義是“Expand”擴(kuò)展,這是由于在16位的時(shí)代,這4個(gè)通用寄存器的名字是AX、BX、CX和DX,到了32位后就在它們的名字前面加個(gè)“E”來區(qū)別是32位還是16位。
這4個(gè)32位的通用寄存器可以當(dāng)作16位使用,也可以當(dāng)作8位使用。當(dāng)作8位使用時(shí),就將AX折開為AH和AL,AH中的“H”代表“high”,意思是高位的意思,AL中的“L”代表“l(fā)ow”,意思是地位的意思。同理,BX、CX和DX可折開為BH、BL、CH、CL、DH、DL來使用。



一些寄存器是別的寄存器的一部分:例如,如果EAX保存了值12782345,這里是其他寄存器的值。

|:--- |:------:|:------:|:------:|:------:|
| EAX | 12 | 78 | 23 | 45 |
| AX | 12 | 78 | 23 | 45 |
| AH | 12 | 78 | 23 | 45 |


學(xué)習(xí)EAX、EBX、ECX和EDX寄存器的用途

  1. EAX寄存器:EAX稱為累加器,常用于算數(shù)運(yùn)算、布爾操作、邏輯操作、返回函數(shù)結(jié)果等。
  2. EBX寄存器:EBX稱為基址寄存器,常用于存檔內(nèi)存地址。
  3. ECX寄存器:ECX稱為計(jì)數(shù)寄存器,常用于存放循環(huán)語句的循環(huán)次數(shù),字符串操作中也常用。
  4. EDX寄存器:稱為數(shù)據(jù)寄存器,常常和EAX一起使用。

注意:上面所述的4個(gè)通用寄存器的專門用途不是一成不變的,編譯器在編譯程序的時(shí)候會根據(jù)很多因素,例如編譯器、編譯條件、操作系統(tǒng)等做出相應(yīng)的改變,讀者要知道著手研究的程序是用什么編譯器編譯,然后針對具體的編譯器參考該編譯器的說明。


學(xué)習(xí)變址寄存器-ESI和EDI寄存器與其用途

變址寄存器

顧名思義,變址的含義是內(nèi)存地址會變動的,也就是說變址寄存器中存放在變動的內(nèi)存地址。80386架構(gòu)中有兩個(gè)變址寄存器,分別是ESI和EDI。
ESI和EDI寄存器:

  1. ESI:ESI稱為源變址寄存器,通常存放要處理的數(shù)據(jù)的內(nèi)存地址。
  2. EDI:EDI稱為目的變址寄存器,通常存放處理后的數(shù)據(jù)的內(nèi)存地址。

ESI和EDI寄存器的用途

ESI和EDI常用來配合使用完成數(shù)據(jù)的賦值操作,下面是一個(gè)ESI和EDI配合使用的例子。

Rep movs dword ptr [edi],dword ptr [esi]

上面的指令把ESI所指向的內(nèi)存地址中的內(nèi)容復(fù)制到EDI所指向的內(nèi)存中,數(shù)據(jù)的長度在ECX寄存器中指定。


學(xué)習(xí)指針寄存器-EBP和ESP寄存器與其用途

指針寄存器

80386的指針寄存器有基址寄存器EBP,堆棧指針寄存器ESP和指令指針寄存器EIP。只需要了解基址寄存器EBP和堆棧指針寄存器ESP即可,指令指針寄存器EIP總是指向下一條要執(zhí)行的指令的地址,一般情況下無需修改EIP。

EBP和ESP寄存器

(1)EBP:EBP稱為基址寄存器,可作為通用寄存器用于存放操作數(shù),常用來代替堆棧指針訪問堆棧中的數(shù)據(jù)。
(2)ESP:ESP稱為堆棧指針寄存器,不可作為通用寄存器使用,ESP存放當(dāng)前堆棧棧頂?shù)牡刂罚话闱闆r下,ESP和EBP聯(lián)合使用來訪問函數(shù)中的參數(shù)和局部變量。

EBP和ESP寄存器的用途:

EBP和ESP常配合使用完成堆棧的訪問,下面是一段常見的堆棧訪問指令。

Push ebp
Mov ebp,esp
Sub esp,78
Push esi
Push edi
Cmp dword ptr [ebp+8],0

學(xué)習(xí)標(biāo)志寄存器-EFLAGS寄存器與其用途

標(biāo)志寄存器EFLAGS一共有32位,在這32位中大部分是保留和給編寫操作系統(tǒng)的人用的,一般情況下只需知道32位的低16位中的8位即可.

下面的圖列出了標(biāo)志寄存器EFLAGS中需要了解的8個(gè)位的位置。

  • OF(Overflow Flag):溢出標(biāo)志,溢出時(shí)為1,否則置0。
  • DF (Direction Flag):方向標(biāo)志,在串處理指令中控制信息的方向。
  • IF (Interrupt Flag) :中斷標(biāo)志
  • AF (Auxiliary carry Flag) :輔助進(jìn)位標(biāo)志,有進(jìn)位時(shí)置1,否則置0。
  • ZF (Zero Flag) :零標(biāo)志,運(yùn)算結(jié)構(gòu)為0時(shí)ZF位位置1,否則置0。
  • SF (Sign Flag):符號標(biāo)志,結(jié)果為負(fù)時(shí)置1,否則置0。
  • CF (Carry Flag): 進(jìn)位標(biāo)志,進(jìn)位時(shí)置1,否則置0。
  • PF (Parity Flag): 奇偶標(biāo)志。結(jié)果操作數(shù)中1的個(gè)數(shù)為偶數(shù)時(shí)置1,否則置0。

EFLAGS寄存器的用途

正如上面所說EFLAGS是實(shí)現(xiàn)條件判斷和邏輯判斷的一種機(jī)制,在匯編語言中一般不直接訪問EFLAGS寄存器,而是通過指令的操作隱含訪問EFLAGS寄存器,下面是一個(gè)利用EFLAGS寄存器的例子。

Cmp dword ptr [ebp+8],0    ;影響標(biāo)志CF、ZF、SF、OF、AF和PF
Jz 00405898               ; 如果ZF等于1,則跳轉(zhuǎn)到00405898

學(xué)習(xí)6種靈活的尋址方式與其作用

  • 立即尋址

示例:

Mov eax,56H

作用:通常用于賦值。

  • 直接尋址

示例:

Mov eax,[12558878H]

作用:通常用于處理變量。

  • 寄存器尋址

示例

Mov eax,[edi]

作用:地址在寄存器中。

  • 寄存器相對尋址

示例

Mov EAX,[EDI+32H]

作用:常用于訪問數(shù)組和結(jié)構(gòu)。

  • 基址加變址尋址

示例

Mov EAX,[EBP+ESI]

作用:常用于訪問數(shù)組

  • 相對基址加變址尋址。

示例

MOV EAX,[EBX+EDI-10H]

作用:常用于訪問結(jié)構(gòu)。


高級語言中的數(shù)據(jù)結(jié)構(gòu)和80386尋址方式的關(guān)系

一般高級語言中的數(shù)據(jù)結(jié)構(gòu)和尋址方式有一定的關(guān)系,熟悉這些關(guān)系對逆向分析反匯編指令有很大的幫助。

表1-1所示為高級語言中的數(shù)據(jù)結(jié)構(gòu)和80386尋址方式的關(guān)系。

數(shù)據(jù)結(jié)構(gòu)和80386尋址方式的關(guān)系
數(shù)據(jù)結(jié)構(gòu)和80386尋址方式的關(guān)系

全局類型

全部使用數(shù)據(jù)段,變量尋址使用直接的內(nèi)存地址,數(shù)組尋址使用ESI(源變址寄存器)+內(nèi)存地址。

局部類型

全部使用堆棧,變量尋址使用ESP(堆棧指針寄存器)+偏移,數(shù)組尋址使用ESP(堆棧指針寄存器)+ESI(源變址寄存器)+地址偏移

動態(tài)分配類型

全部使用數(shù)據(jù)段,變量尋址使用EBX(基址寄存器)或EAX(累加寄存器)+地址偏移,數(shù)組尋址使用EBX(基址寄存器)+ESI(源變址寄存器)+地址偏移

局部類型和動態(tài)分配類型都的數(shù)組尋址都是用了ESI(源變址寄存器)+地址偏移


學(xué)習(xí)80386指令-Intel格式和AT&T格式的指令格式

80386指令

觀察一下Intel 的80x86 CPU文檔手冊會發(fā)現(xiàn),Intel的80x86 CPU支持幾百條指令,如此多的指令莫說深入研究,連入門恐怕也非易事。

幸運(yùn)的是,在這幾百條的指令中,常用的也不過幾十條而已,Intel 的80x86 CPU之所以支持幾百條指令,原因在于Intel 的80x86 CPU為了保持向下兼容的問題,所以從過去到現(xiàn)在的所有指令都包含在CPU里面,例如有8086/8088、80186、80286和80386等。

Intel格式和AT&T格式(&在英語里讀and)

編寫IA-32架構(gòu)的匯編語言常見有兩種格式,一種是Intel格式,另一種是AT&T格式。

  • Intel 格式的指令格式。

指令名稱 目標(biāo)操作數(shù)DST,源操作數(shù)SRC
示例代碼:
Mov eax,[edx] //將內(nèi)存地址為EDX的數(shù)據(jù)放入EAX寄存器
Xchg eax,edi //交換EAX和EDI寄存器的值
Add eax,ebx // 將EAX和EBX相加,結(jié)構(gòu)放回EAX中
Shl eax,4 //將EAX邏輯左移4位。

  • AT&T格式的指令格式。

指令名稱 源操作數(shù)SRC,目標(biāo)操作數(shù)DST

示例代碼:

Mov (%EDX),%EAX    //將內(nèi)存地址為EDX的數(shù)據(jù)放入EAX寄存器
XCHG %EDI,%EAX    //交換EAX和EDI寄存器的值
ADD %EBX,%EAX    //將EAX和EBX相加,結(jié)構(gòu)放回EAX中
SHL $4,%EAX        //將EAX邏輯左移4位。

本教程中講解的匯編語言統(tǒng)一采用Intel 格式的匯編格式。


學(xué)習(xí)數(shù)據(jù)傳送指令MOV、XCHG

80386的數(shù)據(jù)傳送指令是為了實(shí)現(xiàn)CPU和內(nèi)存、輸入/輸出端口之間的數(shù)據(jù)傳送。

  • MOV:稱為數(shù)值傳送指令,格式是“MOV DST,SRC”。
  • MOV指令將源操作數(shù)SRC傳送到目的操作數(shù)DST中,
  • 傳送的數(shù)據(jù)格式可以是8字節(jié)、16字節(jié)和32字節(jié)。

示例代碼:

MOV EAX,56  //將56H立即數(shù)傳送到EAX寄存器
MOV ESI,DWROD PTR [EAX*2+1] //將內(nèi)存地址為EAX*2+1處的4字節(jié)數(shù)據(jù)傳送到ESI寄存器。
MOV AH,BYTE PTR [ESI*2+EAX]  //將內(nèi)存地址為ESI*2+EAX處的8位數(shù)據(jù)傳送到AH寄存器。
MOV DWORD PTR [ESP+36],EBX  //將EBX寄存器的值以4字節(jié)傳送到堆棧地址為ESP+36所指向的地方。
  • XCHG:稱為交換指令,XCHG實(shí)現(xiàn)寄存器間和內(nèi)存間的數(shù)據(jù)交換。

格式是“XCHG DST,SRC”。XCHG指令交換SRC和DST之間的數(shù)據(jù),
交換的數(shù)據(jù)可以是8字節(jié)、16字節(jié)和32字節(jié),其中SRC和DST必須格式相同。

示例代碼:

XCHG EAX,EDX   //將EDX寄存器的值和EAX寄存器的值交換
XCHG [ESP-55],EDI //將EDI寄存器的值和堆棧地址為[esp-55]處的值交換。
XCHG BH,BL      //將BL寄存器和BH寄存器的值交換。

學(xué)習(xí)數(shù)據(jù)傳送指令PUSH、POP

PUSH和POP:稱為壓入堆棧指令和彈出堆棧指令,格式是“PUSH SRC(源操作數(shù))”和“POP DST(目的操作數(shù))”。

PUSH指令和POP指令是匹配出現(xiàn)的,上面的代碼有多少個(gè)PUSH下面的代碼就有多少個(gè)POP,否則堆棧就會不平衡。

PUSH指令將源操作數(shù)SRC壓入堆棧,同時(shí)ESP-4,而POP恰恰相反,POP指令從堆棧的頂部彈出4字節(jié)的數(shù)值然后放入DST。在32位的Windows操作系統(tǒng)上,PUSH和POP指令的操作是以4字節(jié)為單位的

PUSH和POP指令常用于向函數(shù)傳遞參數(shù)。

示例代碼:

PUSH EAX //將EAX寄存器的值以4字節(jié)壓入堆棧,同時(shí)ESP-4
PUSH DWORD PTR [12FF8589] //將內(nèi)存地址為12FF8589所指向的值以4字節(jié)壓入堆棧,同時(shí)ESP-4

POP DWORD PTR [12FF8589] //將堆棧頂部的4字節(jié)彈出到內(nèi)存地址為12FF8589所指地方,同時(shí)ESP+4
POP EAX  //將堆棧頂部的4字節(jié)彈出到EAX寄存器,同時(shí)ESP+4
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容