本次實驗內(nèi)容:
- 用Bochs調(diào)試工具跟蹤Linux 0.11的地址翻譯(地址映射)過程,了解IA-32和Linux 0.11的內(nèi)存管理機制;
- 在Ubuntu上編寫多進(jìn)程的生產(chǎn)者—消費者程序,用共享內(nèi)存做緩沖區(qū);
(一)地址映射這個過程不好理解
在復(fù)制實驗指導(dǎo)書之前我想說下 linux虛擬內(nèi)存機制;
- linux采用段頁結(jié)合的方式.
段為虛擬地址,頁找到物理地址 - 程序的地址分代碼段,數(shù)據(jù)段這樣一段段保存,用段基址+偏移量來標(biāo)記
- 每個段在LDT這個段表記錄著 每一個段的邏輯基地址;
- LDT的物理地址可以在GDT(全局描述符表)找到.
找到LDT 再根據(jù)段號 去找到段基地址,加上偏移量就等于線性虛擬地址. - 找到虛擬地址 找物理地址就是找頁目錄,頁表,頁偏移量的問題了
- 所有這些地址注意轉(zhuǎn)化成二進(jìn)制,然后懂得每一位的意義;
*段選擇符是一個64位的數(shù),所以占8個字節(jié),分高4字節(jié)跟低4字節(jié)
前低后高 31-0這樣排列
實驗指導(dǎo)書關(guān)于這個過程很詳細(xì),我就復(fù)制粘貼了:
編譯好Linux 0.11后,首先通過運行./dbg-asm啟動調(diào)試器,此時Bochs的窗口處于黑屏狀態(tài),而命令行窗口顯示:
“Next at t=0”表示下面的指令是Bochs啟動后要執(zhí)行的第一條軟件指令。單步跟蹤進(jìn)去就能看到bios的代碼。不過這不是本實驗需要的。直接輸入命令“c”,continue程序的運行,Bochs一如既往地啟動了Linux 0.11。
在Linux 0.11下輸入(或拷入)test.c,編譯為test,運行之,打印如下信息:
The logical/virtual address of i is 0x00003004
只要test不變,0x00003004這個值在任何人的機器上都是一樣的。即使在同一個機器上多次運行test,也是一樣的。
test是一個死循環(huán),只會不停占用CPU,不會退出。
暫停
當(dāng)test運行的時候,在命令行窗口按“ctrl+c”,Bochs會暫停運行,進(jìn)入調(diào)試狀態(tài)。絕大多數(shù)情況下都會停在test內(nèi),顯示類似如下信息:
(0) [0x00fc8031] 000f:00000031 (unk. ctxt): cmp dword ptr ds:0x3004, 0x00000000 ; 833d0430000000
其中加粗的“000f”如果是“0008”,則說明中斷在了內(nèi)核里。那么就要c,然后再ctrl+c,直到變?yōu)椤?00f”為止。如果顯示的下一條指令不是“cmp ...”,就用“n”命令單步運行幾步,直到停在“cmp ...”。
使用命令“u /7”,顯示從當(dāng)前位置開始7條指令的反匯編代碼,如下:
10000031: ( ): cmp dword ptr ds:0x3004, 0x00000000 ; 833d043000000010000038: ( ): jz .+0x00000002 ; 74021000003a: ( ): jmp .+0xfffffff5 ; ebf51000003c: ( ): xor eax, eax ; 31c01000003e: ( ): jmp .+0x00000000 ; eb0010000040: ( ): leave ; c910000041: ( ): ret ; c3
這就是test.c中從while開始一直到return的匯編代碼。變量i保存在ds:0x3004這個地址,并不停地和0進(jìn)行比較,直到它為0,才會跳出循環(huán)。
現(xiàn)在,開始尋找ds:0x3004對應(yīng)的物理地址。
段表
ds:0x3004是虛擬地址,ds表明這個地址屬于ds段。首先要找到段表,然后通過ds的值在段表中找到ds段的具體信息,才能繼續(xù)進(jìn)行地址翻譯。每個在IA-32上運行的應(yīng)用程序都有一個段表,叫LDT,段的信息叫段描述符。
LDT在哪里呢?ldtr寄存器是線索的起點,通過它可以在GDT(全局描述符表)中找到LDT的物理地址。
用“sreg”命令:
cs:s=0x000f, dl=0x00000002, dh=0x10c0fa00, valid=1ds:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=3ss:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=1es:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=1fs:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=1gs:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=1ldtr:s=0x0068, dl=0xc2d00068, dh=0x000082f9, valid=1tr:s=0x0060, dl=0x52e80068, dh=0x00008bfd, valid=1gdtr:base=0x00005cc8, limit=0x7ffidtr:base=0x000054c8, limit=0x7ff
可以看到ldtr的值是0x0068=0000000001101000(二進(jìn)制),表示LDT表存放在GDT表的1101(二進(jìn)制)=13(十進(jìn)制)號位置(每位數(shù)據(jù)的意義參考后文敘述的段選擇子)。而GDT的位置已經(jīng)由gdtr明確給出,在物理地址的0x00005cc8。用“xp /32w 0x00005cc8”查看從該地址開始,32個字的內(nèi)容,即GDT表的前16項,如下:
0x00005cc8 : 0x00000000 0x00000000 0x00000fff 0x00c09a000x00005cd8 : 0x00000fff 0x00c09300 0x00000000 0x000000000x00005ce8 : 0xa4280068 0x00008901 0xa4100068 0x000082010x00005cf8 : 0xf2e80068 0x000089ff 0xf2d00068 0x000082ff0x00005d08 : 0xd2e80068 0x000089ff 0xd2d00068 0x000082ff0x00005d18 : 0x12e80068 0x000089fc 0x12d00068 0x000082fc0x00005d28 : 0xc2e80068 0x00008bf9 0xc2d00068 0x000082f90x00005d38 : 0x00000000 0x00000000 0x00000000 0x00000000
GDT表中的每一項占64位(8個字節(jié)),所以我們要查找的項的地址是“0x00005cc8 + 13 * 8”。“xp /2w 0x00005cc8 + 13 * 8”,得到:
0x00005d30 : 0xc2d00068 0x000082f9
上兩步看到的數(shù)值可能和這里給出的示例不一致,這是很正常的。如果想確認(rèn)是否準(zhǔn)確,就看sreg輸出中,ldtr所在行里,dl和dh的值,它們是Bochs的調(diào)試器自動計算出的,你尋找到的必須和它們一致。
“0xc2d00068 0x000082f9”將其中的加粗?jǐn)?shù)字組合為“0x00f9c2d0”,這就是LDT表的物理地址(為什么這么組合,參考后文介紹的段描述符)。“xp /8w 0x00f9c2d0”,得到:
0x00f9c2d0 : 0x00000000 0x00000000 0x00000002 0x10c0fa000x00f9c2e0 : 0x00003fff 0x10c0f300 0x00000000 0x00f9d000
這就是LDT表的前4項內(nèi)容了。
段描述符
在保護(hù)模式下,段寄存器有另一個名字,叫段選擇子,因為它保存的信息主要是該段在段表里索引值,用這個索引值可以從段表中“選擇”出相應(yīng)的段描述符。
先看看ds選擇子的內(nèi)容,還是用“sreg”命令:
cs:s=0x000f, dl=0x00000002, dh=0x10c0fa00, valid=1ds:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=3ss:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=1es:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=1fs:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=1gs:s=0x0017, dl=0x00003fff, dh=0x10c0f300, valid=1ldtr:s=0x0068, dl=0x52d00068, dh=0x000082fd, valid=1tr:s=0x0060, dl=0x52e80068, dh=0x00008bfd, valid=1gdtr:base=0x00005cc8, limit=0x7ffidtr:base=0x000054c8, limit=0x7ff
可以看到,ds的值是0x0017。段選擇子是一個16位寄存器,它各位的含義如下圖:

其中RPL是請求特權(quán)級,當(dāng)訪問一個段時,處理器要檢查RPL和CPL(放在cs的位0和位1中,用來表示當(dāng)前代碼的特權(quán)級),即使程序有足夠的特權(quán)級(CPL)來訪問一個段,但如果RPL(如放在ds中,表示請求數(shù)據(jù)段)的特權(quán)級不足,則仍然不能訪問,即如果RPL的數(shù)值大于CPL(數(shù)值越大,權(quán)限越小),則用RPL的值覆蓋CPL的值。而段選擇子中的TI是表指示標(biāo)記,如果TI=0,則表示段描述符(段的詳細(xì)信息)在GDT(全局描述符表)中,即去GDT中去查;而TI=1,則去LDT(局部描述符表)中去查。
看看上面的ds,0x0017=0000000000010111(二進(jìn)制),所以RPL=11,可見是在最低的特權(quán)級(因為在應(yīng)用程序中執(zhí)行),TI=1,表示查找LDT表,索引值為10(二進(jìn)制)= 2(十進(jìn)制),表示找LDT表中的第3個段描述符(從0開始編號)。
LDT和GDT的結(jié)構(gòu)一樣,每項占8個字節(jié)。所以第3項“0x00003fff 0x10c0f300”就是搜尋好久的ds的段描述符了。用“sreg”輸出中ds所在行的dl和dh值可以驗證找到的描述符是否正確。
接下來看看段描述符里面放置的是什么內(nèi)容:
可以看到,段描述符是一個64位二進(jìn)制的數(shù),存放了段基址和段限長等重要的數(shù)據(jù)。其中位P(Present)是段是否存在的標(biāo)記;位S用來表示是系統(tǒng)段描述符(S=0)還是代碼或數(shù)據(jù)段描述符(S=1);四位TYPE用來表示段的類型,如數(shù)據(jù)段、代碼段、可讀、可寫等;DPL是段的權(quán)限,和CPL、RPL對應(yīng)使用;位G是粒度,G=0表示段限長以位為單位,G=1表示段限長以4KB為單位;其他內(nèi)容就不詳細(xì)解釋了。
段基址和線性地址
費了很大的勁,實際上我們需要的只有段基址一項數(shù)據(jù),即段描述符“0x00003fff 0x10c0f300”中加粗部分組合成的“0x10000000”。這就是ds段在線性地址空間中的起始地址(ds段的段基址)。用同樣的方法也可以算算其它段的基址,都是這個數(shù)。
段基址+段內(nèi)偏移,就是線性地址了。所以ds:0x3004的線性地址就是:
0x10000000 + 0x3004 = 0x10003004
用“calc ds:0x3004”命令可以驗證這個結(jié)果。
頁表
從線性地址計算物理地址,需要查找頁表。線性地址變成物理地址的過程如下:

首先需要算出線性地址中的頁目錄號、頁表號和頁內(nèi)偏移,它們分別對應(yīng)了32位線性地址的10位+10位+12位,所以0x10003004的頁目錄號是64,頁號3,頁內(nèi)偏移是4。
IA-32下,頁目錄表的位置由CR3寄存器指引。“creg”命令可以看到:
CR0=0x8000001b: PG cd nw ac wp ne ET TS em MP PECR2=page fault laddr=0x10002f68CR3=0x00000000PCD=page-level cache disable=0PWT=page-level writes transparent=0CR4=0x00000000: osxmmexcpt osfxsr pce pge mce pae pse de tsd pvi vme
說明頁目錄表的基址為0。看看其內(nèi)容,“xp /68w 0”:
0x00000000 : 0x00001027 0x00002007 0x00003007 0x000040270x00000010 : 0x00000000 0x00024764 0x00000000 0x000000000x00000020 : 0x00000000 0x00000000 0x00000000 0x000000000x00000030 : 0x00000000 0x00000000 0x00000000 0x000000000x00000040 : 0x00ffe027 0x00000000 0x00000000 0x000000000x00000050 : 0x00000000 0x00000000 0x00000000 0x000000000x00000060 : 0x00000000 0x00000000 0x00000000 0x000000000x00000070 : 0x00000000 0x00000000 0x00000000 0x000000000x00000080 : 0x00ff3027 0x00000000 0x00000000 0x000000000x00000090 : 0x00000000 0x00000000 0x00000000 0x000000000x000000a0 : 0x00000000 0x00000000 0x00000000 0x000000000x000000b0 : 0x00000000 0x00000000 0x00000000 0x00ffb0270x000000c0 : 0x00ff6027 0x00000000 0x00000000 0x000000000x000000d0 : 0x00000000 0x00000000 0x00000000 0x000000000x000000e0 : 0x00000000 0x00000000 0x00000000 0x000000000x000000f0 : 0x00000000 0x00000000 0x00000000 0x00ffa0270x00000100 : 0x00faa027 0x00000000 0x00000000 0x00000000
頁目錄表和頁表中的內(nèi)容很簡單,是1024個32位(正好是4K)數(shù)。這32位中前20位是物理頁框號,后面是一些屬性信息(其中最重要的是最后一位P)。其中第65個頁目錄項就是我們要找的內(nèi)容,用“xp /w 0+644”查看:
0x00000100 : 0x00faa027
其中的027是屬性,顯然P=1,其他屬性實驗者自己分析吧。頁表所在物理頁框號為0x00faa,即頁表在物理內(nèi)存的0x00faa000位置。從該位置開始查找3號頁表項,得到(xp /w 0x00faa000+34):
0x00faa00c : 0x00fa7067
其中067是屬性,顯然P=1,應(yīng)該是這樣。
物理地址
最終結(jié)果馬上就要出現(xiàn)了!
線性地址0x10003004對應(yīng)的物理頁框號為0x00fa7,和頁內(nèi)偏移0x004接到一起,得到0x00fa7004,這就是變量i的物理地址。可以通過兩種方法驗證。
第一種方法是用命令“page 0x10003004”,可以得到信息:“l(fā)inear page 0x10003000 maps to physical page 0x00fa7000”。
第二種方法是用命令“xp /w 0x00fa7004”,可以看到:
0x00fa7004 : 0x12345678
這個數(shù)值確實是test.c中i的初值。
現(xiàn)在,通過直接修改內(nèi)存來改變i的值為0,命令是: setpmem 0x00fa7004 4 0,表示從0x00fa7004地址開始的4個字節(jié)都設(shè)為0。然后再用“c”命令繼續(xù)Bochs的運行,可以看到test退出了,說明i的修改成功了,此項實驗結(jié)束。
總結(jié)一下需要找的過程:
- 找段號跟段偏移量
- 找LDT跟GDT
- 根據(jù)GDT的段描述符找到LDT的段描述符拼湊段基址
- 根據(jù)段基址+偏移量算出 線性虛擬地址
- 找頁目錄表
- 根據(jù)頁目錄找到頁表 進(jìn)行地址翻譯
(二)共享內(nèi)存
共享內(nèi)存用函數(shù):
int shmget(key_t key, size_t size, int shmflg);
第一個參數(shù),與信號量的semget函數(shù)一樣,程序需要提供一個參數(shù)key(非0整數(shù)),它有效地為共享內(nèi)存段命名,shmget函數(shù)成功時返回一個與key相關(guān)的共享內(nèi)存標(biāo)識符(非負(fù)整數(shù)),用于后續(xù)的共享內(nèi)存函數(shù)。調(diào)用失敗返回-1.
不相關(guān)的進(jìn)程可以通過該函數(shù)的返回值訪問同一共享內(nèi)存,它代表程序可能要使用的某個資源,程序?qū)λ泄蚕韮?nèi)存的訪問都是間接的,程序先通過調(diào)用shmget函數(shù)并提供一個鍵,再由系統(tǒng)生成一個相應(yīng)的共享內(nèi)存標(biāo)識符(shmget函數(shù)的返回值),只有shmget函數(shù)才直接使用信號量鍵,所有其他的信號量函數(shù)使用由semget函數(shù)返回的信號量標(biāo)識符。
第二個參數(shù),size以字節(jié)為單位指定需要共享的內(nèi)存容量
第三個參數(shù),shmflg是權(quán)限標(biāo)志,它的作用與open函數(shù)的mode參數(shù)一樣,如果要想在key標(biāo)識的共享內(nèi)存不存在時,創(chuàng)建它的話,可以與IPC_CREAT做或操作。共享內(nèi)存的權(quán)限標(biāo)志與文件的讀寫權(quán)限一樣,舉例來說,0644,它表示允許一個進(jìn)程創(chuàng)建的共享內(nèi)存被內(nèi)存創(chuàng)建者所擁有的進(jìn)程向共享內(nèi)存讀取和寫入數(shù)據(jù),同時其他用戶創(chuàng)建的進(jìn)程只能讀取共享內(nèi)存。
第一次創(chuàng)建完共享內(nèi)存時,它還不能被任何進(jìn)程訪問,shmat函數(shù)的作用就是用來啟動對該共享內(nèi)存的訪問,并把共享內(nèi)存連接到當(dāng)前進(jìn)程的地址空間
void *shmat(int shm_id, const void *shm_addr, int shmflg);
第一個參數(shù),shm_id是由shmget函數(shù)返回的共享內(nèi)存標(biāo)識。
第二個參數(shù),shm_addr指定共享內(nèi)存連接到當(dāng)前進(jìn)程中的地址位置,通常為空,表示讓系統(tǒng)來選擇共享內(nèi)存的地址。
第三個參數(shù),shm_flg是一組標(biāo)志位,通常為0。
調(diào)用成功時返回一個指向共享內(nèi)存第一個字節(jié)的指針,如果調(diào)用失敗返回-1.
product.c文件:
#define __LIBRARY__
#include <sys/stat.h>
#include <sys/types.h>
#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>
#include <semaphore.h>
#include <sys/ipc.h>
#include <sys/shm.h>
#include <sys/sem.h>
#define Total 500
#define BUFFERSIZE 10
int main()
{
int shmid;
int put_pos = 0, i;
int *ShareAddress;
sem_t *empty, *full, *mutex;
empty = (sem_t *)sem_open("empty", O_CREAT, 0777, 10);
full = (sem_t *)sem_open("full", O_CREAT, 0777, 0);
mutex = (sem_t *)sem_open("mutex",O_CREAT, 0777, 1);
shmid = shmget( 555204, BUFFERSIZE*sizeof(int), IPC_CREAT|0666);
/*
if(!shmid)
{
printf("shmget failed!");
exit(0);
}
*/
ShareAddress = (int*)shmat(shmid, NULL, 0);
/*
if(!ShareAddress)
{
printf("shmat failed!");
exit(0);
}
*/
for( i = 0 ; i < Total; i++)
{
sem_wait(empty);
sem_wait(mutex);
ShareAddress[put_pos] = i;
put_pos = ( put_pos + 1 ) % BUFFERSIZE;
sem_post(mutex);
sem_post(full);
}
while(1);
return 0;
}
consumer.c文件:
#define __LIBRARY__
#include <sys/stat.h>
#include <sys/types.h>
#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>
#include <semaphore.h>
#include <sys/ipc.h>
#include <sys/shm.h>
#define Total 500
#define BUFFERSIZE 10
int main()
{
int shmid;
int get_pos = 0, i;
int *ShareAddress;
sem_t *empty, *full, *mutex;
empty = (sem_t *)sem_open("empty", O_CREAT, 0777, 10);
full = (sem_t *)sem_open("full", O_CREAT, 0777, 0);
mutex = (sem_t *)sem_open("mutex",O_CREAT, 0777, 1);
shmid = shmget( 555204, BUFFERSIZE*sizeof(int), IPC_CREAT|0666 ); /*返回共享內(nèi)存的標(biāo)識符*/
/* if(!shmid)
{
printf("shmget failed!");
fflush(stdout);
exit(0);
}
*/
ShareAddress = (int*)shmat(shmid, NULL, 0);
/*
if(!ShareAddress)
{
printf("shmat failed!");
fflush(stdout);
exit(0);
}
*/
for(i = 0; i < Total; i++)
{
sem_wait(full);
sem_wait(mutex);
printf("%d\n", ShareAddress[get_pos]);
fflush(stdout);
get_pos = ( get_pos + 1 ) % BUFFERSIZE;
sem_post(mutex);
sem_post(empty);
}
sem_unlink("empty");
sem_unlink("full");
sem_unlink("mutex");
return 0;
}