編譯是將高可讀性的源代碼轉(zhuǎn)為匯編語(yǔ)言,再進(jìn)一步轉(zhuǎn)換為二進(jìn)制文件(obj)的過(guò)程。
當(dāng)引用 lib文件(靜態(tài)鏈接庫(kù))時(shí),會(huì)將其嵌入到生成的obj文件中,但dll文件(動(dòng)態(tài)鏈接庫(kù))不會(huì),它只在exe運(yùn)行時(shí)載入。
1. 編譯技巧
在代碼編寫(xiě)時(shí),我們可以使用一些tricky的方法來(lái)騙過(guò)編譯器,從而實(shí)現(xiàn)某些特殊要求
struct Car; //聲明Car,但未定義
Car* createCar(){ return null; }
int main() {
Car* p = createCar();
}
上面這段代碼沒(méi)有定義Car,但依然可以跑,因?yàn)榫幾g器在編譯時(shí)知道指針p的大小為4個(gè)byte。
一般而言,任何類(lèi)型的指針大小都是4個(gè)byte。
但如果不使用指針,編譯器就會(huì)報(bào)錯(cuò),比如下面的代碼。
int main() {
Car p = Car();
}
編譯器編譯時(shí)不知道Car這個(gè)類(lèi)的大小,因?yàn)樗挥新暶鳑](méi)有定義,所以會(huì)報(bào)錯(cuò)。
有時(shí)候我們會(huì)出現(xiàn)讓兩個(gè)類(lèi)A, B互相包含的情況,這時(shí)候也需要用指針。
class A {
B b;
}
class B {
A a;
}
這樣的定義會(huì)報(bào)錯(cuò),但是如果換成
class A {
B* b;
}
class B {
A* a;
}
就可以正常運(yùn)行了。
由于C++中每個(gè)cpp文件都會(huì)單獨(dú)編譯為obj,每個(gè)頭文件都會(huì)查找所有相關(guān)頭文件,嵌入再進(jìn)行編譯,很耗時(shí)間。當(dāng)工程量很大時(shí),編譯時(shí)間好幾個(gè)小時(shí)是很正常的情況。
減少編譯時(shí)間的方法可以參考這個(gè)鏈接
2. 函數(shù)傳參
C++函數(shù)都運(yùn)行在內(nèi)存中的某一塊特定區(qū)域,叫做棧。
當(dāng)我們調(diào)用Foo(5,7)這么一個(gè)函數(shù)時(shí),它的匯編指令大概如下:
push 7
push 5
jmp Foo
上級(jí)函數(shù)先把兩個(gè)參數(shù)7和5 push到棧里(壓棧),然后跳轉(zhuǎn)到Foo函數(shù)的Body地址開(kāi)始執(zhí)行Foo函數(shù)。
這里有兩個(gè)要注意的點(diǎn)
1).先push 7,后push 5
函數(shù)壓棧時(shí),參數(shù)是按照從右向左的順序壓棧。(這取決于編譯器的約定 Calling Convention,也有的是從左向右壓,但目前幾乎所有約定都是從右向左壓)
(PS:拓展)
在if(condition)中,多個(gè)condition的判斷也是從后向前判斷,這樣就會(huì)有一些很有深意的寫(xiě)法。
比如如下的代碼:
Car* p = createCar();
if(p.speed==100 && p!=null) { }
由于無(wú)法確認(rèn)p是否是空指針,所以如果直接if(p.speed==100)
可能會(huì)崩,因?yàn)閜為空時(shí)不存在speed變量。
正常的寫(xiě)法是
if(p!=null){
if(p.speed==100){ }
}
先確認(rèn)p存在,再取它的變量,但這樣就會(huì)多寫(xiě)一些代碼,沒(méi)有第一種同時(shí)判斷那么簡(jiǎn)潔。
但我不推薦使用第一種的寫(xiě)法
第二種雖然多了點(diǎn)代碼量,但更加易讀易懂易維護(hù)。tricky的寫(xiě)法雖然效率高,但可讀性經(jīng)常會(huì)比效率更加重要。
2).Calling Convention
當(dāng)Foo函數(shù)執(zhí)行完成時(shí),誰(shuí)來(lái)銷(xiāo)毀它的棧空間?
(1)Foo函數(shù)自己
(2)Foo的上級(jí)函數(shù)
兩種答案都對(duì),這就是Calling Convention。有些語(yǔ)言編譯器會(huì)采用方法1,有些語(yǔ)言編譯器會(huì)采用方法2。
由Caller(上級(jí)函數(shù))來(lái)銷(xiāo)毀空間的方法稱(chēng)為__cdecl,這也是C++的默認(rèn)約定,參數(shù)壓棧從右向左。
由Callee(函數(shù)自身)來(lái)銷(xiāo)毀空間的方法有多種,大同小異,一般是__stdcall,參數(shù)也是從右向左壓棧。
這兩種方法有區(qū)別嗎?為什么C++用__cdecl?
當(dāng)由上級(jí)調(diào)用者銷(xiāo)毀時(shí),由于上級(jí)函數(shù)會(huì)先push參數(shù),所以它知道到底push了幾個(gè)參數(shù)。但如果交給函數(shù)自己銷(xiāo)毀,它是不知道父函數(shù)push了幾個(gè)參數(shù)給自己的。
所以C++可以出現(xiàn) printf() 這種可變參數(shù)數(shù)量的神奇函數(shù),而Windows API必須顯式傳入va_list參數(shù)(如FormatMessage)來(lái)獲得變參能力。
3. 虛函數(shù)
虛函數(shù)是和類(lèi)繼承相輔相成的,父類(lèi)里定義了虛函數(shù),在每個(gè)子類(lèi)里要對(duì)應(yīng)著實(shí)現(xiàn)其body。
class Shape{
virtual void draw();
}
class triangle : Shape
class rect : Shape
=============
Shape* shapes[100];
foreach s in shapes {
s->draw();//在匯編中是 jmp 0x12345678這種,跳到draw的地址。
}
在上面的代碼中,怎么確定s->draw()是triangle的draw(),還是rect的draw()?
即如何確定 jmp 跳躍的地址?
在C++中,存在一個(gè)Virtual Table(虛表 V-table)的東西,它用來(lái)存放一個(gè)類(lèi)的所有虛函數(shù)地址。
當(dāng)我們定義了Shape類(lèi)的時(shí)候,如下
class Shape{
double x;
double y;
virtual void draw();
virtual void move();
}
在Shape中,首地址4個(gè)字節(jié)不是x,也不是y,而是一個(gè)指向Shape的V-table的指針,通過(guò)該指針可以找到Shape的虛函數(shù)表,在它的虛函數(shù)表里,存放了draw()和move()兩個(gè)函數(shù)的body的地址,可以通過(guò)這個(gè)地址去找到他們的實(shí)現(xiàn)。
虛函數(shù)名 | 地址 |
---|---|
draw | 0x12345678 |
move | 0x87654321 |
在虛表中,是通過(guò) offset 來(lái)確定是哪一個(gè)虛函數(shù)的,在上例中,draw()的offset是0,move()的offset是4。
在所有繼承自Shape的類(lèi)中,比如triangle和rect,他們的虛表也是一模一樣的,只是虛表地址不一樣。他們的虛表中也是draw()的offset是0,move()的offset是4。
所以,如何判斷兩個(gè)自定義類(lèi)變量是同一個(gè)類(lèi)型?
答:取出它們倆的首4個(gè)字節(jié),即虛表地址,如果虛表地址相同,則是同一個(gè)類(lèi)型。
關(guān)于純虛函數(shù) virtual void funtion1()=0
有沒(méi)有虛表的問(wèn)題,有人說(shuō)有,有人說(shuō)沒(méi)有, 我個(gè)人覺(jué)得有沒(méi)有不影響,畢竟就算有了虛表,它的每個(gè)虛函數(shù)也是沒(méi)有body的。