? ? ? ? 當(dāng)在Xcode中對一份源碼按下command+R(Run)時(shí),實(shí)際上做了以下四部操作:預(yù)處理(Prepressing)、編譯(Compilation)、匯編(Assembly)、鏈接(Linking)。
預(yù)處理:預(yù)處理過程主要處理那些源代碼文件中的以“#”開始的預(yù)編譯指令。比如“#include”、“#define”、注釋" //、/**/ ”等。
編譯:編譯過程就是把預(yù)處理完的文件進(jìn)行一系列詞法分析、語法分析、語義分析及優(yōu)化后生產(chǎn)相應(yīng)的匯編代碼文件。
匯編:匯編是將匯編代碼轉(zhuǎn)變成機(jī)器可以執(zhí)行的指令,每一個匯編語句幾乎都對應(yīng)一條機(jī)器指令。
鏈接:將目標(biāo)文件鏈接起來形成可執(zhí)行文件
編譯器
編譯過程一般可以分為6步:掃描、語法分析、語義分析、源代碼優(yōu)化、代碼生成和目標(biāo)代碼優(yōu)化。整個過程如圖1所示:
? ? ? ?1、掃描:首先源代碼程序被輸入到掃描器(Scanner),掃描器的任務(wù)很簡單,它只是簡單地進(jìn)行詞法分析,運(yùn)用一種類似于有限狀態(tài)機(jī)(Finite State Machine)的算法可以很輕松地將源代碼的字符序列分割成一系列的記號(Token)。
比如圖2這段代碼通過掃描之后,就會被生成如圖3這樣的表:
2、語法分析:接下來語法分析器(Grammar Parser)將對由掃描器產(chǎn)生的記號進(jìn)行語法分析,從而產(chǎn)生語法樹(Syntax Tree)。以圖2中的代碼為例會生成圖4這樣的語法樹。
3、語義分析:經(jīng)過語義分析階段以后,整個語法樹的表達(dá)式都被標(biāo)識了類型,如果有些類型需要做隱式轉(zhuǎn)換,語義分析程序會在語法樹中插入相應(yīng)的轉(zhuǎn)換節(jié)點(diǎn)。圖4語法樹將會成為圖5所示語法樹的形式。
4、源代碼優(yōu)化:顧名思義就是對源碼進(jìn)行優(yōu)化,優(yōu)化后的語法樹如圖6所示。仔細(xì)觀察,會發(fā)現(xiàn)(2 + 6)這個表達(dá)式已經(jīng)被優(yōu)化掉,因?yàn)檫@個值在編譯期就可以確定。其實(shí)直接在語法樹上作優(yōu)化是比較困難的,所以源代碼優(yōu)化器往往將整個語法樹轉(zhuǎn)化成中間代碼,它是語法樹的順序表示,其實(shí)它已經(jīng)非常接近目標(biāo)代碼了。但是它一般跟目標(biāo)機(jī)器和運(yùn)行時(shí)環(huán)境是無關(guān)的,比如它不包含數(shù)據(jù)的尺寸、變量地址和寄存器的名字。中間代碼使得編譯器可以被分為前端和后段。編譯器前端負(fù)責(zé)產(chǎn)生機(jī)器無關(guān)的中間代碼,編譯器后段負(fù)責(zé)將中間代碼轉(zhuǎn)化成目標(biāo)機(jī)器代碼。
5、目標(biāo)代碼生成和優(yōu)化:源代碼級優(yōu)化器產(chǎn)生中間代碼標(biāo)志著下面的過程都屬于編輯器后端。編譯器后端主要包括代碼生成器(Code Generator)和目標(biāo)代碼優(yōu)化器(Target Code Optimizer)。讓我們先來看看代碼生成器。代碼生成器將中間代碼轉(zhuǎn)換成目標(biāo)機(jī)器代碼,這個過程十分依賴于目標(biāo)機(jī)器,因?yàn)椴煌臋C(jī)器有著不同的字長、寄存器、整數(shù)數(shù)據(jù)類型和浮點(diǎn)數(shù)數(shù)據(jù)類型等。最后目標(biāo)代碼優(yōu)化器對上述的目標(biāo)代碼進(jìn)行優(yōu)化,比如選擇合適的尋址方式、使用位移來代替乘法運(yùn)算、刪除多余的指令等。
鏈接器
? ? ? 鏈接過程主要包括了地址和空間分配(Address and Storage Allocation)、符號決議(Symbol Resolution)和重定位(Relocation)
鏈接過程如圖6所示:
舉個例子:比如我們在程序模塊main.c中使用另外一個模塊func.c中的函數(shù)foo()。我們在main.c模塊中每一處調(diào)用foo的時(shí)候都必須確切知道foo這個函數(shù)的地址,但是由于每個模塊都是單獨(dú)編譯的,在編譯器編譯main.c的時(shí)候它并不知道foo函數(shù)的地址,所以它暫時(shí)把這些調(diào)用foo的指令的目標(biāo)地址擱置,等待最后鏈接的時(shí)候由鏈接器去將這些指令的目標(biāo)地址修正。如果沒有鏈接器,須要我們手工把每個調(diào)用foo的指令進(jìn)行修正,則填入正確的foo函數(shù)地址。當(dāng)func.c模塊被重新編譯,foo函數(shù)的地址有可能改變時(shí),那么我們在main.c中所有使用到foo的地址的指令將要全部重新調(diào)整。這些繁瑣的工作將成為程序員的噩夢。使用鏈接器,你可以直接引用其他模塊的函數(shù)和全局變量而無須知道它們的地址,因?yàn)殒溄悠髟阪溄拥臅r(shí)候,會根據(jù)你所引用的符號 foo,自動去相應(yīng)的func.c模塊查找foo的地址,然后將main.c模塊中所有引用到foo的指令重新修正,讓它們的目標(biāo)地址為真正的foo函數(shù)的地址。這就是靜態(tài)鏈接的最基本的過程和作用。