概述
C和C++編譯器是集成的,編譯一般分為如下四個步驟:
a. 預處理(preprocessing) ------------ cpp/gcc -E
b. 編譯(compilation) ------------------ cc1 / gcc -S
c. 匯編(assembly) --------------------- as
d. 鏈接(linking) ------------------------ ld
下面就以一個經典的hello程序為例了解一下上述的四步
#include <stdio.h>
int main()
{
printf("hello, world\n");
return 0;
}
1. 預處理階段:預處理器(cpp)根據字符#開頭的命令,修改原始的C程序。例如,hello.c中第一行的#include <stdio.h>
命令告訴預處理器讀取系統頭文件stdio.h的內容,并把它直接插入到程序中。結果得到另一個C程序,通常以.i
作為文件擴展名。
2. 編譯階段:編譯器(ccl)將文本文件hello.i翻譯成文件本文件hello.s,它包含一個匯編語言程序
。該程序包含函數main
的定義,如下所示:
1 main:
2 subq $8, %rsp
3 movl $.LCO, %edi
4 call puts
5 movl $0, %eax
6 addq $8, %rsp
7 ret
定義中2~7行的的每條語句都以一種文本格式描述了一條低級機器語言指令。匯編語言是非常有用的,因為它為不同高級語言的不同編譯器提供了通用的輸出語言。例如,C編譯器和Frotran編譯器產出的輸出文件用的都是一樣的匯編語言
3. 匯編階段:接下來,匯編器(as)將hello.s翻譯成機器語言指令,并把這些指令打包成一種叫做可重定位目標程序的格式,并將結果保存到目標文件hello.o中,hello.o是一個二進制文件,它包含的17個字節是函數main
的指令編碼。如果我們在文本編輯器里面打開hello.o文件,看到的將是一堆亂碼。
4. 鏈接階段:hello程序調用了printf
函數,他是每個C編譯器都提供的標準C庫的一個函數。printf函數存在于一個名為printf.o
的單獨的預編譯好了的目標文件中,而這個文件必須以某種方式合并到我們的hello.o程序中,鏈接器(ld)就負責處理這種合并。結果就得到hello文件,他是一個可執行目標文件或簡稱為可執行文件,可以被加載到內存中,有系統執行。
-
為了更好的理解可以參考下圖:
函數庫
- 函數庫一般分為靜態庫和動態庫兩種
- 靜態庫是指編譯鏈接時,把庫文件的代碼全部加入到可執行文件中,因此生成的文件比較大,但在運行時也就不再需要庫文件了。其后綴名一般為”.a“。
- 動態庫與之相反,在編譯鏈接時并沒有把庫文件的代碼加入到可執行文件中,而是在程序執行時由運行時鏈接文件加載庫,這樣可以節省系統的開銷。動態庫一般后綴名為”.so”,如前面所述的libc.so.6就是動態庫。Gcc在編譯時默認使用動態庫。
靜態庫生成方法:
ar cr libxxx.a file1.o file2.o
就是把file1.o和file2.o打包生成libxxx.a靜態庫
使用方法
gcc test.c -L/path -lxxx -o test
動態庫生成方法:
gcc -fPIC -shared file1.c -o libxxx.so
也可以分成兩部來寫
//這一步生成file1.o
gcc -fPIC file1.c -c
gcc -shared file1.o -o libtest.so
使用方法
gcc test.c -L/path -lxxx -o test
- 靜態庫鏈接時搜索路徑順序:
- ld會去找GCC命令中的參數-L
- 再找gcc的環境變量LIBRARY_PATH
- 再找內定目錄 /lib /usr/lib /usr/local/lib 這是當初compile gcc時寫在程序內的
- 動態鏈接時、執行時搜索路徑順序
- 編譯目標代碼時指定的動態庫搜索路徑
- 環境變量LD_LIBRARY_PATH指定的動態庫搜索路徑
- 配置文件/etc/ld.so.conf中指定的動態庫搜索路徑
- 默認的動態庫搜索路徑/lib
- 默認的動態庫搜索路徑/usr/lib
環境變量
- LIBRARY_PATH環境變量:指定程序靜態鏈接庫文件搜索路徑
- LD_LIBRARY_PATH環境變量:指定程序動態鏈接庫文件搜索路徑