【Code_Base】編譯原理的簡述

概述

C和C++編譯器是集成的,編譯一般分為如下四個步驟:
a. 預處理(preprocessing) ------------ cpp/gcc -E
b. 編譯(compilation) ------------------ cc1 / gcc -S
c. 匯編(assembly) --------------------- as
d. 鏈接(linking) ------------------------ ld

下面就以一個經典的hello程序為例了解一下上述的四步

#include <stdio.h>

int main()
{
    printf("hello, world\n");
    return 0;
}

1. 預處理階段:預處理器(cpp)根據字符#開頭的命令,修改原始的C程序。例如,hello.c中第一行的#include <stdio.h>命令告訴預處理器讀取系統頭文件stdio.h的內容,并把它直接插入到程序中。結果得到另一個C程序,通常以.i作為文件擴展名。

2. 編譯階段:編譯器(ccl)將文本文件hello.i翻譯成文件本文件hello.s,它包含一個匯編語言程序。該程序包含函數main的定義,如下所示:

1   main:
2       subq     $8, %rsp
3       movl     $.LCO, %edi
4       call     puts
5       movl     $0, %eax
6       addq     $8, %rsp
7       ret
定義中2~7行的的每條語句都以一種文本格式描述了一條低級機器語言指令。匯編語言是非常有用的,因為它為不同高級語言的不同編譯器提供了通用的輸出語言。例如,C編譯器和Frotran編譯器產出的輸出文件用的都是一樣的匯編語言

3. 匯編階段:接下來,匯編器(as)將hello.s翻譯成機器語言指令,并把這些指令打包成一種叫做可重定位目標程序的格式,并將結果保存到目標文件hello.o中,hello.o是一個二進制文件,它包含的17個字節是函數main的指令編碼。如果我們在文本編輯器里面打開hello.o文件,看到的將是一堆亂碼。

4. 鏈接階段:hello程序調用了printf函數,他是每個C編譯器都提供的標準C庫的一個函數。printf函數存在于一個名為printf.o的單獨的預編譯好了的目標文件中,而這個文件必須以某種方式合并到我們的hello.o程序中,鏈接器(ld)就負責處理這種合并。結果就得到hello文件,他是一個可執行目標文件或簡稱為可執行文件,可以被加載到內存中,有系統執行。

  • 為了更好的理解可以參考下圖:


函數庫

  • 函數庫一般分為靜態庫和動態庫兩種
  1. 靜態庫是指編譯鏈接時,把庫文件的代碼全部加入到可執行文件中,因此生成的文件比較大,但在運行時也就不再需要庫文件了。其后綴名一般為”.a“。
  2. 動態庫與之相反,在編譯鏈接時并沒有把庫文件的代碼加入到可執行文件中,而是在程序執行時由運行時鏈接文件加載庫,這樣可以節省系統的開銷。動態庫一般后綴名為”.so”,如前面所述的libc.so.6就是動態庫。Gcc在編譯時默認使用動態庫。
靜態庫生成方法:  
    ar cr libxxx.a file1.o file2.o  
    就是把file1.o和file2.o打包生成libxxx.a靜態庫  
使用方法
    gcc test.c -L/path -lxxx -o test  


動態庫生成方法:
    gcc -fPIC -shared file1.c -o libxxx.so  
也可以分成兩部來寫  
    //這一步生成file1.o 
    gcc -fPIC file1.c -c  
    gcc -shared file1.o -o libtest.so  
使用方法
    gcc test.c -L/path -lxxx -o test  
  • 靜態庫鏈接時搜索路徑順序:
  1. ld會去找GCC命令中的參數-L
  2. 再找gcc的環境變量LIBRARY_PATH
  3. 再找內定目錄 /lib /usr/lib /usr/local/lib 這是當初compile gcc時寫在程序內的
  • 動態鏈接時、執行時搜索路徑順序
  1. 編譯目標代碼時指定的動態庫搜索路徑
  2. 環境變量LD_LIBRARY_PATH指定的動態庫搜索路徑
  3. 配置文件/etc/ld.so.conf中指定的動態庫搜索路徑
  4. 默認的動態庫搜索路徑/lib
  5. 默認的動態庫搜索路徑/usr/lib

環境變量

  • LIBRARY_PATH環境變量:指定程序靜態鏈接庫文件搜索路徑
  • LD_LIBRARY_PATH環境變量:指定程序動態鏈接庫文件搜索路徑


聲明:本文參考自《深入理解計算機系統》


GitHub主頁

CSDN Blog

Email:jinjob@icloud.com

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容