靜態鏈接的一點小總結(二)
空間與地址分配
-
問題引入
??可執行文件與目標文件的格式是類似的,所以,可以說可執行文件中的代碼段和數據段都是由輸入的目標文件中合并而來的。
??解決方法:- 按序疊加
顧名思義,該方法就是將各個目標文件依次合并疊加
問題
??合并的過程中,每個段都需要有一定的地址和空間的對齊要求,對于規模稍大的應用程序,對應的輸出文件會有成百上千的段,很顯然,這種做法很浪費空間。 -
相似段合并
就是將同種性質的段進行合并。如下圖所示:
??需要注意的是:".bss段"在目標文件和可執行文件中并不會占用文件空間,但是在裝載時(重定位后進行裝載)會占用地址空間。鏈接器在合并各個段的時候,也會將".bss段"進行合并(只是沒有內容),并且分配虛擬空間。
“鏈接器為目標文件分配地址和空間”的兩層含義
1.輸出的可執行文件中的空間
2.裝載后的虛擬地址中的虛擬地址空間
3.需要注意的是,對.text和.data而言,他們在可執行文件和虛擬地址中都需要分配空間,因為他們在這兩者中都存在;但是對于.bss段而言,分配空間僅僅限于虛擬地址空間,因為它在可執行文件并沒有內容(只有大小的記錄)。- 兩步鏈接
1.空間與地址分配:掃描所有的輸入文件,獲得它們的各個段的長度、屬性和位置。將輸入文件中的符號表中所有的符號定義和符號引用收集起來,統一放到一個全局符號表。 合并相應段,計算出合并后的段的長度和位置,并建立映射關系。
2.符號解析與定位:這是鏈接的核心,使用上一步獲取到的信息,讀取輸入文件中的段信息、重定位信息,進行符號解析和重定位、調整代碼中的地址等,進而完成鏈接。鏈接前后,目標文件隔斷的分配、虛擬地址如下圖所示:
??為什么鏈接器要將ab的代碼段分配到ox08048094,數據段分配到ox08049108,而不是從 虛擬地址的0地址開始分配呢?這涉及操作系統的進程虛擬地址空間分配規則,在linux下,ELF可執行文件默認從地址0x08048000開始分配。
注意:鏈接后程序中使用的地址已經是虛擬地址,我們關心VMA和size忽略文件偏移。 - 符號地址的確定
??在虛擬內存中,由上述鏈接過程可知,各個段的虛擬地址已經知道了,并且各個符號現的段內地址也是知道的,則各個符號的虛擬地址就可以確定了。
??符號的虛擬地址確定了,就可以進行重定位了。
- 按序疊加
-
符號的解析與重定位
- 重定位表
??哪些指令是要被調整的呢?這些指令的哪些部分需要調整?怎么調整?ELF文件中有個叫重定位表的結構專門來保存這些與重定位相關的信息。
??重定位表也叫做重定位段,是ELF文件中的一個段;如果.text有需要被重定位的符號,就會有一個.rel.text的重定位代碼段,同理重定數據段也是一樣。
??重定位表中存儲的主要是重定位入口以及對應的偏移,偏移指的是該入口對應的重定位段中的位置。 - 符號解析--我們經常遇到的"undefined reference to ''"
??重定位的過程中,每一個重定位的入口都是對一個符號的引用。當連接器要對某個符號的引用進行重定位的時候,就需要確定這個符號的目標地址。此時*,鏈接器就會去查找由所有輸入目標文件的符號表組成的全局符號表,找到相應的符號后(結構體中有相應的成員)方可進行重定位。
- 重定位表
-
靜態鏈接過程
??靜態鏈接需要用到靜態庫,靜態庫可以簡單的看成一組目標文件的集合,即很多目標文件壓縮打包后的文件。- C語言的運行庫中有很多與系統功能相關的代碼,編譯完成后就會生成相同數量的目標文件,之后使用"ar"壓縮程序將這些目標文件壓縮到一起,并對那些目標文件進行編號和索引,就會形成linux中libc.a這個靜態庫文件。
- 編譯完成相應的用戶程序之后進行鏈接操作,使用ld鏈接器。ld鏈接器會自動尋找所有的需要的符號以及它們所在的目標文件,并將這些目標文件從libc.a中解壓出來(進而構建全局符號表...)(需要注意的是解壓的文件不一定就是用戶程序需要鏈接的目標文件,也可能在被解壓的目標文件中有各種各樣的嵌套,都要解壓),最終將它們鏈接在一起成為可執行文件。
-
靜態連接過程的控制
- 有一些特殊的程序,如: 操作系統內核、 BIOS 一些在沒有操作系統的情況下運行的程序(bootloader/嵌入式系統程序等) 內核驅動等 它們往往受限于一些特殊條件,如需要指定輸出文件的各段虛擬地址、段的名稱、段的存放順序等,因為這些特殊的環境,特別是硬件條件的限制,往往對程序的各段地址有特殊的要求。鏈接器大致提供了三種方式控制鏈接過程:
1.命令行參數;
2.鏈接指令放在目標文件中,編譯器經常使用這種方法向鏈接器傳遞參數。PE目標文件 的.drectve段以用來傳遞參數;
3.使用鏈接控制腳本,也是最靈活、最強大的鏈接控制方法。
- 有一些特殊的程序,如: 操作系統內核、 BIOS 一些在沒有操作系統的情況下運行的程序(bootloader/嵌入式系統程序等) 內核驅動等 它們往往受限于一些特殊條件,如需要指定輸出文件的各段虛擬地址、段的名稱、段的存放順序等,因為這些特殊的環境,特別是硬件條件的限制,往往對程序的各段地址有特殊的要求。鏈接器大致提供了三種方式控制鏈接過程: