HotSpot 虛擬機對象探秘

一、對象的創建過程

當虛擬機遇到一條new 指令時:

  1. 檢查
  • 首先將去檢查這個指令的參數是否能在常量池中定位到一個類的符號引用,并且檢查這個符合引用代表的類是否已被加載、解析和初始化過。如果沒有,那必須先執行相應的類加載過程
  1. 分配內存
  • 在類加載檢查通過后,接下來虛擬機將為新生對象分配內存。對象所需內存的大小在類加載完成后便可確定,為對象分配空間的任務等同于把一塊確定大小的內存從Java 堆中劃分出來。
    • 指針碰撞: 假如Java 堆中內存是絕對規整的,那所分配內存就僅僅是把那個指針向空閑空間那邊挪動一段與對象大小相等的距離,這種分配方式稱為“指針碰撞”

    • 空閑列表:如果Java 堆中的內存并不是規整的,虛擬機就必須維護一個列表,記錄上哪些內存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給對象的實例,并更新列表上的記錄,這種分配方式被稱為“空閑列表”

      選擇哪種分配方式由Java 堆是否規整決定,而Java 堆是否規整又由所采用的垃圾收集器是否帶有壓縮整理功能決定。

  • 并發情況下線程安全:
    • 虛擬機采用CAS配上失敗重試的方式保證更新操作的原子性
    • 把內存分配的動作按照線程劃分在不同的空間這中進行,即每個線程在Java 堆中預先分配一小塊內存,稱為本地線程分配緩沖(Thread Local Allocation Buffer,TLAB)。哪個線程分配內存,就在哪個線程的TLAB 上分配,只有TLAB用完并分配新的TLAB時,才需要同步鎖定。虛擬機是否使用TLAB,可以通過-XX:+/-UseTLAB 參數設定
  1. 初始化零值
  • 虛擬機需要將分配到的內存空間都初始化零值(不包括對象頭),如果使用TLAB,這一工作過程也可以提前至TLAB 分配時進行。這一步操作保證了對象的實例字段在Java 代碼中可以不賦初值諒直接使用,程序能訪問到這些字段的數據類型所對應的零值。
  1. 設置對象頭
  • 虛擬機要對對象進行必要的設置,例如這個對象是哪個類的實例、如何才能找到類的元數據信息、對象的哈希碼、對象的 GC 分代年齡等信息。這些信息存放在對象的對象頭(Object Header)這中。根據虛擬機當前的運行狀態的不同,如是否啟用偏向鎖等,對象頭會有不同的設置方式。
  1. 執行init 方法。
  • 從虛擬機角度來看,一個新的對象已經產生了,但從 Java 程序的視角來看,對象創建才剛剛開始——<init>方法還沒有執行,所有的字段都還為零。所以,一般來說(由字節碼中是否跟隨 invokespecial 指令所決定),執行 new 指令之后會接著執行<init>方法,把對象按照程序員的意愿進行初始化,這樣一個真正可用的對象才算安全產生出來。

二、對象的內存布局

? ? 在 HotSpot 虛擬機中,對象在內存中存儲的布局可以分為 3 塊區域:對象頭(Header)、實例數據(Instance Data)和對齊填充(Padding)。

  1. 對象頭(Header)

? ? HotSpot 虛擬機的對象頭包括兩部分信息:

  • 第一部分用于存儲對象自身的運行時數據

? ? 存儲如哈希碼(HashCode)、GC 分代年齡、鎖狀態標志、線程持有的鎖、偏向線程ID、偏向時間戳等,這部分數據的長度在32位和64位的虛擬機(未開啟壓縮指針)中分別為 32bit 和 64bit,官方稱為“Mark Word”.

  • 另外一部分是類型指針

??類型指針即對象指向它的類元數據的指針,虛擬機通過這個指針來確定這個對象是哪個類的實例。

  1. 實例數據(Instance Data)

??實例數據部分是對象真正存儲的有效信息,也是在程序代碼中所定義的各種類型的字段內容。無論是從父類繼承下來的,還是子類中定義的,都需要記錄起來。這部分的存儲順序會受到虛擬機分配策略參數(FieldsAllocationStyle)的字段在 Java 源碼中定義順序的影響。HotSpot 虛擬機默認的分配策略為 longs/doubles、ints、shorts/chars、bytes/booleans、oops(Ordinary Object Pointers),從分配策略中可以看出,相同寬度的字段總是被分配到一起。在滿足這個前提條件的情況下,在父類中定義的變量會出現在子類之前。如果 CompactFields 參數值為true(默認為true),那么子類之中較窄的變量也可能會插入到父類變量的空隙之中。

  1. 對齊填充(Padding)

??對齊填充并不是必然存在的,也沒有特別的含義,它僅僅起著占位符的作用由于 HotSpot VM 的自動內存管理系統要求對象起始地址必須是 8 字節的整數倍。當對象實例數據部分沒有對齊時,就需要通過對齊填充來補全。

三、對象的訪問定位

??Java 程序需要通過棧上的 reference 數據來操作堆上的具體對象。目前主流的訪問方式有使用句柄和直接指針兩種。

  • 如果使用句柄訪問的話,那么 Java 堆中將會劃出一塊內存來作為句柄池,reference 中存儲的就是對象的句柄地址,而句柄中包含了對象實例數據與類型數據各自的具體地址信息。

    • 優勢:reference 中存儲的是穩定的句柄地址,在對象被移動(垃圾收集時移動對象是非常普遍的行為)時只會改句柄中的實例數據指針,而 reference 本身不需要修改。
  • 如果使用直接指針訪問,那么 Java 堆對象的布局中就必須考慮如何放置訪問類型數據的相關信息,而 reference 中存儲的直接就是對象地址。

    • 優勢:直接指針訪問方式的最大好處就是速度更快,它節省了一次指針定位的時間開銷,由于對象的訪問在 Java 中非常繁重,因此這類開銷積少成多后也是一項非??捎^的執行成來。

Sun HotSpot 是使用直接指針方式進行對象訪問的。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容