[TOC]
8.1 概述
- 執行引擎是 Java 虛擬機最核心的組成部分之一。“虛擬機” 是一個相對于 “物理機” 的概念,這兩種機器都有代碼執行能力,其區別是物理機的執行引擎是直接建立在處理器、硬件、指令集和操作系統層面上的,而虛擬機的執行引擎則是由自己實現的,因此可以自行制定指令集與執行引擎的結構體系,并且能夠執行那些不被硬件直接支持的指令集格式。
- 在 Java 虛擬機規范中制定了虛擬機字節碼執行引擎的概念模型,這個概念模型成為各種虛擬機執行引擎的統一外觀(Facade)。在不同的虛擬機實現里面,執行引擎在執行 Java 代碼的時候可能會有解釋執行(通過解釋器執行)和編譯執行(通過即時編譯器產生本地代碼執行)兩種選擇,也可能兩者兼備,甚至還可能會包含幾個不同級別的編譯器執行引擎。
- 但從外觀上看起來,所有的 Java 虛擬機的執行引擎都是一致的:輸入的是字節碼文件,處理過程是字節碼解析的等效過程,輸出的是執行結果。
8.2 運行時棧幀結構
8.2.0 概述
- 棧幀(Stack Frame)是用于支持虛擬機進行方法調用和方法執行的數據結構,它是虛擬機運行時數據區中的虛擬機棧(Virtual Machine Stack)的棧元素。
- 棧幀存儲了方法的局部變量表、操作數棧、動態連接和方法返回地址等信息。每一個方法從調用開始至執行完成的過程,都對應著一個棧幀在虛擬機棧里面從入棧到出棧的過程。(一個方法對應一個棧幀)
- 在編譯程序代碼的時候,棧幀中需要多大的局部變量表,多深的操作數棧都已經完全確定了,并且寫入到方法表的 Code 屬性之中,因此一個棧幀需要分配多少內存,不會受到程序運行期變量數據的影響,而僅僅取決于具體的虛擬機實現。
- 一個線程中的方法調用鏈可能會很長,很多方法都同時處于執行狀態。對于執行引擎來說,在活動線程中,只有位于棧頂的棧幀才是有效的,稱為當前棧幀(Current Stack Frame),與這個棧幀相關聯的方法稱為當前方法(Current Method)。執行引擎運行的所有字節碼指令都只針對當前棧幀進行操作。
棧幀
8.2.1 局部變量表
- 局部變量表(Local-Variable-Table)是一組變量值存儲空間,用于存放方法參數和方法內部定義的局部變量。
- 在 Java 程序編譯為 Class 文件時,就在方法的 Code 屬性的
max_locals
數據項中確定了該方法所需要分配的局部變量表的最大容量。 - 局部變量表的容量以變量槽(Variable Slot,下稱Slot)為最小單位,虛擬機規范中并沒有明確指明一個Slot應占用的內存空間大小,只是很有導向性地說到每個Slot都應該能存放一個boolean、byte、char、short、int、float、reference 或returnAddress類型的數據。
- 對于64位的數據類型,虛擬機會以高位對齊的方式為其分配兩個連續的Slot空間。
- 虛擬機通過索引定位的方式使用局部變量表,索引值的范圍是從0開始至局部變量表最大的Slot數量。如果訪問的是32位數據類型的變量,索引 n 就代表了使用第n個Slot,如果是64位數據類型的變量,則說明會同時使用n和n+1兩個Slot。對于兩個相鄰的共同存放一個64位數據的兩個Slot,不允許采用任何方式單獨訪問其中的某一個,Java虛擬機規范中明確要求了如果遇到進行這種操作的字節碼序列,虛擬機應該在類加載的校驗階段拋出異常。
- 在方法執行時,虛擬機是使用局部變量表完成參數值到參數變量列表的傳遞過程的,如果執行的是實例方法(非static的方法),那局部變量表中第0位索引的Slot默認是用于傳遞方法所屬對象實例的引用,在方法中可以通過關鍵字 “this” 來訪問到這個隱含的參數。其余參數則按照參數表順序排列,占用從1開始的局部變量Slot,參數表分配完畢后,再根據方法體內部定義的變量順序和作用域分配其余的Slot。
- 為了盡可能節省棧幀空間,局部變量表中的Slot是可以重用的,方法體中定義的變量,其作用域并不一定會覆蓋整個方法體,如果當前字節碼PC計數器的值已經超出了某個變量的作用域,那這個變量對應的Slot就可以交給其他變量使用。
8.2.2 操作數棧
- 操作數棧(Operand Stack)也常稱為操作棧,它是一個后入先出(Last In First Out,LIFO)棧。
- 操作數棧的每一個元素可以是任意的 Java 數據類型,包括 long 和double。32位數據類型所占的棧容量為1,64位數據類型所占的棧容量為2。
- 操作數棧中元素的數據類型必須與字節碼指令的序列嚴格匹配,在編譯程序代碼的時候,編譯器要嚴格保證這一點,在類校驗階段的數據流分析中還要再次驗證這一點。
- 以 iadd 指令為例,這個指令用于整型數加法,它在執行時,最接近棧頂的兩個元素的數據類型必須為 int 型,不能出現一個 long 和一個 float 使用 iadd 命令相加的情況。
- 另外,在概念模型中,兩個棧幀作為虛擬機棧的元素,是完全相互獨立的。但在大多虛擬機的實現里都會做一些優化處理,令兩個棧幀出現一部分重疊。讓下面棧幀的部分操作數棧與上面棧幀的部分局部變量表重疊在一起,這樣在進行方法調用時就可以共用一部分數據,無須進行額外的參數復制傳遞。
操作數棧
8.2.3 動態連接
- 每個棧幀都包含一個指向運行時常量池中該棧幀所屬方法的引用,持有這個引用是為了支持方法調用過程中的動態連接(Dynamic Linking)。
- Class文件的常量池中存有大量的符號引用,字節碼中的方法調用指令就以常量池中指向方法的符號引用作為參數。
- 靜態解析:符號引用在類加載階段或者第一次使用的時候轉化為直接引用
- 動態連接:符號引用在每一次運行期間轉化為直接引用。
8.2.4 方法返回地址
- 當一個方法開始執行后,只有兩種方式可以退出這個方法。
- 第一種方式:執行引擎遇到任意一個方法返回的字節碼指令,這時候可能會有返回值傳遞給上層的方法調用者(調用當前方法的方法稱為調用者),是否有返回值和返回值的類型將根據遇到何種方法返回指令來決定,這種退出方法的方式稱為正常完成出口(Normal Method Invocation Completion)。
- 另外一種退出方式:在方法執行過程中遇到了異常,并且這個異常沒有在方法體內得到處理,只要在本方法的異常表中沒有搜索到匹配的異常處理器,就會導致方法退出,這種退出方法的方式稱為異常完成出口(Abrupt Method Invocation Completion)。
- 一個方法使用異常完成出口的方式退出,是不會給它的上層調用者產生任何返回值的。
- 無論采用何種退出方式,在方法退出之后,都需要返回到方法被調用的位置,程序才能繼續執行,方法返回時可能需要在棧幀中保存一些信息,用來幫助恢復它的上層方法的執行狀態。
- 一般來說,方法正常退出時,調用者的 PC 計數器的值可以作為返回地址,棧幀中很可能會保存這個計數器值。
- 而方法異常退出時,返回地址是要通過異常處理器表來確定的,棧幀中一般不會保存這部分信息。方法退出的過程實際上就等同于把當前棧幀出棧,因此退出時可能執行的操作有:
- 恢復上層方法的局部變量表和操作數棧
- 把返回值(如果有的話)壓入調用者棧幀的操作數棧中
- 調整 PC 計數器的值以指向方法調用指令后面的一條指令等。
8.3 方法調用
- 方法調用并不等同于方法執行,方法調用階段唯一的任務就是確定被調用方法的版本(即調用哪一個方法),暫時還不涉及方法內部的具體運行過程。
- 在程序運行時,進行方法調用是最普遍、最頻繁的操作,但前面已經講過,Class文件的編譯過程中不包含傳統編譯中的連接步驟,一切方法調用在Class文件里面存儲的都只是符號引用,而不是方法在實際運行時內存布局中的入口地址(相當于之前說的直接引用)。
8.3.1 解析
- 所有方法調用中的目標方法在Class文件里面都是一個常量池中的符號引用,在類加載的解析階段,會將其中的一部分符號引用轉化為直接引用,這種解析能成立的前提是:方法在程序真正運行之前就有一個可確定的調用版本,并且這個方法的調用版本在運行期是不可改變的。換句話說,調用目標在程序代碼寫好、編譯器進行編譯時就必須確定下來。這類方法的調用稱為解析(Resolution)。
- 在 Java 語言中符合 “編譯期可知,運行期不可變” 這個要求的方法,主要包括靜態方法和私有方法兩大類,前者與類型直接關聯,后者在外部不可被訪問。
- 只要能被 invokestatic 和 invokespecial 指令調用的方法,都可以在解析階段中確定唯一的調用版本,符合這個條件的有靜態方法、私有方法、實例構造器、父類方法 4類,它們在類加載的時候就會把符號引用解析為該方法的直接引用。這些方法可以稱為非虛方法,與之相反,其他方法稱為虛方法(除去 final 方法)
- 雖然 final 方法是使用 invokevirtual 指令來調用的,但是由于它無法被覆蓋,沒有其他版本,所以也無須對方法接收者進行多態選擇,又或者說多態選擇的結果肯定是唯一的。
- 解析調用一定是個靜態的過程,在編譯期間就完全確定,在類裝載的解析階段就會把涉及的符號引用全部轉變為可確定的直接引用,不會延遲到運行期再去完成。
- 而分派(Dispatch)調用則可能是靜態的也可能是動態的,根據分派依據的宗量數可分為單分派和多分派。這兩類分派方式的兩兩組合就構成了靜態單分派、靜態多分派、動態單分派、動態多分派4種分派組合情況。
8.3.2 分派
8.3.2.1 靜態分派
public class StaticDispatch
{
static abstract class Human
{
}
static class Man extends Human
{
}
static class Woman extends Human
{
}
public void sayHello(Human guy)
{
System.out.println("hello,guy!");
}
public void sayHello(Man guy)
{
System.out.println("hello,gentleman!");
}
public void sayHello(Woman guy)
{
System.out.println("hello,lady!");
}
public static void main(String[] args)
{
Human man = new Man();
Human woman = new Woman();
StaticDispatch sr = new StaticDispatch();
sr.sayHello((Man) man);
sr.sayHello((Woman) woman);
}
}
- 上面代碼中的 “Human” 稱為變量的靜態類型(Static Type),或者叫做外觀類型(Apparent Type),后面的 “Man” 則稱為變量的實際類型(ActualType)
- 靜態類型和實際類型在程序中都可以發生一些變化,區別是靜態類型的變化僅僅在使用時發生,變量本身的靜態類型不會被改變,并且最終的靜態類型是在編譯期可知的
- 而實際類型變化的結果在運行期才可確定,編譯器在編譯程序的時候并不知道一個對象的實際類型是什么。
-
main()
里面的兩次sayHello()
方法調用,在方法接收者已經確定是對象 “sr” 的前提下,使用哪個重載版本,就完全取決于傳入參數的數量和數據類型。代碼中刻意地定義了兩個靜態類型相同但實際類型不同的變量,但虛擬機(準確地說是編譯器)在重載時是通過參數的靜態類型而不是實際類型作為判定依據的。 - 因此,在編譯階段,Javac 編譯器會根據參數的靜態類型決定使用哪個重載版本,所以選擇了
sayHello (Human)
作為調用目標,并把這個方法的符號引用寫到main()
方法里的兩條 invokevirtual 指令的參數中。 - 所有依賴靜態類型來定位方法執行版本的分派動作稱為靜態分派。靜態分派的典型應用是方法重載。靜態分派發生在編譯階段,因此確定靜態分派的動作實際上不是由虛擬機來執行的。
- 另外,編譯器雖然能確定出方法的重載版本,但在很多情況下這個重載版本并不是 “唯一的” ,往往只能確定一個 “更加合適的” 版本。這種模糊的結論在由0和1構成的計算機世界中算是比較 “稀罕” 的事情,產生這種模糊結論的主要原因是字面量不需要定義,所以字面量沒有顯式的靜態類型,它的靜態類型只能通過語言上的規則去理解和推斷。
8.3.2.2 動態分派
public class DynamicDispatch
{
static abstract class Human
{
protected abstract void sayHello()
}
static class Man extends Human
{
@Override
protected void sayHello()
{
System.out.println("man say hello");
}
}
static class Woman extends Human
{
@Override
protected void sayHello()
{
System.out.println("woman say hello");
}
}
public static void main(String args[])
{
Human man = new Man();
Human woman = new Woman();
man.sayHello();
woman.sayHello();
man = new Woman();
man.sayHello();
}
}
- 顯然這里不可能再根據靜態類型來決定,因為靜態類型同樣都是Human的兩個變量man和woman在調用
sayHello()
方法時執行了不同的行為,并且變量 man 在兩次調用中執行了不同的方法。 - 導致這個現象的原因很明顯,是這兩個變量的實際類型不同。
- 原因要從 invokevirtual 指令的多態查找過程開始說起,invokevirtual指令的運行時解析過程大致分為以下幾個步驟:
- 找到操作數棧頂的第一個元素所指向的對象的實際類型,記作 C。
- 如果在類型 C 中找到與常量中的描述符和簡單名稱都相符的方法,則進行訪問權限校驗,如果通過則返回這個方法的直接引用,查找過程結束;如果不通過,則返回 java.lang.IlegalAccessError 異常。
- 否則,按照繼承關系從下往上依次對 C 的各個父類進行第 2 步的搜索和驗證過程。
- 如果始終沒有找到合適的方法,則拋出 java.lang.AbstractMethodError 異常。
- 由于invokevirtual 指令執行的第一步就是在運行期確定接收者的實際類型,所以兩次調用中的invokevirtual指令把常量池中的類方法符號引用解析到了不同的直接引用上,這個過程就是Java語言中方法重寫的本質。
8.3.2.3 單分派與多分派
- 方法的接收者與方法的參數統稱為方法的宗量,根據分派基于多少種宗量,可以將分派劃分為單分派和多分派兩種。
- 單分派是根據一個宗量對目標方法進行選擇,多分派則是根據多于一個宗量對目標方法進行選擇。
public class Dispatch
{
static class QQ {}
static class _360 {}
public static class Father
{
public void hardChoice(QQ arg)
{
System.out.printin("father choose qq");
}
public void hardchoice(_360 arg)
{
System.out.print1n("father choose 360");
}
}
public static class Son extends Father
{
public void hardChoice(QQ arg)
{
System.out.printin("son choose qq");
}
public void hardchoice(_360 arg)
{
System.out.print1n("son choose 360");
}
}
public static void main(String args[])
{
Father father = new Father();
Father son = new Son();
father.hardChoice(new _360());
son.hardChoice(new QQ());
}
}
-
我們來看看編譯階段編譯器的選擇過程,也就是靜態分派的過程。這時選擇目標方法的依據有兩點:
- 一是靜態類型是Father還是Son,
- 二是方法參數是 QQ 還是 360。
這次選擇結果的最終產物是產生了兩條 invokevirtual 指令,兩條指令的參數分別為常量池中指向
Father.hardChoice(360)
及Father.hardChoice(QQ)
方法的符號引用。因為是根據兩個宗量進行選擇,所以 Java 語言的靜態分派屬于多分派類型。-
再看看運行階段虛擬機的選擇,也就是動態分派的過程:
- 在執行
som.hardChoice (new QQ)
這句代碼時,更準確地說,是在執行這句代碼所對應的 invokevirtual 指令時,由于編譯期已經決定目標方法的簽名必須為hardChoice(QQ)
,因此這時參數的靜態類型、實際類型都對方法的選擇不會構成任何影響。 - 唯一可以影響虛擬機選擇的因素只有此方法的接受者的實際類型是 Father 還是 Son。因為只有一個宗量作為選擇依據,所以 Java 語言的動態分派屬于單分派類型。
- 在執行
根據上述論證的結果,我們可以總結一句:今天的 Java 語言是一門靜態多分派、動態單分派的語言。
8.3.2.4 虛擬機動態分派的實現
- 由于動態分派是非常頻繁的動作,而且動態分派的方法版本選擇過程需要運行時在類的方法元數據中搜索合適的目標方法,因此在虛擬機的實際實現中基于性能的考慮,大部分實現都不會真正地進行如此頻繁的搜索。
- 面對這種情況,最常用的 “穩定優化” 手段就是為類在方法區中建立一個虛方法表(Vritual Method Table,也稱為 vtable,與此對應的,在 invokeinterface 執行時也會用到接口方法表——Inteface Method Table,簡稱 itable),使用虛方法表索引來代替元數據查找以提高性能。
方法表結構
-
虛方法表中存放著各個方法的實際入口地址。
- 如果某個方法在子類中沒有被重寫,那子類的虛方法表里面的地址入口和父類相同方法的地址入口是一致的,都指向父類的實現入口。
- 如果子類中重寫了這個方法,子類方法表中的地址將會替換為指向子類實現版本的入口地址。
方法表一般在類加載的連接階段進行初始化,準備了類的變量初始值后,虛擬機會把該類的方法表也初始化完畢。
方法表是分派調用的 “穩定優化” 手段,虛擬機除了使用方法表之外,在條件允許的情況下,還會使用內聯緩存(Inline Cache)和基于 “類型繼承關系分析”(Class Hierarchy Analysis,CHA)技術的守護內聯(Guarded Inlining)兩種非穩定的 “激進優化” 手段來獲得更高的性能。
8.4 基于棧的字節碼解釋執行引擎
8.4.1 解釋執行
- 大部分的程序代碼到物理機的目標代碼或虛擬機能執行的指令集之前,都需要經過下圖的各個步驟。圖中下面那條分支,就是傳統編譯原理中程序代碼到目標機器代碼的生成過程,而中間的那條分支,自然就是解釋執行的過程。(綠色代表可選項)
編譯過程
-
如今,基于物理機、Java虛擬機,或者非Java的其他高級語言虛擬機(HLLVM)的語言,大多都會遵循這種基于現代經典編譯原理的思路:
- 在執行前先對程序源碼進行詞法分析和語法分析處理,把源碼轉化為抽象語法樹(Abstract Syntax Tree,AST)
- 對于一門具體語言的實現來說,詞法分析、語法分析以至后面的優化器和目標代碼生成器都可以選擇獨立于執行引擎,形成一個完整意義的編譯器去實現,這類代表是C/C++語言。
- 也可以選擇把其中一部分步驟(如生成抽象語法樹之前的步驟)實現為一個半獨立的編譯器,這類代表是Java語言。
- 又或者把這些步驟和執行引擎全部集中封裝在一個封閉的黑匣子之中,如大多數的 JavaScript 執行器。
Java 語言中,Javac 編譯器完成了程序代碼經過詞法分析、語法分析到抽象語法樹,再遍歷語法樹生成線性的字節碼指令流的過程。因為這一部分動作是在 Java 虛擬機之外進行的,而解釋器在虛擬機的內部,所以 Java 程序的編譯就是半獨立的實現。
8.4.2 基于棧的指令集與基于寄存器的指令集
- Java 編譯器輸出的指令流,基本上是一種基于棧的指令集架構(Instruction Set Architecture,ISA),指令流中的指令大部分都是零地址指令,它們依賴操作數棧進行工作。
- 與之相對的另外一套常用的指令集架構是基于寄存器的指令集,最典型的就是 x86 的二地址指令集,說得通俗一些,就是現在我們主流PC機中直接支持的指令集架構,這些指令依賴寄存器進行工作。
- 基于棧的指令集主要的優點
- 可移植。因為寄存器由硬件直接提供,程序直接依賴這些硬件寄存器則不可避免地要受到硬件的約束。如果使用棧架構的指令集,用戶程序不會直接使用這些寄存器,就可以由虛擬機實現來自行決定把一些訪問最頻繁的數據(程序計數器、棧頂緩存等)放到寄存器中以獲取盡量好的性能,這樣實現起來也更加簡單一些。
- 代碼相對更加緊湊(字節碼中每個字節就對應一條指令,而多地址指令集中還需要存放參數)
- 編譯器實現更加簡單(不需要考慮空間分配的問題,所需空間都在棧上操作)等。
- 棧架構指令集的主要缺點是執行速度相對來說會稍慢一些。所有主流物理機的指令集都是寄存器架構也從側面印證了這一點。
- 雖然棧架構指令集的代碼非常緊湊,但是完成相同功能所需的指令數量一般會比寄存器架構多,因為出棧、入棧操作本身就產生了相當多的指令數量。更重要的是,棧實現在內存之中,頻繁的棧訪問也就意味著頻繁的內存訪問,相對于處理器來說,內存始終是執行速度的瓶頸。盡管虛擬機可以采取棧頂緩存的手段,把最常用的操作映射到寄存器中避免直接內存訪問,但這也只能是優化措施而不是解決本質問題的方法。