原文地址[http://blog.csdn.net/ns_code/article/details/17881581]
類加載的過程
類從被加載到虛擬機內存中開始,到卸載出內存為止,它的整個生命周期包括:加載→驗證→準備→解析→初始化→使用→卸載
其中類加載的過程包括了加載、驗證、準備、解析、初始化
五個階段。在這五個階段中,加載、驗證、準備和初始化這四個階段發生的順序是確定的,而解析階段則不一定,它在某些情況下可以在初始化階段后開始,這是為了支持Java語言的運行時綁定(也叫動態綁定)。另外注意這里的幾個階段是按順序開始,而不是按順序進行或完成,因為這些階段通常都是互相交叉地混合進行的,通常在一個階段執行的過程中調用或激活另一個階段。
這里簡要說明下Java中的額綁定:綁定是指把一個方法的調用與方法所在的類(方法主體)關聯起來,對Java來說,綁定分為動態綁定和靜態綁定:
- 靜態綁定:即前期綁定。在程序執行前方法已被綁定,此時由編譯器或其他連接程序實現。針對Java,簡單的可以理解為程序編譯器的綁定。Java當中只有final,static,private和構造方法是前期綁定的。
- 動態綁定:即晚起綁定,也叫運行時綁定,在運行時根據具體對象的類型進行綁定。在Java中,幾乎所有的方法都是后期綁定的。
下面來詳細介紹類加載過程中每個階段所做的工作:
加載
加載是類加載過程的第一個階段,在加載階段,虛擬機需要完成下面三件事情:
- 通過一個類的全限定名來獲取其定義的二進制字節流。
- 將這個字節流所代表的靜態存儲結構轉化為方法區運行時數據結構。
- 在Java堆中生成一個代表這個類的java.lang.Class對象,作為對方法區中這些數據的訪問入口。
注意,這里第1條中的二進制字節流并不是單純的從Class文件中獲取,比如它還可以從Jar包中獲取、從網絡中獲取(最典型的應用是Applet),由其他文件生成(JSP應用)等。
相對于類加載的其他階段而言,加載階段(準確的說是加載階段獲取類的二進制字節流的動作)是可控性最強的階段,因為開發人員既可以使用系統提供的類加載器來完成加載,也可以自定義自己的類加載器來完成加載。
加載階段完成后,虛擬機外部的二進制字節流就按照虛擬機所需的格式存儲在方法區之中。而且在Java堆哄也創建了一個java.lang.class類的對象,這樣便可以通過該對象訪問方法區中的這些數據。
說到了類加載,就不得不提到類加載器,下面就具體介紹下類加載器
加載器
類加載器雖然只用于實現類的加載動作,但它在Java程序中起到的作用卻遠遠不限于類的加載階段。對于任意一個類,都需要由它的類加載器和這個類本身一同來確定這個類在Java虛擬機中的唯一性,也就是說,即使這兩個類來源同一個Class文件,只要加載他們的類加載器不同,那這兩個類就必定不相等。這里的“相等”包括類代表累的Class對象的equals(), isAssignableFrom(), isInstance()等方法的返回結果,也包括了使用instanceof關鍵字對對象所屬關系的判定結果。
在JVM的角度來說,只存在兩種不同的類加載器:
- 啟動類加載器:它使用C++實現(這里僅限于Hotspot,也就是JDK1.5以后的默認虛擬機,有很多其他的虛擬機是用Java語言實現的),是虛擬機的一部分。
- 所有其他的類加載器這些類加載器都是有Java語言實現,獨立于虛擬機之外,并且全部繼承自抽象類java.lang.ClassLoader,這些類加載器需要由啟動類加載器加載到內存中之后才能去加載其他的類。
站在開發者的角度來講,類加載器可以大致分為三類:
- 啟動類加載器:Bootstrap ClassLoader,與上面的相同,它復雜加載存放在JDK/jre/lib下,或者被
-Xbootclasspatch
參數指定的路徑中的,并且能被虛擬機識別的類庫(如rt.jar,所有java*開頭的類均被Bootstrap ClassLoader加載)。啟動類加載器是無法被Java程序直接飲用的。 - 擴展類加載器:Extension ClassLoader,該加載器由sun.misc.Launcher$ExtClassLoader實現,它負責加載JDK/jre/lib/ext目錄中,或者由java.ext.dirs系統變量指定的路徑中的所有類庫(如javax.*開頭的類),開發者可以直接使用擴展類加載器。
- 應用程序類加載器:Application ClassLoader,該加載器由sun.misc.Launcher$AppClassLoader來實現,它負責加載用戶類路徑(ClassPath)所指定的類,開發者可以直接使用該類加載器,如果應用程序中沒有自定義過自己的類加載器,一般情況下這個就是程序中磨人的加載器。
應用程序性都是由這三類加載器互相配合進行加載的,如果有必要,我們還可以加入自定義的類加載器。因為JVM自帶的ClassLoader只是懂得從本地文件系統加載標準的java class文件,如果編寫了自己的ClassLoader,可以做到如下幾點:
1)在執行非置信代碼之前,自動驗證數字簽名
2)動態地創建符合用戶特定需要的定制化構建類
3)從特定的場景取得java class,例如數據庫中和網絡中
事實上當使用Applet的時候,就用到了特定的ClassLoader,因為這時需要從網絡上加載java class,并且要檢查相關的安全信息,應用服務器也大都是用了自定義的ClassLoader技術。
這種層次關系成為類加載器的雙親委派模型。我們把每一層上面的類加載器叫做當前層類加載器的父加載器。但是,他們之間的斧子關系不是通過繼承來實現的,二十使用組合關系來復用父加載器中的代碼。該模型在JDK1.2期間被引入并且廣泛應用于之后的幾乎所有的Java程序中,但它并不是一個強制性約束模型,而是Java設計者們推薦給開發者的一種類加載器的實現方式。
雙親委派模式的工作流程是:如果一個類加載器收到了類加載的請求,它首先不會自己去嘗試加載這個類,而是把請求委托給父加載器去完成,依次想上,因此,所有類加載的請求最終都應該被傳遞到頂層的啟動類加載器中,只有當父加載器在它的搜索范圍中沒有找到所需的類時,子類加載器才會嘗試自己去加載該類。
使用雙親委派模型來組織類加載器回見的關系,有一個明顯的好處,就是Java類隨著它的類加載器(說白了,就是它所在的目錄)一起舉杯了一種帶有優先級的層次關系,這對于保證Java程序的穩定性運行很重要。例如,類java.lang.Objec類存放在JDK/jre/lib下的rt.jar中,因此無論是哪個類加載器要加載這個類,最終都會委派給啟動類加載器進行加載。這便保證了Object類在程序中的各種類加載器中都是同一個類。
驗證
驗證的目的是為了確保Class文件中的字節流包含的信息符合當前虛擬機的要求,而且不會危害虛擬機自身的安全。不同的虛擬機對類驗證的實現可能會有所不同,但大致都會完成以下四個階段的驗證:文件格式的驗證、元數據的驗證、字節碼驗證和符號引用驗證。
- 文件格式的驗證:驗證字節流是否符合Class文件格式的規范,并且能被當前版本的虛擬機處理,該驗證的主要目的是保證輸入的字節流能正確地解析并存儲與方法區之內。經過該階段的驗證后,字節流才會進入內存的方區中進行存儲,后面的三個驗證都是基于方法區的存儲結構進行的。
- 元數據驗證:對類的元數據信息進行語義校驗(其實就是對類中的各種數據類型進行語法校驗),保證不存在不符合Java語法規范的元數據信息。
- 字節碼驗證:該階段驗證主要工作是進行數據流和控制流分析,對類的方法體進行校驗分析,以保證被校驗的類的方法在運行時不會做出危害虛擬機安全的行為。
- 符號引用驗證:這是最后一個階段的驗證,它發生在虛擬機將符號引用轉化為直接引用的時候(解析階段中發生該轉化,后面會有講解),主要是對類自身以外的信息(常量池中的各種符號引用)進行匹配性的校驗。
準備
準備階段是正式為類變量分配內存并設置類變量初始值的階段,這些內存都將在方法區中分配。對于該階段有以下幾點需要注意:
- 這時候進行內存分配的僅包括類變量(static),而不包括實例變量,實例變量會在對象實例化時隨著對象一塊分配在Java堆中。
- 這里所設置的初始化值通常情況下是數據類型默認的0值(如0、0L、null、false等),而不是在Java代碼中被顯式賦予的值。
假設一個類變量的定義為:public static int value = 3
那么變量value在準備階段過后的初始化值為0,而不是3,因為這時候尚未開始執行任何Java方法,而把value賦值為3的putstatic指定是在程序編譯后,存放與類構造器<clinit>()方法之中的,所以把value賦值為3的動作將在初始化階段才會執行。
下表列出了Java中所有基本數據類型以及reference類型的默認零值。
數據類型 | 默認零值 |
---|---|
int | 0 |
long | 0L |
short | (short) 0 |
char | '\u0000' |
byte | (byte)0 |
boolean | false |
float | 0.0f |
double | 0.0d |
reference | null |
- 如果類型字段的字段屬性表中存在ConstantValue屬性,即同時被final和static修飾,那么在準備階段變量value就會初始化為ConstaltValue實行所指定的值。
假設上面的類變量value被定義為:public static final int value = 3;
編譯時Javac將會生成ConstantValue屬性,在準備階段虛擬機就會根據ConstantValue的設置將value賦值為3。我們可以理解為static final常量在編譯期就將其結果放入了調用它的類常量池中。
解析
解析階段是虛擬機將常量池中的符號引用轉化為直接引用的過程。
符號引用和直接引用的區別與關聯:
- 符號引用:符號引用以一組符號來描述所引用的目標,符號可以是任何形式的字面量,只要使用時能無歧義地定位到目標即可。符號引用與虛擬機實現的內存布局無關,引用的目標并不一定已經加載到了內存中。
- 直接引用:直接引用可以是直接指向目標的指針、相對偏移量或是一個能簡介定位到目標的句柄。直接引用是與虛擬機實現的內存布局相關的,同一個符號引用在不同虛擬機實現上翻譯出來的直接引用一般會不同。如果有了直接引用,那說明引用的目標必定已經在內存中了。
解析階段可能開始于初始化之前,也可能在初始化之后開始,虛擬機會根據需要來判斷,到底是在類被加載時就對常量池中的符號引用進行解析(初始化之前),還是等到一個符號引用將要被使用前才去解析它(初始化之后)。
對同一個符號引用進行多次解析請求是很常見的事情,虛擬機實現可能會對第一次解析的結果進行緩存(在運行時常量池中記錄直接引用,并把創兩標示為解析狀態),從而避免解析動作重復進行。
解析動作主要針對類或接口、字段、類方法、接口方法四類符號引用進行,分別對應于常量池中的CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info、CONSTANT_InterfaceMethodref_info
四種常量類型。
-
類或接口的解析:判斷所要轉化成直接引用是對數組類型,還是普通的對象類型的引用,從而進行不同的解析。
2.字段解析:對字段進行解析時,會先在奔雷中查找是否包含有簡單名稱和字段描述符都與目標相匹配的字段,如果有,則查找結束;如果沒有,則按照繼承關系從上往下遞歸搜索該類所實現的各個接口和他們的父接口,還沒有,則按照繼承關系從上往下遞歸搜索其父類,知道查找結束,查找流程如下圖所示:
20140105220608531.png
從下面一段代碼的執行結果中很容易看出來字段解析的搜索順序:
class Super{
public static int m = 11;
static{
System.out.println("執行了super類靜態語句塊");
}
}
class Father extends Super{
public static int m = 33;
static{
System.out.println("執行了父類靜態語句塊");
}
}
class Child extends Father{
static{
System.out.println("執行了子類靜態語句塊");
}
}
public class StaticTest{
public static void main(String[] args){
System.out.println(Child.m);
}
}
執行結果如下
執行了super類靜態語句塊
執行了父類靜態語句塊
33
如果注釋掉Father類中對m定義的那一行,則輸出結果如下:
執行了super類靜態語句塊
11
static變量發生在靜態解析階段,也即是初始化之前,此時已經將字段的符號引用轉換為了內存引用,也便將它與對應的類關聯在了一起,由于在子類中沒有查找到與m想匹配的字段,那么m便不會與子類關聯在一起,因此并不會觸發子類的初始化。
最后需要注意:理論上是按照上述順序進行搜索解析,但在實際應用中,虛擬機的編譯器可能要比上述規范要求的更嚴格一些。如果有一個同名字段同時出現在該類的接口和父類中,或同時在自己或父類的接口中出現,編譯器可能會拒絕編譯。
初始化
初始化是類加載過程的最后一步,到了這個階段,才真正開始執行類中定義的Java程序代碼。在準備階段,類變量已經被賦過一次系統要求的初始值,而在初始化階段,則是根據程序員通過程序制定的主管計劃去初始化變量和其他資源,或者可以從另一個角度來表達:初始化階段是執行類構造器<clinit>()方法的過程。
這里簡單說明下<clinit>()方法的執行規則:
-
<clinit>()
方法是由編譯器自動收集類中的所有類變量的賦值動作和靜態語句塊中的語句合并產生的,編譯器收集的順序是由語句在源文件中出現的順序決定的,靜態語句塊中只能訪問到定義在靜態語句塊之前的變量,定義在它之后的變量,在前面的靜態語句中可以賦值,但是不能訪問。 -
<clinit>()
方法與實例構造器<init>()
方法(類的構造函數)不同,它不需要顯式地調用父類構造器,虛擬機會保證在子類<clinit>()
方法執行之前,父類<clinit>()
方法已經執行完畢。因此,在虛擬機中第一個被執行的<clinit>()
方法的類肯定是java.lang.Object
- <clinit>()方法對于類或接口來說并不是必須的,如果一個類中沒有靜態語句塊,也沒有對類變量的賦值操作,那么編譯器可以不為這個類生成<clinit>()方法。
- 接口中不能使用靜態語句塊,但仍然有類變量(final static)初始化的賦值操作,因此接口與類一樣會生成<clinit>()方法。但是接口魚類不同的是:執行接口的<clinit>()方法不需要先執行父接口的<clinit>()方法,只有當父接口中定義的變量被使用時,父接口才會被初始化。另外,接口的實現類在初始化時也一樣不會執行接口的<clinit>()方法。
- 虛擬機會保證一個類的<clinit>()方法在多線程環境中被正確地加鎖和同步,如果多個線程同時去初始化一個類,那么只會有一個線程去執行這個類的<clinit>()方法,其他線程都需要阻塞等待,直到活動線程執行<clinit>()方法完畢。如果在一個類的<clinit>()方法中有耗時很長的操作,那就可能造成多個線程阻塞,在實際應用中這種阻塞往往是很隱蔽的。
下面給出一個簡單的例子,以便更清晰地說明如上規則:
class Father{
public static int a = 1;
static{
a = 2;
}
}
class Child extends Father{
public static int b = a;
}
public class ClinitTest{
public static void main(String[] args){
System.out.println(Child.b);
}
}
執行上面的代碼,會打印出2,也就是說b的值被賦為了2
我們來看得到該結果的步驟。首先在準備階段為類變量分配內存并設置類變量初始值,這樣A和B均被賦值為默認值0,而后再在調用<clinit>()方法時給他們賦予程序中指定的值。當我們調用Child.b時,觸發Child的<clinit>()方法,根據規則2,在此之前,要先執行完其父類Father的<clinit>()方法,又根據規則1,在執行<clinit>()方法時,需要按static語句或static變量賦值操作等在代碼中出現的順序來執行相關的static語句,因此當觸發執行Father的<clinit>()方法時,會先將a賦值為1,再執行static語句塊中語句,將a賦值為2,而后再執行Child類的<clinit>()方法,這樣便會將b的賦值為2.
如果我們顛倒一下Father類中“public static int a = 1;”語句和“static語句塊”的順序,程序執行后,則會打印出1。
很明顯是根據規則1,執行Father的<clinit>()
方法時,根據順序先執行了static語句塊中的內容,后執行了public static int a = 1;
語句。
另外,在顛倒二者的順序之后,如果在static語句塊中對a進行訪問(比如將a賦給某個變量),在編譯時將會報錯,因為根據規則1,它只能對a進行賦值,而不能訪問。
總結
整個類加載過程中,除了在加載階段用戶應用程序可以自定義類加載器參與之外,其余所有的動作完全由虛擬機主導和控制。到了初始化才開始執行類中定義的Java程序代碼(亦及字節碼),但這里的執行代碼只是個開端,它僅限于<clinit>()
方法。類加載過程中主要是將Class文件(準確地講,應該是類的二進制字節流)加載到虛擬機內存中,真正執行字節碼的操作,在加載完成后才真正開始。