Java類的加載、鏈接和初始化

深度分析Java的ClassLoader機制(源碼級別)中,我們學習了Java的CLassLoader機制,那么,JVM將Java類加載完之后,也就是將二進制代碼轉(zhuǎn)換成java.lang.Class對象之后又做了哪些操作?

一、Java的類加載機制回顧與總結(jié)

我們知道一個Java類要想運行,必須由jvm將其裝載到內(nèi)存中才能運行,裝載的目的就是把Java字節(jié)代碼轉(zhuǎn)換成JVM中的java.lang.Class類的對象。這樣Java就可以對該對象進行一系列操作,裝載過程有兩個比較重要的特征:層次組織結(jié)構(gòu)和代理模式。層次組織結(jié)構(gòu)指的是每個類加載器都有一個父類加載器,通過getParent()方法可以獲取到。類加載器通過這種父親-后代的方式組織在一起,形成樹狀層次結(jié)構(gòu)。代理模式則指的是一個類加載器既可以自己完成Java類的定義工作,也可以代理給其他類加載器來完成。由于代理模式的存在,啟動一個類的加載過程的類加載器和最終定義這個類的類加載器可能并不是一個。ClassLoader的加載類過程主要使用loadClass方法,該方法中封裝了加載機制:雙親委派模式。

一般來說,父類優(yōu)先的策略就足夠好了。在某些情況下,可能需要采取相反的策略,即先嘗試自己加載,找不到的時候再代理給父類加載器。這種做法在Java的Web容器中比較常見,也是Servlet規(guī)范推薦的做法。比如,Apache Tomcat為每個Web應用都提供一個獨立的類加載器,使用的就是自己優(yōu)先加載的策略。IBM WebSphere Application Server則允許Web應用選擇類加載器使用的策略。
類加載器的一個重要用途是在JVM中為相同名稱的Java類創(chuàng)建隔離空間。在JVM中,判斷兩個類是否相同,不僅是根據(jù)該類的二進制名稱,還需要根據(jù)兩個類的定義類加載器。只有兩者完全一樣,才認為兩個類的是相同的。因此,即便是同樣的Java字節(jié)代碼,被兩個不同的類加載器定義之后,所得到的Java類也是不同的。如果試圖在兩個類的對象之間進行賦值操作,會拋出java.lang.ClassCastException。這個特性為同樣名稱的Java類在JVM中共存創(chuàng)造了條件。在實際的應用中,可能會要求同一名稱的Java類的不同版本在JVM中可以同時存在。通過類加載器就可以滿足這種需求。這種技術在OSGI中得到了廣泛的應用。

Java類的加載過程:

1.通過類的全名產(chǎn)生對應類的二進制數(shù)據(jù)流。(如果沒找到對應類文件,只有在類實際使用時才拋出錯誤。)
2.分析并將這些二進制數(shù)據(jù)流轉(zhuǎn)換為方法區(qū)(JVM 的架構(gòu):方法區(qū)、堆,棧,本地方法棧,pc 寄存器)特定的數(shù)據(jù)結(jié)構(gòu)(這些數(shù)據(jù)結(jié)構(gòu)是實現(xiàn)有關的,不同 JVM 有不同實現(xiàn))。這里處理了部分檢驗,比如類文件的魔數(shù)的驗證,檢查文件是否過長或者過短,確定是否有父類(除了 Obecjt 類)。
3.創(chuàng)建對應類的 java.lang.Class 實例(注意,有了對應的 Class 實例,并不意味著這個類已經(jīng)完成了加載鏈鏈接!)。

二、Java類的鏈接

Java類的鏈接指的是將Java類的二進制代碼合并到JVM的運行狀態(tài)之中的過程。在鏈接之前,這個類必須被成功加載。
鏈接的過程比加載過程要復雜很多,這是實現(xiàn)java的動態(tài)性的重要一步!分為三部分:verification(檢測),preparation(準備)和resolution(解析)。

1.verification(檢測):

驗證是用來確保Java類的二進制表示在結(jié)構(gòu)上是完全正確的。如果驗證過程出現(xiàn)錯誤的話,會拋出java.lang.VerifyError錯誤。
linking的resolve會把類中成員方法、成員變量、類和接口的符號引用替換為直接引用,而在這之前,需要檢測被引用的類型正確性和接入屬性是否正確(就是public ,private的問題)諸如,檢查final class沒有被繼承,檢查靜態(tài)變量的正確性等等。

2.preparation(準備):

準備過程則是創(chuàng)建Java類中的靜態(tài)域,并將這些域的值設為默認值。準備過程并不會執(zhí)行代碼。在一個Java類中會包含對其它類或接口的形式引用,包括它的父類、所實現(xiàn)的接口、方法的形式參數(shù)和返回值的Java類等。

對類的成員變量分配空間。雖然有初始值,但這個時候不會對他們進行初始化(因為這里不會執(zhí)行任何 Java 代碼)。具體如下:所有原始類型的值都為 0。如 float: 0f, int: 0, boolean: 0(注意 boolean 底層實現(xiàn)大多使用 int),引用類型則為 null。值得注意的是,JVM 可能會在這個時期給一些有助于程序運行效率提高的數(shù)據(jù)結(jié)構(gòu)分配空間。

3.resolution(解析):

解析的過程就是確保這些被引用的類能被正確的找到。解析的過程可能會導致其它的Java類被加載。

為類、接口、方法、成員變量的符號引用定位直接引用(如果符號引用先到常量池中尋找符號,再找相應的類型,無疑會耗費更多時間),完成內(nèi)存結(jié)構(gòu)的布局。
這一步是可選的。可以在符號引用第一次被使用時完成,即所謂的延遲解析(late resolution)。但對用戶而言,這一步永遠是延遲解析的,即使運行時會執(zhí)行early resolution,但程序不會顯示的在第一次判斷出錯誤時拋出錯誤,而會在對應的類第一次主動使用的時候拋出錯誤!

另外,這一步與之后的類初始化是不沖突的,并非一定要所有的解析結(jié)束以后才執(zhí)行類的初始化。不同的JVM實現(xiàn)不同。
看下面一段代碼:

public class LinkTest {   
   public static void main(String[] args) {       
      ToBeLinked toBeLinked = null;       
      System.out.println("Test link.");   
   }
}

類 LinkTest引用了類ToBeLinked,但是并沒有真正使用它,只是聲明了一個變量,并沒有創(chuàng)建該類的實例或是訪問其中的靜態(tài)域。如果把編譯好的ToBeLinked的Java字節(jié)代碼刪除之后,再運行LinkTest,程序不會拋出錯誤。這是因為ToBeLinked類沒有被真正用到。鏈接策略使得ToBeLinked類不會被加載,因此也不會發(fā)現(xiàn)ToBeLinked的Java字節(jié)代碼實際上是不存在的。如果把代碼改成ToBeLinked toBeLinked = new ToBeLinked();之后,再按照相同的方法運行,就會拋出異常了。因為這個時候ToBeLinked這個類被真正使用到了,會需要加載這個類。

三、Java類的初始化

開發(fā) Java 時,接觸最多的是對象的初始化。實際上類也是有初始化的。相比對象初始化,類的初始化機制要簡單不少。

類的初始化也是延遲的,直到類第一次被主動使用(active use),JVM才會初始化類。

當一個Java類第一次被真正使用到的時候,JVM會進行該類的初始化操作。初始化過程的主要操作是執(zhí)行靜態(tài)代碼塊和初始化靜態(tài)域。在一個類被初始化之前,它的直接父類也需要被初始化。但是,一個接口的初始化,不會引起其父接口的初始化。在初始化的時候,會按照源代碼中從上到下的順序依次執(zhí)行靜態(tài)代碼塊和初始化靜態(tài)域。

public class StaticTest {   
   public static int X = 10;   
   public static void main(String[] args) {       
      System.out.println(Y); //輸出60   
   }   
   static {       
      X = 30;   
   }  
   public static int Y = X * 2;
}

在上面的代碼中,在初始化的時候,靜態(tài)域的初始化和靜態(tài)代碼塊的執(zhí)行會從上到下依次執(zhí)行。因此變量X的值首先初始化成10,后來又被賦值成30;而變量Y的值則被初始化成60。
類的初始化分兩步:

1.如果基類沒有被初始化,初始化基類。
2.有類構(gòu)造函數(shù),則執(zhí)行類構(gòu)造函數(shù)。

類構(gòu)造函數(shù)是由 Java 編譯器完成的。它把類成員變量的初始化和static區(qū)間的代碼提取出,放到一個<clinit>方法中。這個方法不能被一般的方法訪問(注意,static final 成員變量不會在此執(zhí)行初始化,它一般被編譯器生成 constant 值)。同時,<clinit>中是不會顯示的調(diào)用基類的<clinit>的,因為1中已經(jīng)執(zhí)行了基類的初始化。該初始化過程是由 JVM保證線程安全的。

Java類和接口的初始化只有在特定的時機才會發(fā)生,這些時機包括:

創(chuàng)建一個Java類的實例。如
MyClass obj = new MyClass()

調(diào)用一個Java類中的靜態(tài)方法。如
MyClass.sayHello()

給Java類或接口中聲明的靜態(tài)域賦值。如
MyClass.value = 10

訪問Java類或接口中聲明的靜態(tài)域,并且該域不是常值變量。如
int value = MyClass.value

在頂層Java類中執(zhí)行assert語句。

通過Java反射API也可能造成類和接口的初始化。需要注意的是,當訪問一個Java類或接口中的靜態(tài)域的時候,只有真正聲明這個域的類或接口才會被初始化。考慮下面的代碼:

class B {   
   static int value = 100;   
   static {       
      System.out.println("Class B is initialized."); //輸出   
   }
}
class A extends B {   
   static {       
      System.out.println("Class A is initialized."); //不會輸出   
   }
}
public class InitTest {   
   public static void main(String[] args) {       
      System.out.println(A.value); //輸出100   
   }
}

在上述代碼中,類InitTest通過A.value引用了類B中聲明的靜態(tài)域value。由于value是在類B中聲明的,只有類B會被初始化,而類A則不會被初始化。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內(nèi)容