什么是JVM
JVM是Java Virtual Machine(Java虛擬機)的縮寫,是一個虛構出來的計算機,它屏蔽了與具體操作系統平臺相關的信息,使得Java程序只需生成在Java虛擬機上運行的目標代碼(字節碼,ByteCode), 就可以在多種平臺上不加修改地運行。這背后其實就是JVM把字節碼翻譯成具體平臺上的機器指令,從而實現“一次編寫,到處運行(Write Once, Run Anywhere)”。
Java為什么能夠跨平臺?
Java引入了字節碼的概念,jvm 只能認識字節碼,并將它們解釋到系統的API調用。針對不同的系統有不同的jvm實現,有 Linux 版本的 jvm 實現,也有 Windows 版本的 jvm 實現,但是同一段代碼在編譯后的字節碼是一樣的。在不同的系統平臺上運行是通過JAVA解釋器將字節碼解釋為不同平臺的機器碼,在不同的 jvm 實現上會映射到不同系統的 API 調用,從而實現代碼的不加修改即可跨平臺運行。
JVM、JRE、JDK的關系
- JRE(Java Runtime Environment,Java運行環境),面向Java程序的使用者,而不是開發者。JRE是運行Java程序所必須環境的集合,包含JVM標準實現及 Java核心類庫。它包括Java虛擬機、Java平臺核心類和支持文件
- JDK(Java Development Kit,Java開發工具包),包括了Java運行環境(JRE),并提供了一堆Java工具tools.jar和Java標準類庫 (rt.jar)
三者的關系是:JDK>JRE>JVM
java虛擬機運行原理
按照階段分為兩個階段:
編譯階段:當我們將一個.java的文件進行編譯,編譯程序會生成一個相同名字而后綴為.class的文件。
運行階段主要分為以下步驟:
-
加載
- 通過一個類的全限定名來獲取該類的二進制字節流
- 將這個字節流的靜態存儲結構轉化為方法區運行時數據結構
- 在內存堆中生成一個代表該類的java.lang.Class對象,作為該類數據的訪問入口
-
驗證
驗證、準備、解析這三步可以看做是一個連接的過程,將類的字節碼連接到JVM的運行狀態之中
驗證是為了確保Class文件的字節流中包含的信息符合當前虛擬機的要求,不會威脅到jvm的安全,主要包括以下幾個方面的驗證:- 文件格式的驗證,驗證字節流是否符合Class文件的規范,是否能被當前版本的虛擬機處理
- 元數據驗證,對字節碼描述的信息進行語義分析,確保符合java語言規范
- 字節碼驗證 通過數據流和控制流分析,確定語義是合法的,符合邏輯的
- 符號引用驗證 這個校驗在解析階段發生
-
準備
為類的靜態變量分配內存,初始化為系統的初始值。對于final static修飾的變量,直接賦值為用戶的定義值。如下面的例子:這里在準備階段過后的初始值為0,而不是7public static int a=7
-
解析
解析是將常量池內的符號引用轉為直接引用(如物理內存地址指針)
-
初始化
到了初始化階段,jvm才真正開始執行類中定義的java代碼
1)初始化階段是執行類構造器<clinit>()方法的過程。類構造器<clinit>()方法是由編譯器自動收集類中的所有類變量的賦值動作和靜態語句塊(static塊)中的語句合并產生的。
2)當初始化一個類的時候,如果發現其父類還沒有進行過初始化、則需要先觸發其父類的初始化。
3)虛擬機會保證一個類的<clinit>()方法在多線程環境中被正確加鎖和同步。
JVM內存分區
-
程序計數器
程序計數器(Progarm Counter Register)是一塊較小的內存空間,它可以看作是當前線程所執行的字節碼行號指示器。在JVM中,通過程序計數器來記錄某個線程的字節碼執行位置,或者說記錄下一條要運行的指令。程序計數器是具備線程隔離的特性,也就是說,每個線程工作時都有屬于自己的獨立計數器,互不影響,是一塊線程私有的內存空間。
如果當前正在執行的是一個java方法,程序計數器會記錄正在執行的java字節碼地址;如果正在執行的是native方法,則程序計數器為空。 -
Java虛擬機棧
java虛擬機棧是線程私有的內存空間,它用來保存方法的局部變量、部分結果,并參與方法的調用和返回。
棧幀結構.png虛擬機棧在運營師采用棧幀來保存數據,棧幀中主要有局部變量表、操作數棧、動態鏈接地址、返回地址等信息。每一個方法的調用都伴隨著棧幀的入棧操作,相應的,方法的返回則對應著棧幀的出戰操作。
和java棧相關的兩個異常:
- StackOverFlowError
在線程的計算過程中,如果請求的棧的深度大于最大可用的棧深度,則拋出改異常。
- OutOfMemoryError
如果java的棧可以擴展,在程序運行過程中,沒有足夠的內存來支撐程序的擴展,則拋出該異常。
- StackOverFlowError
本地方法棧
本地方法棧和java虛擬機棧功能類似,本地方法棧主要管理本地方法棧的調用,一般是指有C實現的。和java虛擬機棧一樣會拋出StackOverFlowError和OutOfMemoryError異常-
方法區
方法區是java內存區域中比較重要的一部分,主要保存的信息是元數據。其中最為重要的是類的類型信息、常量池、域信息、方法信息。
-
Java堆
Java堆可以說是Java運行時內存中最為重要的一部分,幾乎所有的對象和數據都是在堆中分配空間的。Java堆分為新生代和老年代兩個部分,新生代用于存放剛剛產生的對象,如果對象一直沒有被回收,生存的足夠長,老年對象就會被移入老年代。
新生代又可以細分為eden、surivor space0(s0或者from space)和surivor space1(s1或者To space)。eden存放剛剛創建的對象,s0和s1存放的對象至少經歷了一次垃圾回收,等幸存下來。如果幸存去的對象到了指定年齡仍未被回收,就會進入老年代。
持久代:Permanent Generation。在Sun的JVM中就是方法區的意思,盡管有些JVM大多沒有這一代。主要存放常量及類的一些信息默認最小值為16MB,最大值為64MB
堆內存結構.jpg
垃圾收集算法
-
Mark-Sweep(標記-清除)算法
分為“標記”和“清除”兩個階段:首先標記出所有需要回收的對象,在標記完成后統一回收所有被標記的對象。
標記清除算法.png- 缺點:空間問題,標記清除之后會產生大量不連續的內存碎片,空間碎片太多可能會導致以后在程序運行過程中需要分配較大對象時,無法找到足夠的連續內存而不得不提前觸發另一次垃圾收集動作;
- 優點:簡單快速
-
Copying(復制)算法
復制算法.png它將可用內存按容量劃分為大小相等的兩塊,每次只使用其中的一塊。當這一塊的內存用完了,就將還存活著的對象復制到另外一塊上面,然后再把已使用過的內存空間一次清理掉。
- 缺點:內存使用率只有一半
- 優點:不會產生碎片
-
Mark-Compact(標記-整理)算法
標記過程仍然與“標記-清除”算法一樣,但后續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,然后直接清理掉端邊界以外的內存,
標記整理算法.png 分代收集算法
當前商業虛擬機的垃圾收集都采用“分代收集”(Generational Collection)算法,根據對象存活周期的不同將內存劃分為幾塊并采用不用的垃圾收集算法。
一般是把 Java 堆分為新生代和老年代,這樣就可以根據各個年代的特點采用最適當的收集算法。在新生代中,每次垃圾收集時都發現有大批對象死去,只有少量存活,那就選用復制算法,只需要付出少量存活對象的復制成本就可以完成收集。而老年代中因為對象存活率高、沒有額外空間對它進行分配擔保,就必須使用“標記—清理”或者“標記—整理”算法來進行回收。
垃圾收集器
-
Serial收集器
串行收集器.png
新生代收集器,使用停止復制算法,使用一個線程進行GC,串行,其它工作線程暫停。
-
ParNew收集器
ParNew收集器.png新生代收集器,使用停止復制算法,Serial收集器的多線程版,用多個線程進行GC,并行,其它工作線程暫停,關注縮短垃圾收集時間。
Parallel Scavenge 收集器
新生代收集器,使用停止復制算法,關注CPU吞吐量,即運行用戶代碼的時間/總時間,比如:JVM運行100分鐘,其中運行用戶代碼99分鐘,垃 圾收集1分鐘,則吞吐量是99%,這種收集器能最高效率的利用CPU,適合運行后臺運算(關注縮短垃圾收集時間的收集器,如CMS,等待時間很少,所以適 合用戶交互,提高用戶體驗)。-
Serial Old收集器
serial old.png
老年代收集器,單線程收集器,串行,使用標記整理(整理的方法是Sweep(清理)和Compact(壓縮),清理是將廢棄的對象干掉,只留幸存的對象,壓縮是將移動對象,將空間填滿保證內存分為2塊,一塊全是對象,一塊空閑)算法,使用單線程進行GC,其它工作線程暫停(注意,在老年代中進行標記整理算法清理,也需要暫停其它線程),在JDK1.5之前,Serial Old收集器與ParallelScavenge搭配使用。
-
Parallel Old收集器
Parallel Old收集器.png老年代收集器,多線程,并行,多線程機制與Parallel Scavenge差不錯,使用標記整理(與Serial Old不同,這里的整理是Summary(匯總)和Compact(壓縮),匯總的意思就是將幸存的對象復制到預先準備好的區域,而不是像Sweep(清理)那樣清理廢棄的對象)算法,在Parallel Old執行時,仍然需要暫停其它線程。Parallel Old在多核計算中很有用。Parallel Old出現后(JDK 1.6),與Parallel Scavenge配合有很好的效果,充分體現Parallel Scavenge收集器吞吐量優先的效果。
-
cms(concurrent mark sweep)收集器
CMS收集器.png老年代收集器,致力于獲取最短回收停頓時間(即縮短垃圾回收的時間),使用標記清除算法,多線程,優點是并發收集(用戶線程可以和GC線程同時工作),停頓小。使用-XX:+UseConcMarkSweepGC進行ParNew+CMS+Serial Old進行內存回收,優先使用ParNew+CMS(原因見后面),當用戶線程內存不足時,采用備用方案Serial Old收集。
-
G1收集器
G1收集器.png初始標記階段僅僅只是標記一下 GC Roots 能直接關聯到的對象,并且修改 TAMS(Next Top at Mark Start)的值,讓下一階段用戶程序并發運行時,能在正確可用的 Region 中創建新對象,這階段需要停頓線程,但耗時很短。
并發標記階段是從 GC Root 開始對堆中對象進行可達性分析,找出存活的對象,這階段耗時較長,但可與用戶程序并發執行。
而最終標記階段則是為了修正在并發標記期間因用戶程序繼續運作而導致標記產生變動的那一部分標記記錄,虛擬機將這段時間對象變化記錄在線程 Remembered Set Logs 里面,最終標記階段需要把 Remembered Set Logs 的數據合并到 Remembered Set 中,這階段需要停頓線程,但是可并行執行。
最后在篩選回收階段首先對各個 Region 的回收價值和成本進行排序,根據用戶所期望的 GC 停頓時間來制定回收計劃,從Sun公司透露出來的信息來看,這個階段其實也可以做到與用戶程序一起并發執行,但是因為只回收一部分 Region,時間是用戶可控制的,而且停頓用戶線程將大幅提高收集效率。通過下圖可以比較清楚地看到G1收集器的運作步驟中并發和需要停頓的階段。