說起jvm中的gc回收機制,我們首先要了解下jvm的內存結構。
一、jvm的內存結構如下圖
根據上圖我們可以清晰的看出jvm的內存結構,那么GC,是針對我們內存的垃圾回收機制,而對于內存中,需要經常進行GC的,就莫過于我們的heap(java堆),想要知道為什么堆是我們GC經常活動的場所呢?那么首先我們要知道堆是干什么的,有什么樣的特性。
二、堆
java的堆是我們java對象的活動空間,程序中我們new出的對象所分配的內存空間就存放在我們的堆中,那么當我們的對象不在被引用的時候,那么我們可以說這個對象在我們的內存中就變成了垃圾,需要垃圾回收器進行回收!
堆根據我們的GC需求分為三區域:
1.新域(eden):新域中的對象,經過一定次數的GC循環后(一般經過15次的GC循環后),被移入舊域;當對象在堆創建時,將進入年輕代的EdenSpace。垃圾回收器進行垃圾回收時,掃描Eden Space和A Suvivor Space,如果對象仍然存活,則復制到B SuvivorSpace,如果B Suvivor Space已經滿,則復制 Old Gen掃描A SuvivorSpace時,如果對象已經經過了幾次的掃描仍然存活,JVM認為其為一個Old對象,則將其移到Old Gen。掃描完畢后,JVM將EdenSpace和A Suvivor Space清空,然后交換A和B的角色(即下次垃圾回收時會掃描Eden Space和BSuvivorSpace。我們可以看到:Young Gen垃圾回收時,采用將存活對象復制到到空的SuvivorSpace的方式來確保不存在內存碎片,采用空間換時間的方式來加速內存垃圾回收。
2.舊域(old):年老代主要存放JVM認為比較old的對象(經過幾次的YoungGen的垃圾回收后仍然存在),內存大小相對會比較大,垃圾回收也相對沒有那么頻繁(譬如可能幾個小時一次)。年老代主要采用壓縮的方式來避免內存碎片(將存活對象移動到內存片的一邊),當然,有些垃圾回收器(譬如CMS垃圾回收器)出于效率的原因,可能會不進行壓縮。
3.持久代(Survivor):持久代主要存放類定義、字節碼和常量等很少會變更的信息,從配置的角度空,這個域是獨立的,不包括在jvm堆內,默認是4M.
說完這些我們正式談談GC.......
三、GC
1.GC算法:引用計數法,跟蹤收集法,跟蹤收集法又包含了:copying算法,mark-sweep算法,mark-compact算法。
1.1復制(Copying)
此算法把內存空間劃為兩個相等的區域,每次只使用其中一個區域。垃圾回收時,遍歷當前使用區域,把正在使用中的對象復制到另外一個區域中。此算法每次只處理正在使用中的對象,因此復制成本比較小,同時復制過去以后還能進行相應的內存整理,不會出現“碎片”問題。當然,此算法的缺點也是很明顯的,就是需要兩倍內存空間。效果圖如下:
1.2.標記-整理(Mark-Compact)
此算法結合了“標記-清除”和“復制”兩個算法的優點。也是分兩階段,第一階段從根節點開始標記所有被引用對象,第二階段遍歷整個堆,把清除未標記對象并且把存活對象“壓縮”到堆的其中一塊,按順序排放。此算法避免了“標記-清除”的碎片問題,同時也避免了“復制”算法的空間問題。效果圖如下:
2.GC處理與JVM內存分配:
2.1. 對象優先在Eden分配:年輕代主要存放新創建的對象,內存大小相對會比較小,垃圾回收會比較頻繁。年輕代分成1個Eden Space和2個Suvivor Space(命名為A和B)
2.舊域(old):新域中的對象,經過一定次數的GC循環后(一般經過15次的GC循環后),被移入舊域;當對象在堆創建時,將進入年輕代的Eden Space。垃圾回收器進行垃圾回收時,掃描Eden Space和A Suvivor Space,如果對象仍然存活,則復制到B Suvivor Space,如果B Suvivor Space已經滿,則復制 Old Gen掃描A Suvivor Space時,如果對象已經經過了幾次的掃描仍然存活,JVM認為其為一個Old對象,則將其移到Old Gen。掃描完畢后,JVM將Eden Space和A Suvivor Space清空,然后交換A和B的角色(即下次垃圾回收時會掃描Eden Space和BSuvivor Space。我們可以看到:Young Gen垃圾回收時,采用將存活對象復制到到空的Suvivor Space的方式來確保不存在內存碎片,采用空間換時間的方式來加速內存垃圾回收。
2.2.大對象直接進入老年代
大對象是指需要大量連續內存空間的Java對象,最典型的大對象就是那種很長的字符串及數組,虛擬機提供了一個-XX:PretenureSizeThreshold參數,令大于這個設置值的對象直接在老年代中分配。這樣做的目的是避免在Eden區及兩個Survivor區之間發生大量的內存拷貝(新生代采用復制算法收集內存)。PretenureSizeThreshold參數只對Serial和ParNew兩款收集器有效,
2.3.長期存活的對象將進入老年代
在經歷了多次的Minor GC后仍然存活:在觸發了Minor GC后,存活對象被存入Survivor區在經歷了多次Minor GC之后,如果仍然存活的話,則該對象被晉升到Old區。
虛擬機既然采用了分代收集的思想來管理內存,那內存回收時就必須能識別哪些對象應當放在新生代,哪些對象應放在老年代中。為了做到這點,虛擬機給每個對象定義了一個對象年齡(Age)計數器。如果對象在Eden出生并經過第一次Minor GC后仍然存活,并且能被Survivor容納的話,將被移動到Survivor空間中,并將對象年齡設為1。對象在Survivor區中每熬過一次Minor GC,年齡就增加1歲,當它的年齡增加到一定程度(默認為15歲)時,就會被晉升到老年代中。對象晉升老年代的年齡閾值,可以通過參數-XX:MaxTenuringThreshold來設置。
2.4.動態對象年齡判定
為了能更好地適應不同程序的內存狀況,虛擬機并不總是要求對象的年齡必須達到MaxTenuringThreshold才能晉升老年代,如果在Survivor空間中相同年齡所有對象大小的總和大于Survivor空間的一半,年齡大于或等于該年齡的對象就可以直接進入老年代,無須等到MaxTenuringThreshold中要求的年齡。
2.5.Minor GC后Survivor空間不足就直接放入Old區
2.6.空間分配擔保
在發生MinorGC時,虛擬機會檢測之前每次晉升到老年代的平均大小是否大于老年代的剩余空間大小,如果大于,則改為直接進行一次FullGC。如果小于,則查看HandlePromotionFailure設置是否允許擔保失敗;如果允許,那只會進行MinorGC;如果不允許,則也要改為進行一次Full GC。大部分情況下都還是會將HandlePromotionFailure開關打開,避免FullGC過于頻繁。
2.7JVM GC組合方式
2.8如何監視GC
1.概覽監視gc。
jmap -heap [pid] 查看內存分布
jstat -gcutil [pid] 1000 每隔1s輸出java進程的gc情況
2.詳細監視gc。
在jvm啟動參數,加入-verbose:gc -XX:+PrintGCTimeStamps -XX:+PrintGCDetails -Xloggc:./gc.log。
輸入示例:
[GC [ParNew: 11450951K->1014116K(11673600K), 0.8698830 secs] 27569972K->17943420K(37614976K), 0.8699520 secs] [Times: user=11.28 sys=0.82, real=0.86 secs]
表示發生一次minor
GC,ParNew是新生代的gc算法,11450951K表示eden區的存活對象的內存總和,1014116K表示回收后的存活對象的內存總和,11673600K是整個eden區的內存總和。0.8699520
secs表示minor gc花費的時間。
27569972K表示整個heap區的存活對象總和,17943420K表示回收后整個heap區的存活對象總和,37614976K表示整個heap區的內存總和。
[Full GC [Tenured: 27569972K->16569972K(27569972K), 180.2368177secs]36614976K->27569972K(37614976K), [Perm :28671K->28635K(28672K)],0.2371537 secs]
表示發生了一次Full GC,整個JVM都停頓了180多秒,輸出說明同上。只是Tenured: 27569972K->16569972K(27569972K)表示的是old區,而上面是eden區。