–引用計數法
是一個老牌垃圾回收算法,通過引用計算來標記,判斷一個對象是不是垃圾,是不是要回收。
基本思想 : 為每一個對象都標記一個引用數量,引用計數器的實現很簡單,對于一個對象A,只要有任何一個對象引用了A,則A的引用計數器就加1,當引用失效時,引用計數器就減1。只要對象A的引用計數器的值為0,則對象A就不可能再被使用。
對于上圖,根對象和ABC三個對象,有互相引用的關系,ABC引用計數分別為1
當A對B的引用失去之后,B的引用變成了0,根據引用計數的規則,引用為0 的B對象就會當作垃圾回收掉,回收之后堆中只剩下根對象和AC。
引用計數法帶來的問題
1、引用和去引用伴隨加法和減法,,因為要實時的計算當前對象有多少個引用,對象的引用和消是無時無刻存在的,所以對影響有一定性能
2、很難處理循環引用的問題,看下面的問題,
上圖中,根對象引用A,引用C,C引用B,B又引用A,所以引用計算A(2),C(1),B(1),當,根對象失去對A的引用時,由于A,B,C三者互相引用,所以三個對象的引用計數都是1,所以A,B,C相當于一個獨立體,無法被回收,如果堆中存在大量這樣的無用對象,就會導致不停的GC,而GC后又無效果,最終內存溢出
–標記清除
??????? 標記-清除算法是現代垃圾回收算法的思想基礎。????
??????? 基本思想:標記-清除算法將垃圾回收分為兩個階段:標記階段和清除階段。一種可行的實現是,在標記階段,首先通過根節點做搜索,標記所有從根節點開始的可達對象。因此,未被標記的對象就是未被引用的垃圾對象。然后,在清除階段,清除所有未被標記的對象。
在標記清除算法中,大致總結思路如下:從根節點開始做兩件事情
1、標活(標記可達對象),標記A,B,C,D,E是可達對象
2、去死 (去除不可達對象),去除黑色區域不可達對象
通過上面圖可以反應出,從堆中清空垃圾對象后,堆中的可用空間比較分散不連續,這時候如果有一個大的對象需要申請6個連續的空間,是無法分配,會造成大量的空間碎片。標記壓縮算法可以避免這種情況的發生。
–標記壓縮
基本思路:在標記-清除算法的基礎上做了一些優化。和標記-清除算法一樣,標記-壓縮算法也首先需要從根節點開始,對所有可達對象做一次標記。但之后,它并不簡單的清理未標記的對象,而是將所有的存活對象壓縮到內存的一端。之后,清理邊界外所有的空間。
執行過程如下圖:
大致總結思路如下:從根節點開始做兩件事情
1、標活
2、移動存活對象到一端
3、清除邊界外的所有空間
標記壓縮對標記清除而言,有什么優勢呢?
相比與標記清除算法,清理之后,會有大量的連續空間,不會有空間碎片,標記-壓縮算法適合用于存活對象較多的場合,如老年代。
–復制算法
基本思想 :將原有的內存空間分為兩塊,每次只使用其中一塊,在垃圾回收時,將正在使用的內存中的存活對象復制到未使用的內存塊中,之后,清除正在使用的內存塊中的所有對象,交換兩個內存的角色,完成垃圾回收
復制算法兩空一樣大小的空間,下面是復制算法的執行過程:
1、標活
2、復制存活對象從FROM區域到TO區域
3、交換FROM與TO的角色
與標記-清除算法相比,復制算法是一種相對高效的回收方法,在現在的JVM中,復制算法一般會用于年輕代,但是復制算法的最大問題是:空間浪費,每次只使用一半的空間。
可以想想,比如為復制算法分配8G的空間,但是在使用過程中會浪費4G的空間,當然8G的復制空間也只是舉個例子,為了更能突出空間的浪費 ,因為復制算法本身的特性決定 ,是需要將存活對象進行一次復制 ,所以復制空間一般都不會很大,因為大的空間,如果在極端情況下,會涉及大量存活對象的移動,這種大量的移動對于系統本身,無疑問是災難性的。
在現在的JVM中也不會很大,每一塊復制區域默認占用1/10的空間。比如,有10M的空間默認的,FROM和TO區域分別占用1M。
所以一般整合標記清理思想,對復制算法會做一些改進,如下圖:
因為復制空間越大,浪費的空間越大,復制算法空間一般不會很大,一般在復制過程 中會了現兩種情況
第一種:對象太大,放不到復制空間
第二種:即使大對象放得下,也會導致大量的小對象無法存放,會導致大量的不符合老年代特性的小對象進行老年代
所以復制算法一般需要一個擔??臻g,如上圖中藍色區域。
比如:C、D、F是大對象,在一執行復制算法后,會直接進入到擔??臻g。
對于對JVM堆內存劃分有了解的人,可能對上面的圖比較熟悉,這其實已經很接近JVM堆空間的結構,藍色區域復制算法的擔保空間就我們經常說的老年代(Old Generation)。頂部的區域就是年輕代(Eden),而中間兩塊復制算法的空間就是幸存區(Surivor),對比上面和下面的圖,發現是完全可以吻合的。
分代思想
依據對象的存活周期進行分類
第一類:有些對象創建后,很快就會回收,我們把短命對象歸為新生代,
第二類:有些對象創建后會長期存在,有可能和JVM生命周期相同,我們把長命對象歸為老年代。
根據不同代的特點,選取合適的收集算法
–少量對象存活,適合復制算法
–老年代中的對象有兩種:
???????? 老年代中的對象:多次GC沒有回收掉,年齡校大的對象,生命周期較長
???????? 復制算法空間擔保 ,直接進入 老年代的大對象
所以會有大量對象存活,和大對象,適合標記清理或者標記壓縮
所有的算法,需要能夠識別一個垃圾對象,因此需要給出一個可觸及性的定義
什么是可觸及的:從根節點可以到達的對象,此對象稱為可觸及的
可復活的: 一旦所有引用被釋放,就是可復活狀態(因為在finalize()中可能復活該對象)
什么是不可觸及的:在finalize()后,可能會進入不可觸及狀態,不可觸及的對象不可能復活,不可觸及的對象,是可以回收的
上面的算法中,我們一直說從根節點查找,都提到了根節點,所以我們要搞清楚什么是根節點?
–棧中引用的對象(局部變量表)
–方法區中靜態成員或者常量引用的對象(全局對象)
–JNI方法棧中引用對象
根是一系列對象的集合,是一砣根節點,文章中為了簡單所以只有一個根對象,希望不要給大家帶來誤解!
GC中的一個重要 的現象Stop-The-Word
java中一種全局暫停的現象,所有的JAVA代碼停止 ,native代碼可能執行,但不能和JVM交互
引起STW的原因 :GC 、DUMP線程、堆 DUMP
多半是因為GC引起的。
為什么會產生全局停頓?
GC需要一個安靜的狀態來完成垃圾的回收,所以需要將用戶線程停止,完成垃圾回收后,再繼續用戶線程。
STW危害?
1、影響系統吞吐量,系統響應時間 增長
2、長時間的服務停止,沒有響應,遇到HA系統,可能引起主備切換,最終導致主備同時啟動。在一些業務場景下,可能會導致數據不致,甚至無法正常工作。
大家好我是BK,第一次寫文章 ,寫和不是很好,有錯誤的地方,請大家指正,謝謝大家!
后續會更新GC的種類和各類的區別。希望大家可以關注我。