volatile是輕量級(jí)的synchronized,它在多處理器開發(fā)中保證了共享變量的“可見性”,它比synchronized的使用開銷低因?yàn)椋粫?huì)引起線程上下文的切換。
1.volatile的定義與實(shí)現(xiàn)原理
Java語言提供了volatile,在某些情況下比鎖要更方便。如果一個(gè)字段被聲明成volatile,Java線程內(nèi)存模型確保所有線程看到這個(gè)變量的值是一致的。
CPU指令:
在X86處理器下通過工具獲取JIT編譯器生成的匯編指令來查看對(duì)volatile進(jìn)行寫操作時(shí),CPU會(huì)做什么事情。
代碼:instance = new Singleton();? //instance是volatile變量。
匯編代碼: 0x01a3deld:movb $0X0,0X1104800(%esi);0x01a3de24:lock $0X0,(%esp);
有l(wèi)ock前綴在多核處理器下會(huì)引發(fā)兩件事。
1)將該處理器的該緩存行寫回到系統(tǒng)內(nèi)存中。
2)這個(gè)寫會(huì)內(nèi)存的操作會(huì)使其他處理器存儲(chǔ)了該地址數(shù)據(jù)的數(shù)據(jù)無效。
為了提高處理速度,處理器不直接和內(nèi)存進(jìn)行通信,而是先將系統(tǒng)內(nèi)存的數(shù)據(jù)讀到內(nèi)部緩存(L1,L2或其他)后再進(jìn)行操作,JVM就會(huì)向處理器發(fā)送一條Lock前綴的指令,將這個(gè)變量所在緩存行的數(shù)據(jù)寫回到系統(tǒng)內(nèi)存。但是,就算寫會(huì)到內(nèi)存,如果其他處理器緩存的值還是舊的,再執(zhí)行計(jì)算操作就會(huì)有問題。所以,在多處理器下,為了保證各個(gè)處理器的緩存是一致的,就會(huì)實(shí)現(xiàn)緩存一致性協(xié)議,每個(gè)處理器通過嗅探在總線上傳播的數(shù)據(jù)來檢查自己的緩存的值是不是過期了,當(dāng)處理器發(fā)現(xiàn)自己緩存行對(duì)應(yīng)的內(nèi)存地址被修改,就會(huì)將當(dāng)前處理器的緩存行設(shè)置成無效狀態(tài),當(dāng)處理器對(duì)這個(gè)數(shù)據(jù)進(jìn)行修改操作的時(shí)候,會(huì)重新從系統(tǒng)內(nèi)存中把數(shù)據(jù)讀到處理器緩存里。
2.具體實(shí)現(xiàn)原則:
1)Lock前綴指令會(huì)引起處理器緩存回寫到內(nèi)存。Lock前綴指令導(dǎo)致在執(zhí)行指令期間,聲言處理器的LOCK#信號(hào)。在多處理器環(huán)境中,LOCK#信號(hào)確保在聲言該信號(hào)期間,處理器可以獨(dú)占任何共享內(nèi)存。但是在最近的處理器里,LOCK#信號(hào)一般不鎖總線,而是鎖緩存,畢竟鎖總線開銷的比較大。鎖緩存的原理是,當(dāng)訪問的內(nèi)存區(qū)域已經(jīng)緩存在處理器內(nèi)部,處理器會(huì)鎖定這塊內(nèi)存區(qū)域的緩存行并回寫到內(nèi)存,并使用緩存一致性機(jī)制來確保修改的原子性,緩存一致性機(jī)制會(huì)阻止同時(shí)修改由兩個(gè)以上處理器緩存的內(nèi)存區(qū)域數(shù)據(jù)。
2)一個(gè)處理器的緩存回寫到內(nèi)存會(huì)導(dǎo)致其他處理器的緩存無效。處理器使用嗅探技術(shù)保證它的內(nèi)部緩存、系統(tǒng)內(nèi)存和其他處理器的緩存的數(shù)據(jù)在總線上保持一致。例如P6 family處理器中,如果通過嗅探一個(gè)處理器來檢測其他處理器打算寫內(nèi)存地址,而這個(gè)地址當(dāng)前處于共享狀態(tài),那么正在嗅探的處理器將使它的緩存行無效,在下次訪問相同內(nèi)存地址時(shí),強(qiáng)制執(zhí)行緩存行填充。
3.volatile的使用優(yōu)化
1)追加字節(jié)優(yōu)化性能:在JDK1.7的并發(fā)包里新增一個(gè)隊(duì)列集合類Linked-TransferQueue,它使用volatile變量時(shí),用一種追加字節(jié)的方式來優(yōu)化隊(duì)列出隊(duì)和入隊(duì)的性能。
/**隊(duì)列中的頭部節(jié)點(diǎn)*/
private transient final PaddedAtomicReference<QNode> head;
/**隊(duì)列中的尾部節(jié)點(diǎn)*/
private transient final PaddedAtomicReference?tail;
static final class?PaddedAtomicReference <T> extends?AtomicReference <T>{
????//使用很多4個(gè)字節(jié)的引用追加到64個(gè)字節(jié)
? ? Object p0,p1,p2,p4,p5,p6,p7,p8,p9,pa,pb,pc,pd,pe;
? ??PaddedAtomicReference(T r){
? ? ? ? super(r);
????}
}
public class?AtomicReference <V> implements java.io.Serializable {
? ? private volatile V value;
? ? //省略其他代碼。
}
上述類,他使用一個(gè)內(nèi)部類類型來定義隊(duì)列的頭節(jié)點(diǎn)和尾節(jié)點(diǎn),而這個(gè)內(nèi)部類相對(duì)于父類AtomicReference只做了一件事情,就是將共享變量追加到64字節(jié)。因?yàn)閷?duì)于很多的處理器來說,他們的高速緩存行L1、L2和L3是64字節(jié)寬,不支持部分填充緩存行。這意味著隊(duì)列的頭節(jié)點(diǎn)和尾節(jié)點(diǎn)都不足64字節(jié)的話,處理器會(huì)將它們都讀到同一個(gè)高速緩存行中,再多處理器下每個(gè)處理器都會(huì)緩存同樣的頭節(jié)點(diǎn)和尾節(jié)點(diǎn),當(dāng)一個(gè)處理器試圖修改頭節(jié)點(diǎn)時(shí),會(huì)將整個(gè)緩存行鎖定,那么在緩存一致性機(jī)制的影響下,其他的處理器將不能訪問它們的尾節(jié)點(diǎn),而隊(duì)列的入隊(duì)列和出隊(duì)列操作則需要不停的修改頭節(jié)點(diǎn)和尾節(jié)點(diǎn),所以在多處理的情況下將會(huì)嚴(yán)重影響到隊(duì)列的入隊(duì)和出隊(duì)效率。追加到64字節(jié)的方式來填滿告訴緩沖區(qū)的緩存行,避免頭節(jié)點(diǎn)和尾節(jié)點(diǎn)加載到同一個(gè)緩存行,使頭、尾節(jié)點(diǎn)在修改時(shí)不會(huì)互相鎖定。
如果共享變量不被頻繁寫的話,鎖的幾率也非常小,就沒必要通過追加字節(jié)的方式來避免相互鎖定。
但是這種追加字節(jié)的方式在Java7下可能不生效,因?yàn)镴ava7變得更加智慧,他會(huì)淘汰或重新排列無用字段,需要使用其他追加字節(jié)的方式。