Caching漫談--關(guān)于Cache的幾個(gè)理論

如今緩存是隨處可見了，如果你的程序還沒有使用到緩存，那可能是你的程序并發(fā)量很低，或?qū)?shí)時(shí)性要求很低。我們公司的ERP在顯示某些報(bào)表時(shí)，每次打開都需要花上幾分鐘的時(shí)間，假如搜索引擎也是這么慢，我想這家搜索引擎早就被淘汰了。
這些ERP報(bào)表是否該引入緩存加速一下呢……
使用緩存，就是在取出數(shù)據(jù)結(jié)果后，暫時(shí)將數(shù)據(jù)存儲在某些可以快速存取的位置（例如各種NoSQL如Redis，HBase，又或MemoryCache等等），于是就可以讓這些耗時(shí)的數(shù)據(jù)結(jié)果多次重復(fù)的利用，不必每次重復(fù)請求相同的數(shù)據(jù)，節(jié)省CPU和I/O，加速程序的響應(yīng)。
使用緩存能讓加載數(shù)據(jù)的延遲降低，I/O操作減少，從而性能得到提高。
緩存使用起來很容易，但是保持緩存的一致性卻困難得多。有一些前人總結(jié)的經(jīng)驗(yàn)和方法，我們可以借鑒一下。
緩存重點(diǎn)在于寫入的時(shí)候，相關(guān)數(shù)據(jù)的更新問題，如果數(shù)據(jù)一直沒有更新或刪除操作，那緩存就不會存在臟數(shù)據(jù)一說了。
關(guān)于緩存寫入，至少有4種寫入的策略。

write-through

這個(gè)動作發(fā)生在Cache層。是指在寫數(shù)據(jù)時(shí)，同時(shí)寫入到緩存和DB中，這個(gè)寫入操作認(rèn)為是一個(gè)單一的事務(wù)，也就是說，在更新Cache時(shí)，我們先更新了Cache中的數(shù)據(jù)，然后接著更新Db中的數(shù)據(jù)。在DB的數(shù)據(jù)完成更新前，程序還不會返回，一直等到數(shù)據(jù)庫存儲的結(jié)果。可想而知，這種做法不會給寫入數(shù)據(jù)帶來更高的性能。

write-through

我用向下的箭頭表示一個(gè)函數(shù)的調(diào)用，綠色的虛線表示函數(shù)的返回，我拙劣的語言能力還難以描述清楚，但如果把這個(gè)圖寫成程序，就像這個(gè)樣子：

public class UserLogic
{
    public void WriteToDb(UserEntity user)
    {
        CacheManager cache = GetCacheManager();
        cache.WriteToDb(user);
    }
}
public class CacheManager
{
    public void WriteToDb(UserEntity user)
    {
        cacheStore.Set(user.cacheKey, user.ToJson());
        dbManager.UpdateSqlServer(user);
    }
}

UserLogic類放在Cache層之上，非Cache層，比如應(yīng)用層、領(lǐng)域?qū)印⒛衬尺壿媽又悺腤riteToDb函數(shù)內(nèi)部并沒有關(guān)于Db執(zhí)行的代碼，它不關(guān)心Db，它直接調(diào)用了Cache層的CacheManager的WriteToDb()。
CacheManager.WriteToDb()內(nèi)部先去更新了Cache，然后并沒有立刻返回，接著又將user寫入了MSSQL里面。
所以我說，這種做法不會給寫入數(shù)據(jù)帶來更高的性能。

write-around

發(fā)生在Cache層，直接寫入數(shù)據(jù)到數(shù)據(jù)庫，不必寫到緩存中。這個(gè)不必過多的解釋，緩存的數(shù)據(jù)應(yīng)該被立即過期（否則數(shù)據(jù)就會不一致了）

write-around

當(dāng)我寫這篇文章的時(shí)候，發(fā)現(xiàn)確實(shí)偽代碼比我無力的中文解釋更清晰，那么write-around的偽代碼呢？

public class UserLogic
{
    public void WriteToDb(UserEntity user)
    {
        cacheStore.Invalidate(user.caheKey);
        dbManager.UpdateSqlServer(user);
    }
}

應(yīng)用層繞過了Cache層，直接調(diào)用Db寫入了數(shù)據(jù)庫。

write-behind

還是發(fā)生在Cache層，剛開始時(shí)，寫入到緩存中，當(dāng)設(shè)定的緩存容量達(dá)到上限，或等到一定的時(shí)間間隔后，再寫到數(shù)據(jù)庫中。
換句話說，寫入到數(shù)據(jù)庫是有條件的。當(dāng)我們要存入數(shù)據(jù)庫時(shí)，一定是有一批數(shù)據(jù)甚至是一大批數(shù)據(jù)都需要從緩存中寫到數(shù)據(jù)庫中。我們想象這是一個(gè)寫入的隊(duì)列，要寫入的數(shù)據(jù)源源不斷的放入到這個(gè)隊(duì)列中。此時(shí)，我們可以使用服務(wù)器上的另外一個(gè)進(jìn)程獨(dú)立的處理這個(gè)隊(duì)列。
如果在寫入數(shù)據(jù)庫前某些數(shù)據(jù)又發(fā)生了修改，因?yàn)樵摂?shù)據(jù)還沒有被插入到數(shù)據(jù)庫，所以這個(gè)隊(duì)列中對應(yīng)的那個(gè)元素也會發(fā)生相應(yīng)的更改，以保證最后插入到數(shù)據(jù)庫中的是最新的數(shù)據(jù)。

write-behind

public class UserLogic
{
    public void WriteToDb(UserEntity user)
    {
        CacheManager cache = GetCacheManager();
        cache.WriteToDb(user);
    }
}
public class CacheManager
{
    public void WriteToDb(UserEntity user)
    {
        cacheStore.AddToQueue(user.cacheKey, user.ToJson());
    }
}
public class DbDaemon
{
    public void Watch()
    {
        while(someConditionIsOK())
        {
            UserEntity user = cacheStore.UserDequeue();
            dbManager.WriteToDb(user);
        }
    }
}

在這種模式里，應(yīng)用層UserLogic照例調(diào)用Cache層進(jìn)行更新，但是CacheManager內(nèi)的WriteToDb函數(shù)已經(jīng)發(fā)生了變化，它將user的內(nèi)容存放在一個(gè)隊(duì)列中（當(dāng)然了，同時(shí)也得更新緩存）。然后程序的就返回了。
可是，數(shù)據(jù)怎么放到Db里面去呢？
這技巧放在DbDaemon里，DbDaemon位于另外一個(gè)exe中，是獨(dú)立的應(yīng)用程序（比如這是個(gè)Windows Service），當(dāng)條件滿足時(shí)，這個(gè)程序到隊(duì)列里面去取值，取出來再放更新到數(shù)據(jù)庫。
于是乎，UserLogic層只是更新了緩存而已，這會最大限度的保證寫入的效率。
write-behind至少帶來這幾點(diǎn)好處：

性能的提升，因?yàn)槌绦虿辉傩枰却龜?shù)據(jù)庫的寫入操作，當(dāng)數(shù)據(jù)寫入緩存成功后，程序立刻返回了。
降低了數(shù)據(jù)庫的負(fù)載，因?yàn)槊看味际桥康牟迦氲綌?shù)據(jù)庫中。如果在正式插入數(shù)據(jù)庫前，數(shù)據(jù)還有更改，這會讓它的優(yōu)勢更明顯。例如，插入數(shù)據(jù)庫是數(shù)據(jù)是{id:1, name:”張三”}，這條數(shù)據(jù)先被放入隊(duì)列但還沒有被處理。后來這條數(shù)據(jù)又被更改成了李四王五趙六，無論被改了多少次，最終都是以最后的”趙六”為最終結(jié)果，數(shù)據(jù)庫實(shí)際上只有一次插入操作。
程序還提高了可靠性。想象如果數(shù)據(jù)庫服務(wù)器發(fā)生了宕機(jī)，程序并不會立即出現(xiàn)問題，緩存的寫入隊(duì)列還在起作用。
并發(fā)性能的提高，如果程序需要處理更多的并發(fā)，可以提高寫入數(shù)據(jù)庫的間隔，減少數(shù)據(jù)庫的壓力。
但是，使用write-behind也是有挑戰(zhàn)的，如果要使用write-behind，至少有這幾點(diǎn)要考慮：
由于數(shù)據(jù)庫的更新是滯后于cache的，這意味著數(shù)據(jù)庫的事務(wù)只能成功不能失敗。我們想象一下客戶已經(jīng)提交了購買訂單，cache更新成功，訂單放入緩存的隊(duì)列，但是20分鐘后，嘗試寫入到SQL數(shù)據(jù)庫時(shí)，出現(xiàn)了數(shù)據(jù)庫插入失敗的尷尬局面。
如果第三方的應(yīng)用，或者是人為原因去更新了數(shù)據(jù)庫，這可能導(dǎo)致寫入隊(duì)列中的數(shù)據(jù)與數(shù)據(jù)庫中數(shù)據(jù)出現(xiàn)沖突，從而導(dǎo)致數(shù)據(jù)回寫失敗。比如緩存中的一個(gè)主鍵是97033，正待寫入到數(shù)據(jù)庫。結(jié)果另外的某程序搶先一步插入了97033，那么就悲劇了。

cache-aside

發(fā)生在應(yīng)用層，應(yīng)用層保證緩存結(jié)果同DB的數(shù)據(jù)一致性，應(yīng)用層來負(fù)責(zé)寫入到數(shù)據(jù)庫和整理緩存，緩存層則不必插手此事。

write-aside

public class UserLogic
{
    public void WriteToDb(UserEntity user)
    {
        cacheStore.Set(user.cacheKey, user);
        dbManager.WriteToDb(user);
    }
}

在這種模式里，所有動作就在應(yīng)用層里發(fā)生，它自己更新Cache，自己寫到Db，愛怎么干怎么干。

4種寫入數(shù)據(jù)的方式各有各的特點(diǎn)，可以根據(jù)項(xiàng)目自身的特點(diǎn)加以選擇。

數(shù)據(jù)的讀取就簡單得多了，有這樣兩種方式。

read-through

讀取數(shù)據(jù)時(shí)，先嘗試從緩存中取得，如果緩存中沒有，那么再從數(shù)據(jù)庫中讀取，而后也將數(shù)據(jù)放入緩存中，以便下次讀取。

refresh-ahead

簡單的說就是在緩存數(shù)據(jù)過期前，能自動的刷新緩存數(shù)據(jù)。舉個(gè)例子來說，某條數(shù)據(jù)在緩存中，過期時(shí)間是60秒。我們給他設(shè)置一個(gè)參數(shù)，比如是0.8，60x0.8=48秒，那么在前48秒訪問該數(shù)據(jù)，就照正常的取法，直接返回緩存中的數(shù)據(jù)。當(dāng)在48-60秒這個(gè)區(qū)間取數(shù)據(jù)時(shí)，緩存先將之前緩存的結(jié)果返回給外部應(yīng)用程序，然后異步的再從數(shù)據(jù)庫去更新緩存中的值，以盡可能的保證緩存的值是最新的。如果取數(shù)據(jù)的的時(shí)候超過了60秒，就安裝read-through的方式。
Refresh-ahead是對未來數(shù)據(jù)的訪問情形的估算，我們猜測這個(gè)數(shù)據(jù)在過期后，仍然可能被頻繁的訪問，那么這種設(shè)計(jì)的策略獲得的優(yōu)勢會更明顯。
但是，如果有大量的數(shù)據(jù)是用refresh-ahead策略，但是這個(gè)數(shù)據(jù)被重新緩存后，又一次都沒有被訪問過，那這個(gè)策略就是很失算的了。
那么，有人可能會問，既然如此，我把過期的時(shí)間延長不就好了，之前60秒過期，改成6000秒過期，這樣就不會用Refresh-ahead策略來刷新數(shù)據(jù)了。
然而，事實(shí)是緩存的數(shù)據(jù)越久，出現(xiàn)臟數(shù)據(jù)的可能性也就越大，更重要的是，如果你的估算也是失誤的，大量的超期緩存數(shù)據(jù)沒有被實(shí)際訪問，那么你就浪費(fèi)了很多的內(nèi)存，做了無用的事情，這也是應(yīng)該避免的。

緩存策略介紹完畢。再加上偽代碼，相信我還是說得比較清楚了。

小春微信

最后編輯于：2017.12.08 04:22:17

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 230,106評論 6贊 542
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 99,441評論 3贊 429
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 178,211評論 0贊 383
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,736評論 1贊 317
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 72,475評論 6贊 412
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 55,834評論 1贊 328
城市分裂傳說
那天，我揣著相機(jī)與錄音，去河邊找鬼。笑死，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,829評論 3贊 446
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 43,009評論 0贊 290
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 49,559評論 1贊 335
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 41,306評論 3贊 358
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 43,516評論 1贊 374
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 39,038評論 5贊 363
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 44,728評論 3贊 348
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 35,132評論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 36,443評論 1贊 295
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 52,249評論 3贊 399
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 48,484評論 2贊 379

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Caching漫談--關(guān)于Cache的幾個(gè)理論

Caching漫談--關(guān)于Cache的幾個(gè)理論

write-through

write-around

write-behind

cache-aside

read-through

refresh-ahead

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

Caching漫談--關(guān)于Cache的幾個(gè)理論

write-through

write-around

write-behind

cache-aside

read-through

refresh-ahead

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频