為什么分布式一定要有Redis?

為什么分布式一定要有Redis?

考慮到絕大部分寫業(yè)務(wù)的程序員,在實(shí)際開(kāi)發(fā)中使用 Redis 的時(shí)候,只會(huì) Set Value 和 Get Value 兩個(gè)操作,對(duì) Redis 整體缺乏一個(gè)認(rèn)知。

所以我斗膽以 Redis 為題材,對(duì) Redis 常見(jiàn)問(wèn)題做一個(gè)總結(jié),希望能夠彌補(bǔ)大家的知識(shí)盲點(diǎn)。

本文圍繞以下幾點(diǎn)進(jìn)行闡述:

  • 為什么使用 Redis
  • 使用 Redis 有什么缺點(diǎn)
  • 單線程的 Redis 為什么這么快
  • Redis 的數(shù)據(jù)類型,以及每種數(shù)據(jù)類型的使用場(chǎng)景
  • Redis 的過(guò)期策略以及內(nèi)存淘汰機(jī)制
  • Redis 和數(shù)據(jù)庫(kù)雙寫一致性問(wèn)題
  • 如何應(yīng)對(duì)緩存穿透和緩存雪崩問(wèn)題
  • 如何解決 Redis 的并發(fā)競(jìng)爭(zhēng) Key 問(wèn)題

為什么使用 Redis

我覺(jué)得在項(xiàng)目中使用 Redis,主要是從兩個(gè)角度去考慮:性能和并發(fā)。

當(dāng)然,Redis 還具備可以做分布式鎖等其他功能,但是如果只是為了分布式鎖這些其他功能,完全還有其他中間件,如 ZooKpeer 等代替,并不是非要使用 Redis。因此,這個(gè)問(wèn)題主要從性能和并發(fā)兩個(gè)角度去答。

性能

如下圖所示,我們?cè)谂龅叫枰獔?zhí)行耗時(shí)特別久,且結(jié)果不頻繁變動(dòng)的 SQL,就特別適合將運(yùn)行結(jié)果放入緩存。這樣,后面的請(qǐng)求就去緩存中讀取,使得請(qǐng)求能夠迅速響應(yīng)。

題外話:忽然想聊一下這個(gè)迅速響應(yīng)的標(biāo)準(zhǔn)。根據(jù)交互效果的不同,這個(gè)響應(yīng)時(shí)間沒(méi)有固定標(biāo)準(zhǔn)。

不過(guò)曾經(jīng)有人這么告訴我:"在理想狀態(tài)下,我們的頁(yè)面跳轉(zhuǎn)需要在瞬間解決,對(duì)于頁(yè)內(nèi)操作則需要在剎那間解決。

另外,超過(guò)一彈指的耗時(shí)操作要有進(jìn)度提示,并且可以隨時(shí)中止或取消,這樣才能給用戶最好的體驗(yàn)。"

那么瞬間、剎那、一彈指具體是多少時(shí)間呢?

根據(jù)《摩訶僧祗律》記載:

一剎那者為一念,二十念為一瞬,二十瞬為一彈指,二十彈指為一羅預(yù),二十羅預(yù)為一須臾,一日一夜有三十須臾。

那么,經(jīng)過(guò)周密的計(jì)算,一瞬間為 0.36 秒、一剎那有 0.018 秒、一彈指長(zhǎng)達(dá) 7.2 秒。

并發(fā)

如下圖所示,在大并發(fā)的情況下,所有的請(qǐng)求直接訪問(wèn)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)會(huì)出現(xiàn)連接異常。

這個(gè)時(shí)候,就需要使用 Redis 做一個(gè)緩沖操作,讓請(qǐng)求先訪問(wèn)到 Redis,而不是直接訪問(wèn)數(shù)據(jù)庫(kù)。

使用 Redis 有什么缺點(diǎn)

大家用 Redis 這么久,這個(gè)問(wèn)題是必須要了解的,基本上使用 Redis 都會(huì)碰到一些問(wèn)題,常見(jiàn)的也就幾個(gè)。

回答主要是四個(gè)問(wèn)題:

  • 緩存和數(shù)據(jù)庫(kù)雙寫一致性問(wèn)題

  • 緩存雪崩問(wèn)題

  • 緩存擊穿問(wèn)題

  • 緩存的并發(fā)競(jìng)爭(zhēng)問(wèn)題

單線程的 Redis 為什么這么快

這個(gè)問(wèn)題是對(duì) Redis 內(nèi)部機(jī)制的一個(gè)考察。根據(jù)我的面試經(jīng)驗(yàn),很多人都不知道Redis 是單線程工作模型。所以,這個(gè)問(wèn)題還是應(yīng)該要復(fù)習(xí)一下的。

回答主要是以下三點(diǎn):

  • 純內(nèi)存操作
  • 單線程操作,避免了頻繁的上下文切換
  • 采用了非阻塞 I/O 多路復(fù)用機(jī)制

題外話:我們現(xiàn)在要仔細(xì)的說(shuō)一說(shuō) I/O 多路復(fù)用機(jī)制,因?yàn)檫@個(gè)說(shuō)法實(shí)在是太通俗了,通俗到一般人都不懂是什么意思。

打一個(gè)比方:小曲在 S 城開(kāi)了一家快遞店,負(fù)責(zé)同城快送服務(wù)。小曲因?yàn)橘Y金限制,雇傭了一批快遞員,然后小曲發(fā)現(xiàn)資金不夠了,只夠買一輛車送快遞。

經(jīng)營(yíng)方式一

客戶每送來(lái)一份快遞,小曲就讓一個(gè)快遞員盯著,然后快遞員開(kāi)車去送快遞。

慢慢的小曲就發(fā)現(xiàn)了這種經(jīng)營(yíng)方式存在下述問(wèn)題:

  • 幾十個(gè)快遞員基本上時(shí)間都花在了搶車上了,大部分快遞員都處在閑置狀態(tài),誰(shuí)搶到了車,誰(shuí)就能去送快遞。
  • 隨著快遞的增多,快遞員也越來(lái)越多,小曲發(fā)現(xiàn)快遞店里越來(lái)越擠,沒(méi)辦法雇傭新的快遞員了。
  • 快遞員之間的協(xié)調(diào)很花時(shí)間。

綜合上述缺點(diǎn),小曲痛定思痛,提出了下面的經(jīng)營(yíng)方式。

經(jīng)營(yíng)方式二

小曲只雇傭一個(gè)快遞員。然后呢,客戶送來(lái)的快遞,小曲按送達(dá)地點(diǎn)標(biāo)注好,然后依次放在一個(gè)地方。

最后,那個(gè)快遞員依次的去取快遞,一次拿一個(gè),然后開(kāi)著車去送快遞,送好了就回來(lái)拿下一個(gè)快遞。

上述兩種經(jīng)營(yíng)方式對(duì)比,是不是明顯覺(jué)得第二種,效率更高,更好呢?

在上述比喻中:

  • 每個(gè)快遞員→每個(gè)線程
  • 每個(gè)快遞→每個(gè) Socket(I/O 流)
  • 快遞的送達(dá)地點(diǎn)→Socket 的不同狀態(tài)
  • 客戶送快遞請(qǐng)求→來(lái)自客戶端的請(qǐng)求
  • 小曲的經(jīng)營(yíng)方式→服務(wù)端運(yùn)行的代碼
  • 一輛車→CPU 的核數(shù)

于是我們有如下結(jié)論:

  • 經(jīng)營(yíng)方式一就是傳統(tǒng)的并發(fā)模型,每個(gè) I/O 流(快遞)都有一個(gè)新的線程(快遞員)管理。
  • 經(jīng)營(yíng)方式二就是 I/O 多路復(fù)用。只有單個(gè)線程(一個(gè)快遞員),通過(guò)跟蹤每個(gè) I/O 流的狀態(tài)(每個(gè)快遞的送達(dá)地點(diǎn)),來(lái)管理多個(gè) I/O 流。

下面類比到真實(shí)的 Redis 線程模型,如圖所示:

簡(jiǎn)單來(lái)說(shuō),就是我們的 redis-client 在操作的時(shí)候,會(huì)產(chǎn)生具有不同事件類型的 Socket。

在服務(wù)端,有一段 I/O 多路復(fù)用程序,將其置入隊(duì)列之中。然后,文件事件分派器,依次去隊(duì)列中取,轉(zhuǎn)發(fā)到不同的事件處理器中。

需要說(shuō)明的是,這個(gè) I/O 多路復(fù)用機(jī)制,Redis 還提供了 select、epoll、evport、kqueue 等多路復(fù)用函數(shù)庫(kù),大家可以自行去了解。

Redis 的數(shù)據(jù)類型,以及每種數(shù)據(jù)類型的使用場(chǎng)景

是不是覺(jué)得這個(gè)問(wèn)題很基礎(chǔ)?我也這么覺(jué)得。然而根據(jù)面試經(jīng)驗(yàn)發(fā)現(xiàn),至少百分之八十的人答不上這個(gè)問(wèn)題。

建議,在項(xiàng)目中用到后,再類比記憶,體會(huì)更深,不要硬記。基本上,一個(gè)合格的程序員,五種類型都會(huì)用到。

String

這個(gè)沒(méi)啥好說(shuō)的,最常規(guī)的 set/get 操作,Value 可以是 String 也可以是數(shù)字。一般做一些復(fù)雜的計(jì)數(shù)功能的緩存。

Hash

這里 Value 存放的是結(jié)構(gòu)化的對(duì)象,比較方便的就是操作其中的某個(gè)字段。

我在做單點(diǎn)登錄的時(shí)候,就是用這種數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)用戶信息,以 CookieId 作為 Key,設(shè)置 30 分鐘為緩存過(guò)期時(shí)間,能很好的模擬出類似 Session 的效果。

List

使用 List 的數(shù)據(jù)結(jié)構(gòu),可以做簡(jiǎn)單的消息隊(duì)列的功能。另外還有一個(gè)就是,可以利用 lrange 命令,做基于 Redis 的分頁(yè)功能,性能極佳,用戶體驗(yàn)好。

Set

因?yàn)?Set 堆放的是一堆不重復(fù)值的集合。所以可以做全局去重的功能。為什么不用 JVM 自帶的 Set 進(jìn)行去重?

因?yàn)槲覀兊南到y(tǒng)一般都是集群部署,使用 JVM 自帶的 Set,比較麻煩,難道為了一個(gè)做一個(gè)全局去重,再起一個(gè)公共服務(wù),太麻煩了。

另外,就是利用交集、并集、差集等操作,可以計(jì)算共同喜好,全部的喜好,自己獨(dú)有的喜好等功能。

Sorted Set

Sorted Set多了一個(gè)權(quán)重參數(shù) Score,集合中的元素能夠按 Score 進(jìn)行排列。

可以做排行榜應(yīng)用,取 TOP N 操作。Sorted Set 可以用來(lái)做延時(shí)任務(wù)。最后一個(gè)應(yīng)用就是可以做范圍查找。

Redis 的過(guò)期策略以及內(nèi)存淘汰機(jī)制

這個(gè)問(wèn)題相當(dāng)重要,到底 Redis 有沒(méi)用到家,這個(gè)問(wèn)題就可以看出來(lái)。

比如你 Redis 只能存 5G 數(shù)據(jù),可是你寫了 10G,那會(huì)刪 5G 的數(shù)據(jù)。怎么刪的,這個(gè)問(wèn)題思考過(guò)么?

還有,你的數(shù)據(jù)已經(jīng)設(shè)置了過(guò)期時(shí)間,但是時(shí)間到了,內(nèi)存占用率還是比較高,有思考過(guò)原因么?

回答:Redis 采用的是定期刪除+惰性刪除策略。

為什么不用定時(shí)刪除策略

定時(shí)刪除,用一個(gè)定時(shí)器來(lái)負(fù)責(zé)監(jiān)視 Key,過(guò)期則自動(dòng)刪除。雖然內(nèi)存及時(shí)釋放,但是十分消耗 CPU 資源。

在大并發(fā)請(qǐng)求下,CPU 要將時(shí)間應(yīng)用在處理請(qǐng)求,而不是刪除 Key,因此沒(méi)有采用這一策略。

定期刪除+惰性刪除是如何工作

定期刪除,Redis 默認(rèn)每個(gè) 100ms 檢查,是否有過(guò)期的 Key,有過(guò)期 Key 則刪除。

需要說(shuō)明的是,Redis 不是每個(gè) 100ms 將所有的 Key 檢查一次,而是隨機(jī)抽取進(jìn)行檢查(如果每隔 100ms,全部 Key 進(jìn)行檢查,Redis 豈不是卡死)。

因此,如果只采用定期刪除策略,會(huì)導(dǎo)致很多 Key 到時(shí)間沒(méi)有刪除。于是,惰性刪除派上用場(chǎng)。

也就是說(shuō)在你獲取某個(gè) Key 的時(shí)候,Redis 會(huì)檢查一下,這個(gè) Key 如果設(shè)置了過(guò)期時(shí)間,那么是否過(guò)期了?如果過(guò)期了此時(shí)就會(huì)刪除。

采用定期刪除+惰性刪除就沒(méi)其他問(wèn)題了么?

不是的,如果定期刪除沒(méi)刪除 Key。然后你也沒(méi)即時(shí)去請(qǐng)求 Key,也就是說(shuō)惰性刪除也沒(méi)生效。這樣,Redis的內(nèi)存會(huì)越來(lái)越高。那么就應(yīng)該采用內(nèi)存淘汰機(jī)制。

在 redis.conf 中有一行配置:

# maxmemory-policy volatile-lru

該配置就是配內(nèi)存淘汰策略的(什么,你沒(méi)配過(guò)?好好反省一下自己):

  • noeviction:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時(shí),新寫入操作會(huì)報(bào)錯(cuò)。應(yīng)該沒(méi)人用吧。
  • allkeys-lru:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時(shí),在鍵空間中,移除最近最少使用的 Key。推薦使用,目前項(xiàng)目在用這種。
  • allkeys-random:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時(shí),在鍵空間中,隨機(jī)移除某個(gè) Key。應(yīng)該也沒(méi)人用吧,你不刪最少使用 Key,去隨機(jī)刪。
  • volatile-lru:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時(shí),在設(shè)置了過(guò)期時(shí)間的鍵空間中,移除最近最少使用的 Key。這種情況一般是把 Redis 既當(dāng)緩存,又做持久化存儲(chǔ)的時(shí)候才用。不推薦。
  • volatile-random:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時(shí),在設(shè)置了過(guò)期時(shí)間的鍵空間中,隨機(jī)移除某個(gè) Key。依然不推薦。
  • volatile-ttl:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時(shí),在設(shè)置了過(guò)期時(shí)間的鍵空間中,有更早過(guò)期時(shí)間的 Key 優(yōu)先移除。不推薦。

PS:如果沒(méi)有設(shè)置 expire 的 Key,不滿足先決條件(prerequisites);那么 volatile-lru,volatile-random 和 volatile-ttl 策略的行為,和 noeviction(不刪除) 基本上一致。

Redis 和數(shù)據(jù)庫(kù)雙寫一致性問(wèn)題

一致性問(wèn)題是分布式常見(jiàn)問(wèn)題,還可以再分為最終一致性和強(qiáng)一致性。數(shù)據(jù)庫(kù)和緩存雙寫,就必然會(huì)存在不一致的問(wèn)題。

答這個(gè)問(wèn)題,先明白一個(gè)前提。就是如果對(duì)數(shù)據(jù)有強(qiáng)一致性要求,不能放緩存。我們所做的一切,只能保證最終一致性。

另外,我們所做的方案從根本上來(lái)說(shuō),只能說(shuō)降低不一致發(fā)生的概率,無(wú)法完全避免。因此,有強(qiáng)一致性要求的數(shù)據(jù),不能放緩存。

回答:首先,采取正確更新策略,先更新數(shù)據(jù)庫(kù),再刪緩存。其次,因?yàn)榭赡艽嬖趧h除緩存失敗的問(wèn)題,提供一個(gè)補(bǔ)償措施即可,例如利用消息隊(duì)列。

如何應(yīng)對(duì)緩存穿透和緩存雪崩問(wèn)題

這兩個(gè)問(wèn)題,說(shuō)句實(shí)在話,一般中小型傳統(tǒng)軟件企業(yè),很難碰到這個(gè)問(wèn)題。如果有大并發(fā)的項(xiàng)目,流量有幾百萬(wàn)左右。這兩個(gè)問(wèn)題一定要深刻考慮。

緩存穿透,即黑客故意去請(qǐng)求緩存中不存在的數(shù)據(jù),導(dǎo)致所有的請(qǐng)求都懟到數(shù)據(jù)庫(kù)上,從而數(shù)據(jù)庫(kù)連接異常。

緩存穿透解決方案:

  • 利用互斥鎖,緩存失效的時(shí)候,先去獲得鎖,得到鎖了,再去請(qǐng)求數(shù)據(jù)庫(kù)。沒(méi)得到鎖,則休眠一段時(shí)間重試。
  • 采用異步更新策略,無(wú)論 Key 是否取到值,都直接返回。Value 值中維護(hù)一個(gè)緩存失效時(shí)間,緩存如果過(guò)期,異步起一個(gè)線程去讀數(shù)據(jù)庫(kù),更新緩存。需要做緩存預(yù)熱(項(xiàng)目啟動(dòng)前,先加載緩存)操作。
  • 提供一個(gè)能迅速判斷請(qǐng)求是否有效的攔截機(jī)制,比如,利用布隆過(guò)濾器,內(nèi)部維護(hù)一系列合法有效的 Key。迅速判斷出,請(qǐng)求所攜帶的 Key 是否合法有效。如果不合法,則直接返回。

緩存雪崩,即緩存同一時(shí)間大面積的失效,這個(gè)時(shí)候又來(lái)了一波請(qǐng)求,結(jié)果請(qǐng)求都懟到數(shù)據(jù)庫(kù)上,從而導(dǎo)致數(shù)據(jù)庫(kù)連接異常。

緩存雪崩解決方案:

  • 給緩存的失效時(shí)間,加上一個(gè)隨機(jī)值,避免集體失效。
  • 使用互斥鎖,但是該方案吞吐量明顯下降了。
  • 雙緩存。我們有兩個(gè)緩存,緩存 A 和緩存 B。緩存 A 的失效時(shí)間為 20 分鐘,緩存 B 不設(shè)失效時(shí)間。自己做緩存預(yù)熱操作。
  • 然后細(xì)分以下幾個(gè)小點(diǎn):從緩存 A 讀數(shù)據(jù)庫(kù),有則直接返回;A 沒(méi)有數(shù)據(jù),直接從 B 讀數(shù)據(jù),直接返回,并且異步啟動(dòng)一個(gè)更新線程,更新線程同時(shí)更新緩存 A 和緩存 B。

如何解決 Redis 的并發(fā)競(jìng)爭(zhēng) Key 問(wèn)題

這個(gè)問(wèn)題大致就是,同時(shí)有多個(gè)子系統(tǒng)去 Set 一個(gè) Key。這個(gè)時(shí)候大家思考過(guò)要注意什么呢?

需要說(shuō)明一下,我提前百度了一下,發(fā)現(xiàn)答案基本都是推薦用 Redis 事務(wù)機(jī)制。

我并不推薦使用 Redis 的事務(wù)機(jī)制。因?yàn)槲覀兊纳a(chǎn)環(huán)境,基本都是 Redis 集群環(huán)境,做了數(shù)據(jù)分片操作。

你一個(gè)事務(wù)中有涉及到多個(gè) Key 操作的時(shí)候,這多個(gè) Key 不一定都存儲(chǔ)在同一個(gè) redis-server 上。因此,Redis 的事務(wù)機(jī)制,十分雞肋。

如果對(duì)這個(gè) Key 操作,不要求順序

這種情況下,準(zhǔn)備一個(gè)分布式鎖,大家去搶鎖,搶到鎖就做 set 操作即可,比較簡(jiǎn)單。

如果對(duì)這個(gè) Key 操作,要求順序

假設(shè)有一個(gè) key1,系統(tǒng) A 需要將 key1 設(shè)置為 valueA,系統(tǒng) B 需要將 key1 設(shè)置為 valueB,系統(tǒng) C 需要將 key1 設(shè)置為 valueC。

期望按照 key1 的 value 值按照 valueA > valueB > valueC 的順序變化。這種時(shí)候我們?cè)跀?shù)據(jù)寫入數(shù)據(jù)庫(kù)的時(shí)候,需要保存一個(gè)時(shí)間戳。

假設(shè)時(shí)間戳如下:

系統(tǒng)A key 1 {valueA 3:00}

系統(tǒng)B key 1 {valueB 3:05}

系統(tǒng)C key 1 {valueC 3:10}

那么,假設(shè)這會(huì)系統(tǒng) B 先搶到鎖,將 key1 設(shè)置為{valueB 3:05}。接下來(lái)系統(tǒng) A 搶到鎖,發(fā)現(xiàn)自己的 valueA 的時(shí)間戳早于緩存中的時(shí)間戳,那就不做 set 操作了,以此類推。

其他方法,比如利用隊(duì)列,將 set 方法變成串行訪問(wèn)也可以。總之,靈活變通

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容