分庫(kù)分表就能無(wú)限擴(kuò)容嗎?

扎心一問(wèn):分庫(kù)分表就能無(wú)限擴(kuò)容嗎?

作者:莫那 魯?shù)?/p>

thinkinjava.cn/2019/01/15/2019-01-16-fkfb/

讓我們從最初開(kāi)始。

1、單體應(yīng)用

每個(gè)創(chuàng)業(yè)公司基本都是從類(lèi)似 SSM 和 SSH 這種架構(gòu)起來(lái)的,沒(méi)什么好講的,基本每個(gè)程序員都經(jīng)歷過(guò)。

2、RPC 應(yīng)用

當(dāng)業(yè)務(wù)越來(lái)越大,我們需要對(duì)服務(wù)進(jìn)行水平擴(kuò)容,擴(kuò)容很簡(jiǎn)單,只要保證服務(wù)是無(wú)狀態(tài)的就可以了,如下圖:

image

當(dāng)業(yè)務(wù)又越來(lái)越大,我們的服務(wù)關(guān)系錯(cuò)綜復(fù)雜,同時(shí),有很多服務(wù)訪(fǎng)問(wèn)都是不需要連接 DB 的,只需要連接緩存即可,那么就可以做成分離的,減少 DB 寶貴的連接。如下圖:

image

我相信大部分公司都是在這個(gè)階段。Dubbo 就是為了解決這個(gè)問(wèn)題而生的。分布式 | Dubbo 架構(gòu)設(shè)計(jì)詳解,這篇文章看下。

3、分庫(kù)分表

如果你的公司產(chǎn)品很受歡迎,業(yè)務(wù)繼續(xù)高速發(fā)展,數(shù)據(jù)越來(lái)越多,SQL 操作越來(lái)越慢,那么數(shù)據(jù)庫(kù)就會(huì)成為瓶頸,那么你肯定會(huì)想到分庫(kù)分表,不論通過(guò) ID hash 或者 range 的方式都可以。如下圖:

image

這下應(yīng)該沒(méi)問(wèn)題了吧。任憑你用戶(hù)再多,并發(fā)再高,我只要無(wú)限擴(kuò)容數(shù)據(jù)庫(kù),無(wú)限擴(kuò)容應(yīng)用,就可以了。關(guān)注Java技術(shù)棧微信公眾號(hào),在后臺(tái)回復(fù)關(guān)鍵字:架構(gòu),可以獲取更多棧長(zhǎng)整理的架構(gòu)技術(shù)干貨。

這也是本文的標(biāo)題,分庫(kù)分表就能解決無(wú)限擴(kuò)容嗎?

實(shí)際上,像上面的架構(gòu),并不能解決。

其實(shí),這個(gè)問(wèn)題和 RPC 的問(wèn)題有點(diǎn)類(lèi)似:數(shù)據(jù)庫(kù)連接過(guò)多!!!

通常,我們的 RPC 應(yīng)用由于是使用中間件進(jìn)行訪(fǎng)問(wèn)數(shù)據(jù)庫(kù),應(yīng)用實(shí)際上是不知道到底要訪(fǎng)問(wèn)哪個(gè)數(shù)據(jù)庫(kù)的,訪(fǎng)問(wèn)數(shù)據(jù)庫(kù)的規(guī)則由中間件決定,例如 sharding JDBC。這就導(dǎo)致,這個(gè)應(yīng)用必須和所有的數(shù)據(jù)庫(kù)連接,就像我們上面的架構(gòu)圖一樣,一個(gè) RPC 應(yīng)用需要和 3 個(gè) mysql 連接,如果是 30 個(gè) RPC 應(yīng)用,每個(gè) RPC 的數(shù)據(jù)庫(kù)連接池大小是8 ,每個(gè) mysql 需要維護(hù) 240 個(gè)連接,我們知道,mysql 默認(rèn)連接數(shù)是 100,最大連接數(shù)是 16384,也就是說(shuō),假設(shè)每個(gè)應(yīng)用的連接池大小是 8 ,超過(guò) 2048 個(gè)應(yīng)用就無(wú)法再繼續(xù)連接了,也就無(wú)法繼續(xù)擴(kuò)容了。注意,由于每個(gè)物理庫(kù)有很多邏輯庫(kù),再加上微服務(wù)運(yùn)動(dòng)如火如荼, 2048 并沒(méi)有看起來(lái)那么大。

也許你說(shuō),我可以通過(guò)前面加一個(gè) proxy 來(lái)解決連接數(shù)的問(wèn)題,實(shí)際上,代理的性能也會(huì)成為問(wèn)題,為什么?代理的連接數(shù)也是不能超過(guò) 16384 的,如果并發(fā)超過(guò) 16384,變成 163840,那么 proxy 也解決不了問(wèn)題。

怎么辦?讓我們?cè)倏纯瓷厦娴募軜?gòu)圖:

image

我們發(fā)現(xiàn),問(wèn)題是出在“每個(gè) RPC 應(yīng)用都要連所有的庫(kù)”,導(dǎo)致擴(kuò)容應(yīng)用的同時(shí),每個(gè)數(shù)據(jù)庫(kù)連接數(shù)就要增加。就算增加數(shù)據(jù)庫(kù),也不能解決連接數(shù)的問(wèn)題。

那怎么辦呢?關(guān)注Java技術(shù)棧微信公眾號(hào),在后臺(tái)回復(fù)關(guān)鍵字:架構(gòu),可以獲取更多棧長(zhǎng)整理的架構(gòu)技術(shù)干貨。

單元化

單元化,聽(tīng)起來(lái)高大上,通常在一些 XXX 大會(huì)上,分享“關(guān)于兩地三中心”,“三地五中心”,“異地多活”等等牛逼的名詞的時(shí)候,單元化也會(huì)一起出現(xiàn)。

這里我們不討論那么牛逼的,就只說(shuō)“數(shù)據(jù)庫(kù)連接數(shù)過(guò)多” 的問(wèn)題。

實(shí)際上,思路很簡(jiǎn)單:我們不讓?xiě)?yīng)用連接所有的數(shù)據(jù)庫(kù)就可以了。

假設(shè)我們根據(jù) range 分成了 10 個(gè)庫(kù),現(xiàn)在有 10 個(gè)應(yīng)用,我們讓每個(gè)應(yīng)用只連一個(gè)庫(kù),當(dāng)應(yīng)用增多變成 20個(gè),數(shù)據(jù)庫(kù)的連接不夠用了,我們就將 10 個(gè)庫(kù)分成 20 個(gè)庫(kù),這樣,無(wú)論你應(yīng)用擴(kuò)容到多少個(gè),都可以解決數(shù)據(jù)庫(kù)連接數(shù)過(guò)多的問(wèn)題。

注意:做這件事的前提是:你必須保證,訪(fǎng)問(wèn)你這個(gè)應(yīng)用的 request 請(qǐng)求的數(shù)據(jù)庫(kù)一定是在這個(gè)應(yīng)用的。s

換個(gè)說(shuō)法,當(dāng)用戶(hù)從 DNS 那里進(jìn)來(lái)的時(shí)候,就知道自己要去那個(gè)應(yīng)用了,所以,規(guī)則在 DNS 之前就定好了,雖然這有點(diǎn)夸張,但肯定在進(jìn)應(yīng)用之前就知道要去哪個(gè)庫(kù)了。

所以,這通常需要一個(gè)規(guī)則,例如通過(guò)用戶(hù) ID hash,由配置中心廣播 hash 規(guī)則。這樣,所有的組件都能保持一致的規(guī)則,從而正確的訪(fǎng)問(wèn)到數(shù)據(jù)庫(kù)。如下圖:

image

到這里,我們終于解決了無(wú)限擴(kuò)容的問(wèn)題。

最后

本文從單體應(yīng)用開(kāi)始,逐步講述了一個(gè)正常后臺(tái)的演進(jìn)歷程,知道了分庫(kù)分表并不能解決“無(wú)限擴(kuò)容” 的問(wèn)題,只有單元化才能解決這問(wèn)題。而單元化則帶來(lái)更多的復(fù)雜性。但是好處不言而喻。

單元化帶來(lái)的更多的思路。

有了單元化,解決了無(wú)限擴(kuò)容的問(wèn)題,但是我們還沒(méi)有考慮單點(diǎn)的問(wèn)題,即服務(wù)的可用性。要知道,我們這里的數(shù)據(jù)庫(kù)都是單點(diǎn)的。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容