我們?cè)谑褂肸uul作為網(wǎng)關(guān)的時(shí)候,Zuul內(nèi)部集成了Hystrix實(shí)現(xiàn)熔斷保護(hù),然而Hystrix是提供了信號(hào)量隔離與線(xiàn)程隔離兩種方式,那么我們Zuul網(wǎng)關(guān)服務(wù),需要使用哪種隔離策略更好呢?我們?cè)谑褂肸uul的時(shí)候,Zuul默認(rèn)使用了信號(hào)量作為隔離方式,那為什么默認(rèn)用了信號(hào)量呢,本節(jié)我們就針對(duì)這兩種隔離策略來(lái)做一下性能測(cè)試!
性能測(cè)試目的
驗(yàn)證Zuul使用哪一種隔離策略更優(yōu),Zuul網(wǎng)關(guān)作為流量入口,理應(yīng)具備良好的響應(yīng)以及較高的吞吐量,所以為了驗(yàn)證線(xiàn)程、信號(hào)量隔離哪一種更適合Zuul網(wǎng)關(guān),本次我們就針對(duì)這兩種策略做針對(duì)實(shí)驗(yàn)。根據(jù)實(shí)驗(yàn)數(shù)據(jù)在結(jié)合自身應(yīng)用做各自的選擇!
硬件/軟件配置條件
- 硬件配置為2核4線(xiàn)程
- Zuul網(wǎng)關(guān)配置的Hystrix timer線(xiàn)程池?cái)?shù)量為4
- Zuul網(wǎng)關(guān)配置的Hystrix default線(xiàn)程池coreSize:2、maximumSize:5、maxQueueSize:1、queueSizeRejectionThreshold:1 ,maxQueueSize與queueSizeRejectionThreshold增大會(huì)明顯降低失敗率
- Zuul下游服務(wù)耗時(shí)100ms
- 性能測(cè)試軟件為Jmeter-5.4.1
- Jmeter線(xiàn)程組配置:線(xiàn)程數(shù)200、Ramp-Up時(shí)間(秒) 1、循環(huán)次數(shù)60,該參數(shù)配置為基于硬件的配置,滿(mǎn)峰值測(cè)試性能
信號(hào)量隔離性能測(cè)試
左圖為應(yīng)用性能指標(biāo),我們關(guān)注下Apdex這個(gè)指標(biāo)(滿(mǎn)意度),0.258的滿(mǎn)意度,說(shuō)明很低啊,說(shuō)明我們的請(qǐng)求響應(yīng)時(shí)間絕大多數(shù)都是大于500ms的,我們?cè)诳纯从覉D,成功與失敗的占比約為9:1,說(shuō)明在結(jié)果方面還不錯(cuò),只是時(shí)間長(zhǎng)了一點(diǎn)
針對(duì)數(shù)據(jù)分析這張圖,我們大致解釋下
- Samples=12000(總請(qǐng)求量=線(xiàn)程數(shù)200 * 循環(huán)次數(shù)60)
- FAIL失敗的數(shù)量
- Average 平均響應(yīng)時(shí)間
- Min、Max 最小 最大的響應(yīng)時(shí)間
- 90th pct 百分之90的用戶(hù)請(qǐng)求響應(yīng)時(shí)間小于這個(gè)值
- Transaction=88.10(吞吐量=總請(qǐng)求數(shù)Samples/總耗時(shí)時(shí)間),這個(gè)地方我們結(jié)合下面的響應(yīng)時(shí)間圖大概算下是不是這么多,總耗時(shí)=14:36:09(結(jié)束時(shí)間) - 14:33:55(開(kāi)始時(shí)間) = 134秒,12000/134 = 89.55,大致差不多
我們結(jié)合這張隨著時(shí)間點(diǎn)的響應(yīng)時(shí)間圖不難看出,我們的信號(hào)量整體的響應(yīng)都比較平穩(wěn),信號(hào)量模式為共用請(qǐng)求線(xiàn)程,最終會(huì)依賴(lài)容器的線(xiàn)程池管理,隨著請(qǐng)求的增多,多余的請(qǐng)求會(huì)被放到容器隊(duì)列等待執(zhí)行,所以看起來(lái)比較平穩(wěn)
線(xiàn)程隔離性能測(cè)試
因?yàn)槲覀兣渲玫腍ystrix默認(rèn)線(xiàn)程池為coreSize:2、maximumSize:5、maxQueueSize:1、queueSizeRejectionThreshold:1,最大的隊(duì)列長(zhǎng)度為1,拒絕執(zhí)行的限制條件為1,有興趣的同學(xué)可以把maxQueueSize及queueSizeRejectionThreshold參數(shù)都調(diào)整盡可能大一點(diǎn),那么相對(duì)的實(shí)驗(yàn)數(shù)據(jù)失敗率就會(huì)明顯降低,但是在峰值環(huán)境下響應(yīng)時(shí)間會(huì)更長(zhǎng)!
我們?cè)趯?duì)比下0.042的滿(mǎn)意度,約等于93%的失敗率,可以說(shuō)是饞不忍睹,相當(dāng)于Zuul網(wǎng)關(guān)不可用
針對(duì)線(xiàn)程隔離的數(shù)據(jù)分析,失敗率達(dá)到93%,響應(yīng)時(shí)間、吞吐量都率高于信號(hào)量,這個(gè)也不難看出,大量的數(shù)據(jù)都失敗了,那么相應(yīng)的響應(yīng)時(shí)間、吞吐量就要高一點(diǎn)
我們大概分析下這個(gè)分布圖,剛開(kāi)始請(qǐng)求會(huì)被放到Hystrix的線(xiàn)程池內(nèi)部執(zhí)行,此時(shí)線(xiàn)程夠用,所以響應(yīng)時(shí)間也相對(duì)要快一些,但是隨著請(qǐng)求數(shù)越來(lái)越多,相應(yīng)的Hystrix內(nèi)部的線(xiàn)程也越來(lái)越多在處于排隊(duì),整個(gè)響應(yīng)時(shí)間呈現(xiàn)斷崖式波動(dòng),最終也會(huì)導(dǎo)致越來(lái)越多的請(qǐng)求無(wú)法執(zhí)行,呈現(xiàn)出失敗率成倍增長(zhǎng),導(dǎo)致最終Zuul網(wǎng)關(guān)不可用!
性能測(cè)試結(jié)論
- Zuul網(wǎng)關(guān)層面,信號(hào)量隔離策略為首選(依賴(lài)網(wǎng)絡(luò)框架的超時(shí)機(jī)制)
- 應(yīng)用服務(wù)層面,線(xiàn)程隔離策略為首選(業(yè)務(wù)方法中不依賴(lài)網(wǎng)絡(luò)請(qǐng)求或者數(shù)據(jù)庫(kù)請(qǐng)求這樣的IO,信號(hào)量就沒(méi)有辦法控制超時(shí))