本文摘自http://blog.csdn.net/guwei9111986/article/details/51649240
伴隨著微服務架構被宣傳得如火如荼,一些概念也被推到了我們面前(管你接受不接受),其實大多數概念以前就有,但很少被提的這么頻繁(現在好像不提及都不好意思交流了)。想起有人總結的一句話,微服務架構的特點就是:“一解釋就懂,一問就不知,一討論就吵架”。
其實對老外的總結能力一直特別崇拜,Kevin Kelly、Martin Fowler、Werner Vogels……,都是著名的“演講家”。正好這段時間看了些微服務、容器的相關資料,也在我們新一代產品中進行了部分實踐,回過頭來,再來談談對一些概念的理解。
今天先來說說“服務熔斷”和“服務降級”。為什么要說這個呢,因為我很長時間里都把這兩個概念同質化了,不知道這兩個詞大家怎么理解,一個意思or有所不同?現在的我是這么來看的:
- 在股票市場,熔斷這個詞大家都不陌生,是指當股指波幅達到某個點后,交易所為控制風險采取的暫停交易措施。相應的,服務熔斷一般是指軟件系統中,由于某些原因使得服務出現了過載現象,為防止造成整個系統故障,從而采用的一種保護措施,所以很多地方把熔斷亦稱為過載保護。
- 大家都見過女生旅行吧,大號的旅行箱是必備物,平常走走近處綽綽有余,但一旦出個遠門,再大的箱子都白搭了,怎么辦呢?常見的情景就是把物品拿出來分分堆,比了又比,最后一些非必需品的就忍痛放下了,等到下次箱子夠用了,再帶上用一用。而服務降級,就是這么回事,整體資源快不夠了,忍痛將某些服務先關掉,待渡過難關,再開啟回來。
所以從上述分析來看,兩者其實從有些角度看是有一定的類似性的:
- 目的很一致,都是從可用性可靠性著想,為防止系統的整體緩慢甚至崩潰,采用的技術手段;
- 最終表現類似,對于兩者來說,最終讓用戶體驗到的是某些功能暫時不可達或不可用;
- 粒度一般都是服務級別,當然,業界也有不少更細粒度的做法,比如做到數據持久層(允許查詢,不允許增刪改);
- 自治性要求很高,熔斷模式一般都是服務基于策略的自動觸發,降級雖說可人工干預,但在微服務架構下,完全靠人顯然不可能,開關預置、配置中心都是必要手段;
而兩者的區別也是明顯的:
- 觸發原因不太一樣,服務熔斷一般是某個服務(下游服務)故障引起,而服務降級一般是從整體負荷考慮;
- 管理目標的層次不太一樣,熔斷其實是一個框架級的處理,每個微服務都需要(無層級之分),而降級一般需要對業務有層級之分(比如降級一般是從最外圍服務開始)
- 實現方式不太一樣,這個區別后面會單獨來說;
當然這只是我個人對兩者的理解,外面把兩者歸為完全一致的也不在少數,或者把熔斷機制理解為應對降級目標的一種實現也說的過去,可能“一討論就吵架”也正是這個原因吧!概念算是說完了,避免空談,我再總結下對常用的實現方法的理解。對于這兩個概念,號稱支持的框架可不少,Hystrix當屬其中的佼佼者。先說說最裸的熔斷器的設計思路,下面這張圖大家應該不陌生(我只是參考著又畫了畫),簡明扼要的給出了好的熔斷器實現的三個狀態機:
- Closed:熔斷器關閉狀態,調用失敗次數積累,到了閾值(或一定比例)則啟動熔斷機制;
- Open:熔斷器打開狀態,此時對下游的調用都內部直接返回錯誤,不走網絡,但設計了一個時鐘選項,默認的時鐘達到了一定時間(這個時間一般設置成平均故障處理時間,也就是MTTR),到了這個時間,進入半熔斷狀態;
- Half-Open:半熔斷狀態,允許定量的服務請求,如果調用都成功(或一定比例)則認為恢復了,關閉熔斷器,否則認為還沒好,又回到熔斷器打開狀態;
那Hystrix,作為Netflix開源框架中的最受喜愛組件之一,是怎么處理依賴隔離,實現熔斷機制的呢,他的處理遠比我上面說個實現機制復雜的多,一起來看看核心代碼吧,我只保留了代碼片段的關鍵部分: