最近自己研究了下多路徑路由技術,一來和一個項目相關,提前預熱,為以后專業知識打基礎,二來培養自己一個新領域快速學習和總結能力。
目前網絡中路由方案大多為單路徑路由,基于給定限制尋找一條最優路徑,只有該路徑失效時才會重新計算或者選用備用路徑,這種做法有以下三個不足:
- 大部分情況下其他多數路徑都處于空閑狀態,不能很好地利用網絡資源
- 當數據量較大時,容易造成網絡擁塞
- 不能很好實現業務驅動網絡,由于業務對網絡要求不同,如帶寬、時延、丟包率等,但單路徑路由不會進行區分服務。
本文主要介紹一下兩方面的內容,一是目前主流用到的多路徑技術,包括ECMP、WCMP、OSPF-OMP,二是學術界比較有影響的多路徑思路
ECMP總結:
ECMP(等價多路徑)是一種路由技術,實現將數據包在不同的路徑上傳輸,原理相對簡單,首先計算出網絡中兩個節點的最短路徑,如果有多條等價最短路徑,則進行負載均衡,這也是ECMP最大局限性所在,表現為:首先在一個網絡中,等價最短路徑限制太強,再者將流量平均分配到不同路徑上沒有考慮到網絡實際能力,比如兩條等價最短路徑若帶寬不對稱,平均分配流量可能造成一條鏈路擁塞而另一條相對空閑。
ECMP具體實現過程
ECMP基于hash算法,主要包括以下步驟
1、 key值的生成。路由器選擇數據包的一個頭部字段(如源地址、目的地址等)通過hash算法得到一個鍵值key。
2、 查找hash表,看該鍵值落在哪個具體,該區域對應的下一跳就是該數據轉發的下一個目的地。
假如說找到四條等價最短路徑,即有四個下一跳可供選擇,分配的表大小為keyspace.size,則每個下一跳負責的區域大小為
regionsize = keyspace.size / #{nexthops}
區域序號為:
region = key / regionsize;
由此找出了對應的下一跳地址。
值得注意的是,ECMP只是實現了粗粒度的控制,每個流走的路徑是一樣的,不存在數據包重新排序問題,細粒度的負載均衡是基于數據包。值得進一步思考的是當端口失效或者新加一條通路時重排序問題。在文獻[1]中有提到。ECMP原理在OSPF中使用。
WCMP
Weighted Cost Multipathing ,為了解決數據中心流量負載均衡問題而提出[2],主要針對ECMP存在的問題進行了改善
如圖,簡單解釋下,將數據從S10發送到S12,利用ECMP,即流量在各個出口鏈路上平均分配,但實際到S20有兩條上行鏈路而到S12只有一條下行鏈路,導致S20,S21,S22下行數據不公平,不能很好利用資源。若在各個鏈路上采取 1:1:2:2分配,即WCMP原則,實現流量的平均分配。
WCMP實現原理
0-3為ECMP等價選路,4-15為WCMP按權重分配。
multipath TCP
同時打開多個 TCP 會話,這種方式將數據分成多個部分,然后每個會話發送其中的部分。有效開放多個并行的 TCP 會話,為MulTCP,在一個 TCP 會話模擬多個并行的 TCP 會話的行為。這些行為為并行的 TCP 會話假設相同的端點幾相同的端到端網絡路徑。一個使用多個并行會話的 TCP 進化,但試圖通過網絡以多種路徑傳輸這些會話,這就是多路徑 TCP。
參考文獻:
[1] Hopps C E. Analysis of an equal-cost multi-path algorithm[J]. 2000.
[2] Zhou J, Tewari M, Zhu M, et al. WCMP: Weighted cost multipathing for improved fairness in data centers[C]//Proceedings of the Ninth European Conference on Computer Systems. ACM, 2014: 5.
[3] https://www.oschina.net/translate/mptcp
[4] He J, Rexford J. Toward internet-wide multipath routing[J]. IEEE network, 2008, 22(2).