BitTorrent DHT 協議中文翻譯

前言

做了一個磁力鏈接和BT種子的搜索引擎 {Magnet & Torrent}，因此把 DHT 協議重新看了一遍。

原文：DHT Protocol
譯文：BitTorrent DHT 協議中文翻譯

BitTorrent 使用"分布式哈希表"(DHT)來為無 tracker 的種子(torrents)存儲 peer 之間的聯系信息。這樣每個 peer 都成了 tracker。這個協議基于 Kademila[1] 網絡并且在 UDP 上實現。

請注意本文檔中使用的術語，以免混亂。

"peer" 是在一個 TCP 端口上監聽的客戶端/服務器，它實現了 BitTorrent 協議。
"節點" 是在一個 UDP 端口上監聽的客戶端/服務器，它實現了 DHT(分布式哈希表) 協議。

DHT 由節點組成，它存儲了 peer 的位置。BitTorrent 客戶端包含一個 DHT 節點，這個節點用來聯系 DHT 中其他節點，從而得到 peer 的位置，進而通過 BitTorrent 協議下載。

概述 Overview

每個節點有一個全局唯一的標識符，作為 "node ID"。節點 ID 是一個隨機選擇的 160bit 空間，BitTorrent infohash[2] 也使用這樣的 160bit 空間。

"距離"用來比較兩個節點 ID 之間或者節點 ID 和 infohash 之間的"遠近"。節點必須維護一個路由表，路由表中含有一部分其它節點的聯系信息。其它節點距離自己越近時，路由表信息越詳細。因此每個節點都知道 DHT 中離自己很"近"的節點的聯系信息，而離自己非常遠的 ID 的聯系信息卻知道的很少。

在 Kademlia 網絡中，距離是通過異或(XOR)計算的，結果為無符號整數。distance(A, B) = |A xor B|，值越小表示越近。

當節點要為 torrent 尋找 peer 時，它將自己路由表中的節點 ID 和 torrent 的 infohash 進行"距離對比"。然后向路由表中離 infohash 最近的節點發送請求，問它們正在下載這個 torrent 的 peer 的聯系信息。如果一個被聯系的節點知道下載這個 torrent 的 peer 信息，那個 peer 的聯系信息將被回復給當前節點。否則，那個被聯系的節點則必須回復在它的路由表中離該 torrent 的 infohash 最近的節點的聯系信息。最初的節點重復地請求比目標 infohash 更近的節點，直到不能再找到更近的節點為止。查詢完了之后，客戶端把自己作為一個 peer 插入到所有回復節點中離種子最近的那個節點中。

請求 peer 的返回值包含一個不透明的值，稱之為"令牌(token)"。如果一個節點宣布它所控制的 peer 正在下載一個種子，它必須在回復請求節點的同時，附加上對方向我們發送的最近的"令牌(token)"。這樣當一個節點試圖"宣布"正在下載一個種子時，被請求的節點核對令牌和發出請求的節點的 IP 地址。這是為了防止惡意的主機登記其它主機的種子。由于令牌僅僅由請求節點返回給收到令牌的同一個節點，所以沒有規定他的具體實現。但是令牌必須在一個規定的時間內被接受，超時后令牌則失效。在 BitTorrent 的實現中，token 是在 IP 地址后面連接一個 secret(可以視為一個隨機數)，這個 secret 每五分鐘改變一次，其中 token 在十分鐘以內是可接受的。

路由表 Routing Table

每一個節點維護一個路由表保存已知的好節點。路由表中的節點是用來作為在 DHT 中請求的起始點。路由表中的節點是在不斷的向其他節點請求過程中，對方節點回復的。

并不是我們在請求過程中收到得節點都是平等的，有的節點是好的，而另一些則不是。許多使用 DHT 協議的節點都可以發送請求并接收回復，但是不能主動回復其他節點的請求。節點的路由表只包含已知的好節點，這很重要。好節點是指在過去的 15 分鐘以內，曾經對我們的某一個請求給出過回復的節點，或者曾經對我們的請求給出過一個回復(不用在15分鐘以內)，并且在過去的 15 分鐘給我們發送過請求。上述兩種情況都可將節點視為好節點。在 15 分鐘之后，對方沒有上述 2 種情況發生，這個節點將變為可疑的。當節點不能給我們的一系列請求給出回復時，這個節點將變為壞的。相比那些未知狀態的節點，已知的好節點會被給于更高的優先級。

路由表覆蓋從 0 到 2^160 全部的節點 ID 空間。路由表又被劃分為桶(桶s)，每個桶包含一部分的 ID 空間。空的路由表只有一個桶，它的 ID 范圍從 min=0 到 max=2^160。當 ID 為 N 的節點插入到表中時，它將被放到 ID 范圍在 min <= N < max 的桶中。空的路由表只有一個桶所以所有的節點都將被放到這個桶中。每一個桶最多只能保存 K 個節點，當前 K=8。當一個桶放滿了好節點之后，將不再允許新的節點加入，除非我們自身的節點ID在這個桶的范圍內。在這樣的情況下，這個桶將被分裂為 2 個新的桶，每一個新桶的范圍都是原來舊桶的一半。原來舊桶中的節點將被重新分配到這兩個新的桶中。如果一個新表只有一個桶，這個包含整個范圍的桶將總被分裂為 2 個新的桶，第一個的覆蓋范圍從 0..2^159 和 2^159..2160。

當桶裝滿了好節點，新的節點會被丟棄。一旦桶中的某一個節點變為了壞的節點，那么我們就用新的節點來替換這個壞的節點。如果桶中有在 15 分鐘內都沒有活躍過的節點，我們將這樣的節點視為可疑的節點，這時我們向最久沒有聯系的節點發送 ping。如果被 ping 的節點給出了回復，那么我們向下一個可疑的節點發送 ping，不斷這樣循環下去，直到有某一個節點沒有給出 ping 的回復，或者當前桶中的所有節點都是好的(也就是所有節點都不是可疑節點，他們在過去 15 分鐘內都有活動)。如果桶中的某個節點沒有對我們的 ping 給出回復，我們最好再試一次(再發送一次 ping，因為這個節點也許仍然是活躍的，但由于網絡擁塞，所以發生了丟包現象，注意 DHT 的包都是 UDP 的)，而不是立即丟棄這個節點或者直接用新節點來替代它。這樣，我們得路由表將充滿穩定的長時間在線的節點。

每一個桶都應該維持一個 lastchange 字段來表明桶中節點的"新鮮"度。當桶中的節點被 ping 并給出了回復，或者一個節點被加入到了桶，或者一個節點被一個新的節點所替代，桶的 lastchange 字段都應當被更新。如果一個桶的 lastchange 在過去的 15 分鐘內都沒有變化，那么我們將更新它。這個更新桶操作是這樣完成的：從這個桶所覆蓋的范圍中隨機選擇一個 ID，并對這個 ID 執行 find_nodes 查找操作。常常收到請求的節點通常不需要常常更新自己的桶，反之，不常常收到請求的節點常常需要周期性的執行更新所有桶的操作，這樣才能保證當我們用到 DHT 的時候，里面有足夠多的好的節點。

在插入第一個節點到路由表并啟動服務后，這個節點應試著查找 DHT 中離自己更近的節點，這個查找工作是通過不斷的發出 find_node 消息給越來越近的節點來完成的，當不能找到更近的節點時，這個擴散工作就結束了。路由表應當被啟動工作和客戶端軟件保存（也就是啟動的時候從客戶端中讀取路由表信息，結束的時候客戶端軟件記錄到文件中）。

BitTorrent 協議擴展 BitTorrent Protocol Extension

BitTorrent 協議已經被擴展為可以在通過 tracker 得到的 peer 之間互相交換節點的 UDP 端口號(也就是告訴對方我們的 DHT 服務端口號)，在這樣的方式下，客戶端可以通過下載普通的種子文件來自動擴展 DHT 路由表。新安裝的客戶端第一次試著下載一個無 tracker 的種子時，它的路由表中將沒有任何節點，這是它需要在 torrent 文件中找到聯系信息。

peers 如果支持 DHT 協議就將 BitTorrent 協議握手消息的保留位的第 8 字節的最后一位置為 1。這時如果 peer 收到一個 handshake 表明對方支持 DHT 協議，就應該發送 PORT 消息。它由字節 0x09 開始，payload 的長度是 2 個字節，包含了這個 peer 的 DHT 服務使用的網絡字節序的 UDP 端口號。當 peer 收到這樣的消息是應當向對方的 IP 和消息中指定的端口號的節點發送 ping。如果收到了 ping 的回復，那么應當使用上述的方法將新節點的聯系信息加入到路由表中。

Torrent 文件擴展 Torrent File Extensions

一個無 tracker 的 torrent 文件字典不包含 announce 關鍵字，而使用一個 nodes 關鍵字來替代。這個關鍵字對應的內容應該設置為 torrent 創建者的路由表中 K 個最接近的節點。可供選擇的，這個關鍵字也可以設置為一個已知的可用節點，比如這個 torrent 文件的創建者。請不要自動加入 router.bittorrent.com 到 torrent 文件中或者自動加入這個節點到客戶端路由表中。


nodes = [["", ], ["", ], ...]

nodes = [["127.0.0.1", 6881], ["your.router.node", 4804]]

KRPC協議 KRPC Protocol

KRPC 協議是由 bencode 編碼組成的一個簡單的 RPC 結構，他使用 UDP 報文發送。一個獨立的請求包被發出去然后一個獨立的包被回復。這個協議沒有重發。它包含 3 種消息：請求，回復和錯誤。對DHT協議而言，這里有 4 種請求：ping，find_node，get_peers 和 announce_peer。

一條 KRPC 消息由一個獨立的字典組成，其中有 2 個關鍵字是所有的消息都包含的，其余的附加關鍵字取決于消息類型。每一個消息都包含 t 關鍵字，它是一個代表了 transaction ID 的字符串類型。transaction ID 由請求節點產生，并且回復中要包含回顯該字段，所以回復可能對應一個節點的多個請求。transaction ID 應當被編碼為一個短的二進制字符串，比如 2 個字節，這樣就可以對應 2^16 個請求。另一個每個 KRPC 消息都包含的關鍵字是 y，它由一個字節組成，表明這個消息的類型。y 對應的值有三種情況：q 表示請求，r 表示回復，e 表示錯誤。

聯系信息編碼 Contact Encoding

Peers 的聯系信息被編碼為 6 字節的字符串。又被稱為 "CompactIP-address/port info"，其中前 4 個字節是網絡字節序的 IP 地址，后 2 個字節是網絡字節序的端口。

節點的聯系信息被編碼為 26 字節的字符串。又被稱為 "Compactnode info"，其中前 20 字節是網絡字節序的節點 ID，后面 6 個字節是 peers 的 "CompactIP-address/port info"。

請求 Queries

請求，對應于 KPRC 消息字典中的 y 關鍵字的值是 q，它包含 2 個附加的關鍵字 q 和 a。關鍵字 q 是一個字符串類型，包含了請求的方法名字。關鍵字 a 一個字典類型包含了請求所附加的參數。

回復 Responses

回復，對應于 KPRC 消息字典中的 y 關鍵字的值是 r，包含了一個附加的關鍵字 r。關鍵字 r 是一個字典類型，包含了返回的值。發送回復消息是在正確解析了請求消息的基礎上完成的。

錯誤 Errors

錯誤，對應于 KPRC 消息字典中的 y 關鍵字的值是 e，包含一個附加的關鍵字 e。關鍵字e` 是一個列表類型。第一個元素是一個數字類型，表明了錯誤碼。第二個元素是一個字符串類型，表明了錯誤信息。當一個請求不能解析或出錯時，錯誤包將被發送。下表描述了可能出現的錯誤碼：

錯誤碼描述
201 一般錯誤
202 服務錯誤
203 協議錯誤，比如不規范的包，無效的參數，或者錯誤的 token
204 未知方法

錯誤包例子 Example Error Packets:


generic error = {"t":"aa", "y":"e", "e":[201, "A Generic Error Ocurred"]}

bencoded = d1:eli201e23:A Generic Error Ocurrede1:t2:aa1:y1:ee

DHT 請求 DHT Queries

所有的請求都包含一個關鍵字 id，它包含了請求節點的節點 ID。所有的回復也包含關鍵字id，它包含了回復節點的節點 ID。

ping

最基礎的請求就是 ping。這時 KPRC 協議中的 "q" = "ping"。Ping 請求包含一個參數 id，它是一個 20 字節的字符串包含了發送者網絡字節序的節點 ID。對應的 ping 回復也包含一個參數 id，包含了回復者的節點 ID。

參數: {"id" : ""}
回復: {"id" : ""}

報文包例子 Example Packets

ping Query = {"t":"aa", "y":"q", "q":"ping", "a":{"id":"abcdefghij0123456789"}}
bencoded = d1:ad2:id20:abcdefghij0123456789e1:q4:ping1:t2:aa1:y1:qe
Response = {"t":"aa", "y":"r", "r": {"id":"mnopqrstuvwxyz123456"}}
bencoded = d1:rd2:id20:mnopqrstuvwxyz123456e1:t2:aa1:y1:re

find_node

find_node 被用來查找給定 ID 的節點的聯系信息。這時 KPRC 協議中的 "q" == "find_node"。find_node 請求包含 2 個參數，第一個參數是 id，包含了請求節點的ID。第二個參數是 target，包含了請求者正在查找的節點的 ID。當一個節點接收到了 find_node 的請求，他應該給出對應的回復，回復中包含 2 個關鍵字 id 和 nodes，nodes 是一個字符串類型，包含了被請求節點的路由表中最接近目標節點的 K(8) 個最接近的節點的聯系信息。

參數: {"id" : "", "target" : ""}
回復: {"id" : "", "nodes" : ""}

報文包例子 Example Packets

find_node Query = {"t":"aa", "y":"q", "q":"find_node", "a": {"id":"abcdefghij0123456789", "target":"mnopqrstuvwxyz123456"}}

bencoded = d1:ad2:id20:abcdefghij01234567896:target20:mnopqrstuvwxyz123456e1:q9:find_node1:t2:aa1:y1:qe

Response = {"t":"aa", "y":"r", "r": {"id":"0123456789abcdefghij", "nodes": "def456..."}}

bencoded = d1:rd2:id20:0123456789abcdefghij5:nodes9:def456...e1:t2:aa1:y1:re

get_peers

get_peers 與 torrent 文件的 infohash 有關。這時 KPRC 協議中的 "q" = "get_peers"。get_peers 請求包含 2 個參數。第一個參數是 id，包含了請求節點的 ID。第二個參數是 info_hash，它代表 torrent 文件的 infohash。如果被請求的節點有對應 info_hash 的 peers，他將返回一個關鍵字 values,這是一個列表類型的字符串。每一個字符串包含了 "CompactIP-address/portinfo" 格式的 peers 信息。如果被請求的節點沒有這個 infohash 的 peers，那么他將返回關鍵字 nodes，這個關鍵字包含了被請求節點的路由表中離 info_hash 最近的 K 個節點，使用 "Compactnodeinfo" 格式回復。在這兩種情況下，關鍵字 token 都將被返回。token 關鍵字在今后的 annouce_peer 請求中必須要攜帶。token 是一個短的二進制字符串。

參數: {"id" : "", "info_hash" : "<20-byte infohash of target torrent>"}
回復: {"id" : "", "token" :"", "values" : ["", ""]}
或: {"id" : "", "token" :"", "nodes" : ""}

報文包例子 Example Packets:

get_peers Query = {"t":"aa", "y":"q", "q":"get_peers", "a": {"id":"abcdefghij0123456789", "info_hash":"mnopqrstuvwxyz123456"}}

bencoded = d1:ad2:id20:abcdefghij01234567899:info_hash20:mnopqrstuvwxyz123456e1:q9:get_peers1:t2:aa1:y1:qe

Response with peers = {"t":"aa", "y":"r", "r": {"id":"abcdefghij0123456789", "token":"aoeusnth", "values": ["axje.u", "idhtnm"]}}

bencoded = d1:rd2:id20:abcdefghij01234567895:token8:aoeusnth6:valuesl6:axje.u6:idhtnmee1:t2:aa1:y1:re

Response with closest nodes = {"t":"aa", "y":"r", "r": {"id":"abcdefghij0123456789", "token":"aoeusnth", "nodes": "def456..."}}

bencoded = d1:rd2:id20:abcdefghij01234567895:nodes9:def456...5:token8:aoeusnthe1:t2:aa1:y1:re

announce_peer

這個請求用來表明發出 announce_peer 請求的節點，正在某個端口下載 torrent 文件。announce_peer 包含 4 個參數。第一個參數是 id，包含了請求節點的 ID；第二個參數是 info_hash，包含了 torrent 文件的 infohash；第三個參數是 port 包含了整型的端口號，表明 peer 在哪個端口下載；第四個參數數是 token，這是在之前的 get_peers 請求中收到的回復中包含的。收到 announce_peer 請求的節點必須檢查這個 token 與之前我們回復給這個節點 get_peers 的 token 是否相同。如果相同，那么被請求的節點將記錄發送 announce_peer 節點的 IP 和請求中包含的 port 端口號在 peer 聯系信息中對應的 infohash 下。

參數:

{
"id" : "",
"implied_port": <0 or 1>,
"info_hash" : "<20-byte infohash of target torrent>",
"port" : ,
"token" : ""
}

回復: {"id" : ""}

報文包例子 Example Packets:

announce_peers Query = {"t":"aa", "y":"q", "q":"announce_peer", "a": {"id":"abcdefghij0123456789", "implied_port": 1, "info_hash":"mnopqrstuvwxyz123456", "port": 6881, "token": "aoeusnth"}}

bencoded = d1:ad2:id20:abcdefghij01234567899:info_hash20:

mnopqrstuvwxyz1234564:porti6881e5:token8:aoeusnthe1:q13:announce_peer1:t2:aa1:y1:qe

Response = {"t":"aa", "y":"r", "r": {"id":"mnopqrstuvwxyz123456"}}

bencoded = d1:rd2:id20:mnopqrstuvwxyz123456e1:t2:aa1:y1:re

References

[1] Peter Maymounkov, David Mazieres, "Kademlia: A Peer-to-peer Information System Based on the XOR Metric", IPTPS 2002.
[2] Use SHA1 and plenty of entropy to ensure a unique ID.

Copyright

This document has been placed in the public domain.

最后編輯于：2017.11.27 00:37:07

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,363評論 6贊 532
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,497評論 3贊 416
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,305評論 0贊 374
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,962評論 1贊 311
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,727評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,193評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,257評論 3贊 441
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,411評論 0贊 288
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,945評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,777評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,978評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,519評論 5贊 359
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,216評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,642評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,878評論 1贊 286
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,657評論 3贊 391
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,960評論 2贊 373

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

BitTorrent DHT 協議中文翻譯

BitTorrent DHT 協議中文翻譯

前言

概述 Overview

路由表 Routing Table

BitTorrent 協議擴展 BitTorrent Protocol Extension

Torrent 文件擴展 Torrent File Extensions

KRPC協議 KRPC Protocol

聯系信息編碼 Contact Encoding

請求 Queries

回復 Responses

錯誤 Errors

錯誤包例子 Example Error Packets:

DHT 請求 DHT Queries

ping

報文包例子 Example Packets

find_node

報文包例子 Example Packets

get_peers

報文包例子 Example Packets:

announce_peer

報文包例子 Example Packets:

References

Copyright

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

BitTorrent DHT 協議中文翻譯

前言

概述 Overview

路由表 Routing Table

BitTorrent 協議擴展 BitTorrent Protocol Extension

Torrent 文件擴展 Torrent File Extensions

KRPC協議 KRPC Protocol

聯系信息編碼 Contact Encoding

請求 Queries

回復 Responses

錯誤 Errors

錯誤包例子 Example Error Packets:

DHT 請求 DHT Queries

ping

報文包例子 Example Packets

find_node

報文包例子 Example Packets

get_peers

報文包例子 Example Packets:

announce_peer

報文包例子 Example Packets:

References

Copyright

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频