練習(xí) 24:URL 快速路由
譯者:飛龍
協(xié)議:CC BY-NC-SA 4.0
自豪地采用谷歌翻譯
我們將結(jié)束數(shù)據(jù)結(jié)構(gòu)和算法的部分,并將數(shù)據(jù)結(jié)構(gòu)用于實際問題。我已經(jīng)寫了幾個 Web 服務(wù)器,一個不斷出現(xiàn)的問題是,將 URL 路徑匹配到“動作”。你會在每個 Web 框架,Web 服務(wù)器,和必須基于層次化的鍵來“路由”信息的任何東西中發(fā)現(xiàn)此問題。當(dāng)你的 Web 服務(wù)器收到URL /do/this/stuff/
時,必須確定每個部分是否可能附加了某種操作或配置。如果你在/do/
配置了 Web 應(yīng)用程序,那么你的網(wǎng)絡(luò)服務(wù)器應(yīng)該使用/this/stuff/
做什么呢?是否認為它是失敗的,或?qū)⑵鋫鬟f給 Web 應(yīng)用程序?如果/do/this/
中有一個目錄怎么辦?而且,如何快速檢測到錯誤的 URL,因此你不必處理不存在的巨大請求?
這種層次化的搜索經(jīng)常出現(xiàn),這是對你將算法和數(shù)據(jù)結(jié)構(gòu)應(yīng)用于問題的能力,以及性能分析能力進行測試的最佳測試。
挑戰(zhàn)練習(xí)
首先,請確定你了解 URL 是什么以及如何使用。如果沒有,那么我建議你花時間去寫一個帶有一些復(fù)雜路由的小型 Flask 應(yīng)用程序。這是你將要實現(xiàn)的路由。
接下來,你應(yīng)該執(zhí)行以下操作:
- 創(chuàng)建一個簡單的基本的
URLRouter
類,你將為所有實現(xiàn)派生它。你應(yīng)該可以對此URLRouter
執(zhí)行以下操作:- 添加一個帶有關(guān)聯(lián)對象的新 URL。
- 獲取 URL 的完全匹配。搜索
/DO/THIS/STUFF/
只返回正好是它的東西。 - 獲取 URL 的最佳匹配。搜索
/DO/THIS/STUFF/
將匹配/DO/
,如果這是唯一的匹配。 - 獲取以此 URL 開頭的所有對象。
- 獲取 URL 的最短匹配對象。搜索
/DO/THIS/STUFF/
會返回/DO/
而不是/DO/THIS/
。 - 獲取 URL 的最長匹配對象。搜索
/DO/THIS/STUFF/
將返回/DO/THIS/
而不是/DO/
。
- 使用
TSTree
創(chuàng)建URLRouter
的子類,因為這樣最容易了。確保測試了下面這些事情:- 不同長度的隨機 URL 和路徑,在
TSTREE
和你搜索的內(nèi)容里面。 - 在不同情況下只尋找部分路徑
- 完全不存在的路徑
- 不同長度的隨機 URL 和路徑,在
- 存在和不存在的非常長的路徑
- 一旦你讓這個子類工作,并測試完畢,推廣你的測試,所以你可以在所有打算完成的實現(xiàn)中運行它。
- 然后,嘗試使用
DoubleLinkedList
,BSTree
,Dictionary
和 Python 的dict
來實現(xiàn)。確保你的泛用測試適用于所有這些。 - 一旦完成了,開始分析這些實現(xiàn)的不同操作的性能。
目標(biāo)是看看與其他數(shù)據(jù)結(jié)構(gòu)相比,TSTree
有多快。它可能會擊敗大多數(shù)東西,但也許 Python dict
多數(shù)情況會贏,因為它針對 Python 進行了優(yōu)化。你甚至可以為每個操作猜測,哪個數(shù)據(jù)結(jié)構(gòu)具有最佳性能。
研究性學(xué)習(xí)
- 我省略了
SuffixArray
,因為它類似于TSTree
,但為了使用它,你必須添加相同的操作。實現(xiàn)它,然后看看SuffixArray
如何比較。 - 研究你最喜歡的 Web 服務(wù)器或 Web 框架是如何實現(xiàn)的。你會發(fā)現(xiàn)很多使用 URL 人不知道什么是三叉搜索樹,盡管它對于常見操作非常有用。
深入學(xué)習(xí)
如果你想深入了解算法和數(shù)據(jù)結(jié)構(gòu),我強烈推薦 Steven S. Skiena 的《The Algorithm Design Manual》一書。他的書使用 C,所以你可能需要先閱讀《笨辦法學(xué) C》,以便能夠瀏覽它。除此之外,它是一本很好的書,因為它涵蓋了分析算法和數(shù)據(jù)結(jié)構(gòu)的性能的理論和實現(xiàn)。