HTTP/1.x 協議是一個文本協議,可讀性非常好,但是并不高效
解析
- 解析一個完整的 HTTP 請求,首先要正確讀出 HTTP header。HTTP header 各個 fields 使用
\r\n
分隔,然后跟 body 之間使用\r\n\r\n
分隔。解析完 header 之后,才能從 header 里面的content-length
拿到 body 的 size , 從而讀取 body - 這套流程其實并不高效,因為我們要讀取多次,才能將一個完整的 HTTP 請求給解析出來,雖然在代碼上有很多的優化方法:
- 一次將一大塊數據讀取到 buffer 里面,避免多次 IO 開銷
- 讀取的時候直接匹配
\r\n
的方式流式解析
- 主要問題在于, HTTP/1.x 協議是一個文本協議,是給人看的,對機器并不友好,二進制才是更好的選擇
Request/Response
- HTTP/1.x 另一個問題就在于它的交互模式,一個連接每次只能一問一答,也就是client 發送了 request 之后,必須等到 response,才能繼續發送下一次請求。
- 這套機制是非常簡單,但會造成網絡連接利用率不高。如果需要同時進行大量的交互,client 需要跟 server 建立多條連接,但連接的建立也是有開銷的,所以為了性能,通常這些連接都是長連接一直保活的,雖然對于 server 來說同時處理百萬連接也沒啥太大的挑戰,但終歸效率不高。
Push
- HTTP/1.x 并沒有推送機制。所以通常兩種做法:
- Long polling 方式,也就是直接給 server 掛一個連接,等待一段時間(譬如 1 分鐘),如果 server 有返回或者超時,則再次重新 poll。
- Web-socket,通過 upgrade 機制顯式的將這條 HTTP 連接變成裸的 TCP,進行雙向交互