HTTP協議

首先我們要明白 HTTP 是什么。HTTP 是一個基于 TCP/IP 的應用層通信協議,它是客戶端和服務端在互聯網互相通訊的標準。它定義了內容是如何通過互聯網進行請求和傳輸的。HTTP 是在應用層中抽象出的一個標準,使得主機(客戶端和服務端)之間的通信得以通過 TCP/IP 來進行請求和響應。TCP 默認使用的端口是 80,當然也可以使用其它端口,比如 HTTPS 使用的就是 443 端口。

HTTP/0.9 - 單行協議 (1991)

HTTP 最早的規范可以追溯到 1991 年,那時候的版本是 HTTP/0.9,該版本極其簡單,只有一個叫做 GET的請求方式。如果客戶端要訪問服務端上的一個頁面,只需要如下非常簡單的請求:

GET /index.html

服務端對應的返回類似如下:

(response body)

(connection closed)

就這么簡單,服務端捕獲到請求后立馬返回 HTML 并且關閉連接,在這之中

沒有頭信息headers

僅支持 GET 這一種請求方法

必須返回 HTML

如同你所看到的,當時的 HTTP 協議只是一塊基礎的墊腳石。

HTTP/1.0 - 1996

在 1996 年,新版本的 HTTP 對比之前的版本有了極大的改進,同時也被命名為 HTTP/1.0。

與 HTTP/0.9 只能返回 HTML 不同的是,HTTP/1.0 支持處理多種返回的格式,比如圖片、視頻、文本或者其他格式的文件。它還增加了更多的請求方法(如 POST 和 HEAD),請求和響應的格式也相應做了改變,兩者都增加了頭信息;引入了狀態碼來定義返回的特征;引入了字符集支持;支持多段類型multi-part、用戶驗證信息、緩存、內容編碼格式等等。

一個簡單的 HTTP/1.0 請求大概是這樣的:

GET / HTTP/1.0

Host: kamranahmed.info

User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_5)

Accept: */*

正如你所看到的,在請求中附帶了客戶端中的一些個人信息、響應類型要求等內容。這些是在 HTTP/0.9 無法實現的,因為那時候沒有頭信息。

一個對上述請求的響應例子如下所示:

HTTP/1.0 200 OK

Content-Type: text/plain

Content-Length: 137582

Expires: Thu, 05 Dec 1997 16:00:00 GMT

Last-Modified: Wed, 5 August 1996 15:55:28 GMT

Server: Apache 0.84

(response body)

(connection closed)

從 HTTP/1.0 (HTTP 后面跟的是版本號)早期開始,在狀態碼 200 之后就附帶一個原因短語(你可以用來描述狀態碼)。

在這個較新一點的版本中,請求和響應的頭信息仍然必須是 ASCII 編碼,但是響應的內容可以是任意類型,如圖片、視頻、HTML、文本或其他類型,服務器可以返回任意內容給客戶端。所以這之后,HTTP 中的“超文本Hyper Text”成了名不副實。 HMTP (超媒體傳輸協議Hypermedia transfer protocol)可能會更有意義,但是我猜我們還是會一直沿用這個名字。

HTTP/1.0 的一個主要缺點就是它不能在一個連接內擁有多個請求。這意味著,當客戶端需要從服務器獲取東西時,必須建立一個新的 TCP 連接,并且處理完單個請求后連接即被關閉。需要下一個東西時,你必須重新建立一個新的連接。這樣的壞處在哪呢?假設你要訪問一個有 10 張圖片,5 個樣式表stylesheet和 5 個 JavaScript 的總計 20 個文件才能完整展示的一個頁面。由于一個連接在處理完成一次請求后即被關閉,所以將有 20 個單獨的連接,每一個文件都將通過各自對應的連接單獨處理。當連接數量變得龐大的時候就會面臨嚴重的性能問題,因為 TCP 啟動需要經過三次握手,才能緩慢開始。

三次握手

三次握手是一個簡單的模型,所有的 TCP 連接在傳輸應用數據之前都需要在三次握手中傳輸一系列數據包。

SYN - 客戶端選取一個隨機數,我們稱為 x,然后發送給服務器。

SYN ACK - 服務器響應對應請求的 ACK 包中,包含了一個由服務器隨機產生的數字,我們稱為 y,并且把客戶端發送的 x+1,一并返回給客戶端。

ACK - 客戶端在從服務器接受到 y 之后把 y 加上 1 作為一個 ACK 包返回給服務器。

一旦三次握手完成后,客戶端和服務器之間就可以開始交換數據。值得注意的是,當客戶端發出最后一個 ACK 數據包后,就可以立刻向服務器發送應用數據包,而服務器則需要等到收到這個 ACK 數據包后才能接受應用數據包。

請注意,上圖有點小問題,客戶端發回的最后一個 ACK 包僅包含 y+1,上圖應該是 ACK:y+1 而不是 ACK:x+1,y+1

然而,某些 HTTP/1.0 的實現試圖通過新引入一個稱為 Connection: keep-alive 的頭信息來克服這一問題,這個頭信息意味著告訴服務器“嘿,服務器,請不要關閉此連接,我還要用它”。但是,這并沒有得到廣泛的支持,問題依然存在。

除了無連接之外,HTTP 還是一個無狀態的協議,即服務器不維護有關客戶端的信息。因此每個請求必須給服務器必要的信息才能完成請求,每個請求都與之前的舊的請求無關。所以,這增加了推波助瀾的作用,客戶端除了需要新建大量連接之外,在每次連接中還需要發送許多重復的數據,這導致了帶寬的大量浪費。

HTTP/1.1 - 1999

HTTP/1.0 經過僅僅 3 年,下一個版本,即 HTTP/1.1 就在 1999 年發布了,改進了它的前身很多問題,主要的改進包括:

增加了許多 HTTP 請求方法,包括 PUT、PATCH、HEAD、OPTIONS、DELETE。

主機標識符 Host 在 HTTP/1.0 并不是必須的,而在 HTTP/1.1 是必須的。

如上所述的持久連接。在 HTTP/1.0 中每個連接只有一個請求并在該請求結束后被立即關閉,這導致了性能問題和增加了延遲。 HTTP/1.1 引入了持久連接,即連接在默認情況下是不關閉并保持開放的,這允許多個連續的請求使用這個連接。要關閉該連接只需要在頭信息加入 Connection: close,客戶通常在最后一個請求里發送這個頭信息就能安全地關閉連接。

新版本還引入了“管線化pipelining”的支持,客戶端可以不用等待服務器返回響應,就能在同一個連接內發送多個請求給服務器,而服務器必須以接收到的請求相同的序列發送響應。但是你可能會問了,客戶端如何知道哪里是第一個響應下載完成而下一個響應內容開始的地方呢?要解決這個問題,頭信息必須有 Content-Length,客戶可以使用它來確定哪些響應結束之后可以開始等待下一個響應。

值得注意的是,為了從持久連接或管線化中受益, 頭部信息必須包含 Content-Length,因為這會使客戶端知道什么時候完成了傳輸,然后它可以發送下一個請求(持久連接中,以正常的依次順序發送請求)或開始等待下一個響應(啟用管線化時)。

但是,使用這種方法仍然有一個問題。那就是,如果數據是動態的,服務器無法提前知道內容長度呢?那么在這種情況下,你就不能使用這種方法中獲益了嗎?為了解決這個問題,HTTP/1.1 引進了分塊編碼。在這種情況下,服務器可能會忽略 Content-Length 來支持分塊編碼(更常見一些)。但是,如果它們都不可用,那么連接必須在請求結束時關閉。

在動態內容的情況下分塊傳輸,當服務器在傳輸開始但無法得到 Content-Length 時,它可能會開始按塊發送內容(一塊接一塊),并在傳輸時為每一個小塊添加 Content-Length。當發送完所有的數據塊后,即整個傳輸已經完成后,它發送一個空的小塊,比如設置 Content-Length 為 0 ,以便客戶端知道傳輸已完成。為了通知客戶端塊傳輸的信息,服務器在頭信息中包含了 Transfer-Encoding: chunked。

不像 HTTP/1.0 中只有 Basic 身份驗證方式,HTTP/1.1 包括摘要驗證方式digest authentication和代理驗證方式proxy authentication。

緩存。

范圍請求Byte Ranges。

字符集。

內容協商Content Negotiation。

客戶端 cookies。

支持壓縮。

新的狀態碼。

等等。

我不打算在這里討論所有 HTTP/1.1 的特性,因為你可以圍繞這個話題找到很多關于這些的討論。我建議你閱讀 HTTP/1.0 和 HTTP/1.1 版本之間的主要差異,希望了解更多可以讀原始的 RFC[1]。

HTTP/1.1 在 1999 年推出,到現在已經是多年前的標準。雖然,它比前一代改善了很多,但是網絡日新月異,它已經垂垂老矣。相比之前,加載網頁更是一個資源密集型任務,打開一個簡單的網頁已經需要建立超過 30 個連接。你或許會說,HTTP/1.1 具有持久連接,為什么還有這么多連接呢?其原因是,在任何時刻 HTTP/1.1 只能有一個未完成的連接。 HTTP/1.1 試圖通過引入管線來解決這個問題,但它并沒有完全地解決。因為一旦管線遇到了緩慢的請求或龐大的請求,后面的請求便被阻塞住,它們必須等待上一個請求完成。為了克服 HTTP/1.1 的這些缺點,開發人員開始實現一些解決方法,例如使用 spritesheets、在 CSS 中編碼圖像、單個巨型 CSS / JavaScript 文件、域名切分[2]等。

SPDY - 2009

谷歌走在業界前列,為了使網絡速度更快,提高網絡安全,同時減少網頁的等待時間,他們開始實驗替代的協議。在 2009 年,他們宣布了 SPDY。

SPDY 是谷歌的商標,而不是一個縮寫。

顯而易見的是,如果我們繼續增加帶寬,網絡性能開始的時候能夠得到提升,但是到了某個階段后帶來的性能提升就很有限了。但是如果把這些優化放在等待時間上,比如減少等待時間,將會有持續的性能提升。這就是 SPDY 優化之前的協議的核心思想,減少等待時間來提升網絡性能。

對于那些不知道其中區別的人,等待時間就是延遲,即數據從源到達目的地需要多長時間(單位為毫秒),而帶寬是每秒鐘數據的傳輸量(比特每秒)。

SPDY 的特點包括:復用、壓縮、優先級、安全性等。我不打算展開 SPDY 的細節。在下一章節,當我們將介紹 HTTP/2,這些都會被提到,因為 HTTP/2 大多特性是從 SPDY 受啟發的。

SPDY 沒有試圖取代 HTTP,它是處于應用層的 HTTP 之上的一個傳輸層,它只是在請求被發送之前做了一些修改。它開始成為事實標準,大多數瀏覽器都開始支持了。

2015年,谷歌不想有兩個相互競爭的標準,所以他們決定將其合并到 HTTP 協議,這樣就導致了 HTTP/2 的出現和 SPDY 的廢棄。

HTTP/2 - 2015

現在想必你明白了為什么我們需要另一個版本的 HTTP 協議了。 HTTP/2 是專為了低延遲地內容傳輸而設計。主要特點和與 HTTP/1.1 的差異包括:

使用二進制替代明文

多路傳輸 - 多個異步 HTTP 請求可以使用單一連接

報頭使用 HPACK 壓縮

服務器推送 - 單個請求多個響應

請求優先級

安全性

1. 二進制協議

HTTP/2 通過使其成為一個二進制協議以解決 HTTP/1.x 中存在的延遲問題。作為一個二進制協議,它更容易解析,但可讀性卻不如 HTTP/1.x。幀frames和流stream的概念組成了 HTTP/2 的主要部分。

幀和流

現在 HTTP 消息是由一個或多個幀組成的。HEADERS 幀承載了元數據meta data,DATA 幀則承載了內容。還有其他類型的幀(HEADERS、DATA、RST_STREAM、SETTINGS、PRIORITY 等等),這些你可以通過 HTTP/2 規范來了解。

每個 HTTP/2 請求和響應都被賦予一個唯一的流 ID,并切分成幀。幀就是一小片二進制數據。幀的集合稱為流,每個幀都有個標識了其所屬流的流 ID,所以在同一個流下的每個幀具有共同的報頭。值得注意的是,?除了流 ID 是唯一的之外,?由客戶端發起的請求使用了奇數作為流 ID,從來自服務器的響應使用了偶數作為流 ID。

除了 HEADERS 幀和 DATA 幀,另一個值得一提的幀是 RST_STREAM。這是一個特殊的幀類型,用來中止流,即客戶可以發送此幀讓服務器知道,我不再需要這個流了。在 HTTP/1.1 中讓服務器停止給客戶端發送響應的唯一方法是關閉連接,這樣造成了延遲增加,因為之后要發送請求時,就要必須打開一個新的請求。而在 HTTP/2,客戶端可以使用 RST_STREAM 來停止接收特定的數據流,而連接仍然打開著,可以被其他請求使用。

2. 多路傳輸

因為 HTTP/2 是一個二進制協議,而且如上所述它使用幀和流來傳輸請求與響應,一旦建立了 TCP 連接,相同連接內的所有流都可以同過這個 TCP 連接異步發送,而不用另外打開連接。反過來說,服務器也可以使用同樣的異步方式返回響應,也就是說這些響應可以是無序的,客戶端使用分配的流 ID 來識別數據包所屬的流。這也解決了 HTTP/1.x 中請求管道被阻塞的問題,即客戶端不必等待占用時間的請求而其他請求仍然可以被處理。

3. HPACK 請求頭部壓縮

RFC 花了一篇文檔的篇幅來介紹針對發送的頭信息的優化,它的本質是當我們在同一客戶端上不斷地訪問服務器時,許多冗余數據在頭部中被反復發送,有時候僅僅是 cookies 就能增加頭信息的大小,這會占用許多寬帶和增加傳輸延遲。為了解決這個問題,HTTP/2 引入了頭信息壓縮。

不像請求和響應那樣,頭信息中的信息不會以 gzip 或者 compress 等格式壓縮。而是采用一種不同的機制來壓縮頭信息,客戶端和服務器同時維護一張頭信息表,儲存了使用了哈夫曼編碼進行編碼后的頭信息的值,并且后續請求中若出現同樣的字段則忽略重復值(例如用戶代理user agent等),只發送存在兩邊信息表中它的引用即可。

我們說的頭信息,它們同 HTTP/1.1 中一樣,并在此基礎上增加了一些偽頭信息,如 :scheme,:host 和 :path。

4. 服務器推送

服務器推送是 HTTP/2 的另一個巨大的特點。對于服務器來說,當它知道客戶端需要一定的資源后,它可以把數據推送到客戶端,即使客戶端沒有請求它。例如,假設一個瀏覽器在加載一個網頁時,它解析了整個頁面,發現有一些內容必須要從服務端獲取,然后發送相應的請求到服務器以獲取這些內容。

服務器推送減少了傳輸這些數據需要來回請求的次數。它是如何做到的呢?服務器通過發送一個名字為 PUSH_PROMISE 特殊的幀通知到客戶端“嘿,我準備要發送這個資源給你了,不要再問我要了。”這個 PUSH_PROMISE 幀與要產生推送的流聯系在一起,并包含了要推送的流 ID,也就是說這個流將會被服務器推送到客戶端上。

5. 請求優先級

當流被打開的時候,客戶端可以在 HEADERS 幀中包含優先級信息來為流指定優先級。在任何時候,客戶端都可以發送 PRIORITY 幀來改變流的優先級。

如果沒有任何優先級信息,服務器將異步地無序地處理這些請求。如果流分配了優先級,服務器將基于這個優先級來決定需要分配多少資源來處理這個請求。

6. 安全性

在是否強制使用 TLS 來增加安全性的問題上產生了大范圍的討論,討論的結果是不強制使用。然而大多數廠商只有在使用 TLS 時才能使用 HTTP/2。所以 HTTP/2 雖然規范上不要求加密,但是加密已經約定俗成了。這樣,在 TLS 之上實現 HTTP/2 就有了一些強制要求,比如,TLS 的最低版本為 1.2,必須達到某種級別的最低限度的密鑰大小,需要布署 ephemeral 密鑰等等。

到現在 HTTP/2 已經完全超越了 SPDY[3],并且還在不斷成長,HTTP/2 有很多關系性能的提升,我們應該開始布署它了。

如果你想更深入的了解細節,請訪問該規范的鏈接[4]和 HTTP/2 性能提升演示的鏈接[5]。請在留言板寫下你的疑問或者評論,最后如果你發現有錯誤,請同樣留言指出。

這就是全部了,我們之后再見~

via: http://kamranahmed.info/blog/2016/08/13/http-in-depth/

作者:Kamran Ahmed[6] 譯者:NearTan[7] 校對:wxy[8]

本文由 LCTT[9] 原創編譯,Linux中國[10] 榮譽推出

[1]: https://tools.ietf.org/html/rfc2616

[2]: https://www.maxcdn.com/one/visual-glossary/domain-sharding-2/

[3]: http://caniuse.com/#search=http2

[4]: https://http2.github.io/http2-spec

[5]: http://www.http2demo.io/

[6]: http://github.com/kamranahmedse

[7]: https://github.com/NearTan

[8]: https://github.com/wxy

[9]: https://github.com/LCTT/TranslateProject

[10]: https://linux.cn/article-7811-1.html?utm_source=weixin

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,431評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,637評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,555評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,900評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,629評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,976評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,976評論 3 448
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,139評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,686評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,411評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,641評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,129評論 5 364
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,820評論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,233評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,567評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,362評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,604評論 2 380

推薦閱讀更多精彩內容