網絡協議之Http協議

1. 什么是HTTP協議?

協議是指計算機通信網絡中兩臺計算機之間進行通信所必須共同遵守的規定或規則,超文本傳輸協議(HTTP)是一種通信協議,它允許將超文本標記語言(HTML)文檔從Web服務器傳送到客戶端的瀏覽器

目前我們使用的是HTTP/1.1 版本

2. URL詳解

URL(Uniform Resource Locator) 地址用于描述一個網絡上的資源,基本格式如下
schema://host[:port#]/path/.../[;url-params][?query-string][#anchor]

關鍵字 解釋
scheme 指定低層使用的協議(例如:http, https, ftp)
host HTTP服務器的IP地址或者域名
port# 端口
path 訪問資源的路徑
url-params 這是用于指定特殊參數的可選項。
query-string 發送給http服務器的數據
anchor

舉個例子:http://www.mywebsite.com/sj/test;id=8079?name=sviergn&x=true#stuff

關鍵字 解釋
Schema http
host www.mywebsite.com
path /sj/test
URL params id=8079
Query String name=sviergn&x=true
Anchor stuff

3. HTTP協議是無狀態的

http協議是無狀態的,同一個客戶端的這次請求和上次請求是沒有對應關系,對http服務器來說,它并不知道這兩個請求來自同一個客戶端。 為了解決這個問題, Web程序引入了Cookie機制來維護狀態.

4. HTTP消息的結構

  • 先看Request消息的結構
    Request消息分為3部分,第一部分叫請求行, 第二部分叫http header, 第三部分是body.headerbody之間有個空行, 結構如下圖:
    image.png
  • 第一行中的Method表示請求方法,比如POSTGET
  • Path-to-resoure表示請求的資源,
  • Http/version-number 表示HTTP協議的版本號

當使用的是GET 方法的時候,body是為空的

  • 我們再看Response消息的結構
    Request消息的結構基本一樣。 同樣也分為三部分,第一部分叫request line, 第二部分叫request header,第三部分是body. header和body之間也有個空行, 結構如下圖:
    image.png
  • HTTP/version-number表示HTTP協議的版本號,
  • status-code 狀態碼,表示請求狀態
  • message 應答描述

5. Get和Post方法的區別

Http協議定義了很多與服務器交互的方法,最基本的有4種,分別是GET,POST,PUT,DELETE。 一個URL地址用于描述一個網絡上的資源,而HTTP中的GET, POST, PUT,DELETE就對應著對這個資源的查,改,增,刪4個操作。 我們最常見的就是GET和POST了。GET一般用于獲取/查詢資源信息,而POST一般用于更新資源信息.

  • GET和POST的區別
  1. GET提交的數據會放在URL之后,以?分割URL和傳輸數據,參數之間以&相連,如EditPosts.aspx?name=test1&id=123456. POST方法是把提交的數據放在HTTP包的Body中.
  2. GET提交的數據大小有限制(因為瀏覽器對URL的長度有限制),而POST方法提交的數據沒有限制.
  3. GET方式需要使用Request.QueryString來取得變量的值,而POST方式通過Request.Form來獲取變量的值。
  4. GET方式提交數據,會帶來安全問題,比如一個登錄頁面,通過GET方式提交數據時,用戶名和密碼將出現在URL上,如果頁面可以被緩存或者其他人可以訪問這臺機器,就可以從歷史記錄獲得該用戶的賬號和密碼.

6. 狀態碼

Response 消息中的第一行叫做狀態行,由HTTP協議版本號, 狀態碼, 狀態消息 三部分組成。狀態碼用來告訴HTTP客戶端,HTTP服務器是否產生了預期的Response。HTTP/1.1中定義了5類狀態碼, 狀態碼由三位數字組成,第一個數字定義了響應的類別

  • 1XX 提示信息 - 表示請求已被成功接收,繼續處理
  • 2XX 成功 - 表示請求已被成功接收,理解,接受
  • 3XX 重定向 - 要完成請求必須進行更進一步的處理
  • 4XX 客戶端錯誤 - 請求有語法錯誤或請求無法實現
  • 5XX 服務器端錯誤 - 服務器未能實現合法的請求

常用狀態碼:

  • 200 OK:成功返回狀態,對應,GET,PUT,PATCH,DELETE。
  • 201 created - 成功創建。
  • 302 Found:重定向,新的URL會在response中的Location中返回,瀏覽器將會使用新的URL發出新的Request。
    例如在IE中輸入http://www.google.com. HTTP服務器會返回304, IE取到Response中Location header的新URL, 又重新發送了一 個 Request.
  • 304 Not Modified:代表上次的文檔已經被緩存了, 還可以繼續使用。
  • 400 bad request - 請求格式錯誤。
  • 401 unauthorized - 未授權。
  • 403 forbidden - 鑒權成功,但是該用戶沒有權限。
  • 404 not found - 請求的資源不存在。
  • 405 method not allowed - 該http方法不被允許。
  • 410 gone - 這個url對應的資源現在不可用。
  • 415 unsupported media type - 請求類型錯誤。
  • 422 unprocessable entity - 校驗錯誤時用。
  • 429 too many request - 請求過多。
  • 500 Internal Server Error:服務器發生了不可預期的錯誤。
  • 503 Server Unavailable:服務器當前不能處理客戶端的請求,一段時間后可能恢復正常。

7. HTTP Request header

使用Fiddler 能很方便的查看Reques header, 點擊Inspectors tab -> Request tab -> headers 如下圖所示:


image.png

Cache 頭域

  • If-Modified-Since

作用: 把瀏覽器端緩存頁面的最后修改時間發送到服務器去,服務器會把這個時間與服務器上實際文件的最后修改時間進行對比。如果時間一致,那么返回304,客戶端就直接使用本地緩存文件。如果時間不一致,就會返回200和新的文件內容。客戶端接到之后,會丟棄舊文件,把新文件緩存起來,并顯示在瀏覽器中。
例如:If-Modified-Since: Thu, 09 Feb 2012 09:07:57 GMT

  • If-None-Match

作用: If-None-Match和ETag一起工作,工作原理是在HTTP Response中添加ETag信息。 當用戶再次請求該資源時,將在HTTP Request 中加入If-None-Match信息(ETag的值)。如果服務器驗證資源的ETag沒有改變(該資源沒有更新),將返回一個304狀態告訴客戶端使用本地緩存文件。否則將返回200狀態和新的資源和Etag. 使用這樣的機制將提高網站的性能

例如: If-None-Match: "03f2b33c0bfcc1:0"

  • Pragma

作用: 防止頁面被緩存, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一樣

Pargma只有一個用法, 例如: Pragma: no-cache

注意: 在HTTP/1.0版本中,只實現了Pragema:no-cache, 沒有實現Cache-Control

  • Cache-Control

作用: 這個是非常重要的規則。 這個用來指定Response-Request遵循的緩存機制。各個指令含義如下

  • Cache-Control:Public 可以被任何緩存所緩存()
  • Cache-Control:Private 內容只緩存到私有緩存中
  • Cache-Control:no-cache 所有內容都不會被緩存

還有其他的一些用法,請大家參考其他的資料

Client 頭域

  • Accept

作用: 瀏覽器端可以接受的媒體類型,
例如: Accept: text/html 代表瀏覽器可以接受服務器回發的類型為 text/html 也就是我們常說的html文檔,
如果服務器無法返回text/html類型的數據,服務器應該返回一個406錯誤(non acceptable)
通配符 * 代表任意類型

例如 Accept: / 代表瀏覽器可以處理所有類型,(一般瀏覽器發給服務器都是發這個)

  • Accept-Encoding:

作用: 瀏覽器申明自己接收的編碼方法,通常指定壓縮方法,是否支持壓縮,支持什么壓縮方法(gzip,deflate),(注意:這不是只字符編碼);

例如: Accept-Encoding: gzip, deflate

  • Accept-Language

作用: 瀏覽器申明自己接收的語言。
語言跟字符集的區別:中文是語言,中文有多種字符集,比如big5,gb2312,gbk等等;

例如: Accept-Language: en-us

  • User-Agent

作用:告訴HTTP服務器, 客戶端使用的操作系統和瀏覽器的名稱和版本.

例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

  • Accept-Charset

作用:瀏覽器申明自己接收的字符集,這就是本文前面介紹的各種字符集和字符編碼,如gb2312,utf-8(通常我們說Charset包括了相應的字符編碼方案);

例如:Cookie/Login 頭域

  • Cookie:

作用: 最重要的header, 將cookie的值發送給HTTP 服務器

Entity頭域

  • Content-Length

作用:發送給HTTP服務器數據的長度。

例如: Content-Length: 38

  • Content-Type

作用:數據類型

例如:Content-Type: application/x-www-form-urlencoded

Miscellaneous 頭域

  • Referer:

作用: 提供了Request的上下文信息的服務器,告訴服務器我是從哪個鏈接過來的,比如從我主頁上鏈接到一個朋友那里,他的服務器就能夠從HTTP Referer中統計出每天有多少用戶點擊我主頁上的鏈接訪問他的網站。

例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT

Transport 頭域

  • Connection

Connection: keep-alive 當一個網頁打開完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經建立的連接

Connection: close 代表一個Request完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接會關閉, 當客戶端再次發送Request,需要重新建立TCP連接。

  • Host(發送請求時,該報頭域是必需的)

作用: 請求報頭域主要用于指定被請求資源的Internet主機和端口號,它通常從HTTP URL中提取出來的

例如: 我們在瀏覽器中輸入:http://www.guet.edu.cn/index.html

8. HTTP Response header

同樣使用Fiddler 查看Response header, 點擊Inspectors tab ->Response tab-> headers 如下圖所示:

image.png

Cache頭域

  • Date

作用: 生成消息的具體時間和日期

例如: Date: Sat, 11 Feb 2012 11:35:14 GMT

  • Expires

作用: 瀏覽器會在指定過期時間內使用本地緩存

例如: Expires: Tue, 08 Feb 2022 11:35:14 GMT

  • Vary

作用:

例如: Vary: Accept-Encoding

image

Cookie/Login 頭域

  • P3P

作用: 用于跨域設置Cookie, 這樣可以解決iframe跨域訪問cookie的問題

例如: P3P: CP=CURa ADMa DEVa PSAo PSDo OUR BUS UNI PUR INT DEM STA PRE COM NAV OTC NOI DSP COR

  • Set-Cookie

作用: 非常重要的header, 用于把cookie 發送到客戶端瀏覽器, 每一個寫入cookie都會生成一個Set-Cookie.

例如: Set-Cookie: sc=4c31523a; path=/; domain=.acookie.taobao.com
Entity頭域

  • ETag

作用: 和If-None-Match 配合使用。 (實例請看上節中If-None-Match的實例)

例如: ETag: "03f2b33c0bfcc1:0"

  • Last-Modified:

作用: 用于指示資源的最后修改日期和時間。(實例請看上節的If-Modified-Since的實例)

例如: Last-Modified: Wed, 21 Dec 2011 09:09:10 GMT

  • Content-Type

作用:WEB服務器告訴瀏覽器自己響應的對象的類型和字符集,

例如:Content-Type: text/html; charset=utf-8

Content-Type:text/html;charset=GB2312

Content-Type: image/jpeg

  • Content-Length

指明實體正文的長度,以字節方式存儲的十進制數字來表示。在數據下行的過程中,Content-Length的方式要預先在服務器中緩存所有數據,然后所有數據再一股腦兒地發給客戶端。

例如: Content-Length: 19847

  • Content-Encoding

WEB服務器表明自己使用了什么壓縮方法(gzip,deflate)壓縮響應中的對象。

例如:Content-Encoding:gzip

  • Content-Language

作用: WEB服務器告訴瀏覽器自己響應的對象的語言者

例如: Content-Language:da
Miscellaneous 頭域

  • Server:

作用:指明HTTP服務器的軟件信息

例如:Server: Microsoft-IIS/7.5

  • X-AspNet-Version:

作用:如果網站是用ASP.NET開發的,這個header用來表示ASP.NET的版本

例如: X-AspNet-Version: 4.0.30319

  • X-Powered-By:

作用:表示網站是用什么技術開發的

例如: X-Powered-By: ASP.NET
Transport頭域

  • Connection

Connection: keep-alive 當一個網頁打開完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接不會關閉,如果客戶端再次訪問這個服務器上的網頁,會繼續使用這一條已經建立的連接
Connection: close 代表一個Request完成后,客戶端和服務器之間用于傳輸HTTP數據的TCP連接會關閉, 當客戶端再次發送Request,需要重新建立TCP連接。

Location頭域

  • Location

作用: 用于重定向一個新的位置, 包含新的URL地址

轉自: HTTP 協議詳解

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容