通過Internet獲取資源既緩慢,成本又高。為此,Http協(xié)議里包含了控制緩存的部分,以使Http客戶端可以緩存和重用以前獲取的資源,從而優(yōu)化性能,提升體驗。雖然Http中關(guān)于緩存控制的部分,隨著協(xié)議演進,有一些變化。但我覺著,作為后端程序員,在開發(fā)Web服務(wù)時,只需要關(guān)注請求頭If-None-Match、響應(yīng)頭ETag、響應(yīng)頭Cache-Control就足夠了。因為這三個Http頭就可以滿足你的需求,并且,當今絕大多數(shù)的瀏覽器,都支持這三個Http頭。我們所要做的就是,確保每個服務(wù)器響應(yīng)都提供正確的 HTTP 頭指令,以指導(dǎo)瀏覽器何時可以緩存響應(yīng)以及可以緩存多久。
緩存在哪兒?
上圖中有三個角色,瀏覽器、Web代理和服務(wù)器,如圖所示Http緩存存在于瀏覽器和Web代理中。當然在服務(wù)器內(nèi)部,也存在著各種緩存,但這已經(jīng)不是本文要討論的Http緩存了。所謂的Http緩存控制,就是一種約定,通過設(shè)置不同的響應(yīng)頭Cache-Control來控制瀏覽器和Web代理對緩存的使用策略,通過設(shè)置請求頭If-None-Match和響應(yīng)頭ETag,來對緩存的有效性進行驗證。
響應(yīng)頭ETag
ETag全稱Entity Tag,用來標識一個資源。在具體的實現(xiàn)中,ETag可以是資源的hash值,也可以是一個內(nèi)部維護的版本號。但不管怎樣,ETag應(yīng)該能反映出資源內(nèi)容的變化,這是Http緩存可以正常工作的基礎(chǔ)。
如上例中所展示的,服務(wù)器在返回響應(yīng)時,通常會在Http頭中包含一些關(guān)于響應(yīng)的元數(shù)據(jù)信息,其中,ETag就是其中一個,本例中返回了值為x1323ddx的ETag。當資源/file的內(nèi)容發(fā)生變化時,服務(wù)器應(yīng)當返回不同的ETag。
請求頭If-None-Match
對于同一個資源,比如上一例中的/file,在進行了一次請求之后,瀏覽器就已經(jīng)有了/file的一個版本的內(nèi)容,和這個版本的ETag,當下次用戶再需要這個資源,瀏覽器再次向服務(wù)器請求的時候,可以利用請求頭If-None-Match來告訴服務(wù)器自己已經(jīng)有個ETag為x1323ddx的/file,這樣,如果服務(wù)器上的/file沒有變化,也就是說服務(wù)器上的/file的ETag也是x1323ddx的話,服務(wù)器就不會再返回/file的內(nèi)容,而是返回一個304的響應(yīng),告訴瀏覽器該資源沒有變化,緩存有效。
如上例中所示,在使用了If-None-Match之后,服務(wù)器只需要很小的響應(yīng)就可以達到相同的結(jié)果,從而優(yōu)化了性能。
響應(yīng)頭Cache-Control
每個資源都可以通過Http頭Cache-Control來定義自己的緩存策略,Cache-Control控制誰在什么條件下可以緩存響應(yīng)以及可以緩存多久。 最快的請求是不必與服務(wù)器進行通信的請求:通過響應(yīng)的本地副本,我們可以避免所有的網(wǎng)絡(luò)延遲以及數(shù)據(jù)傳輸?shù)臄?shù)據(jù)成本。為此,HTTP 規(guī)范允許服務(wù)器返回一系列不同的 Cache-Control 指令,控制瀏覽器或者其他中繼緩存如何緩存某個響應(yīng)以及緩存多長時間。
Cache-Control 頭在 HTTP/1.1 規(guī)范中定義,取代了之前用來定義響應(yīng)緩存策略的頭(例如 Expires)。當前的所有瀏覽器都支持 Cache-Control,因此,使用它就夠了。
以下我來介紹可以再Cache-Control中設(shè)置的常用指令。
max-age
該指令指定從當前請求開始,允許獲取的響應(yīng)被重用的最長時間(單位為秒。例如:Cache-Control:max-age=60表示響應(yīng)可以再緩存和重用 60 秒。需要注意的是,在max-age指定的時間之內(nèi),瀏覽器不會向服務(wù)器發(fā)送任何請求,包括驗證緩存是否有效的請求,也就是說,如果在這段時間之內(nèi),服務(wù)器上的資源發(fā)生了變化,那么瀏覽器將不能得到通知,而使用老版本的資源。所以在設(shè)置緩存時間的長度時,需要慎重。
public和private
如果設(shè)置了public,表示該響應(yīng)可以再瀏覽器或者任何中繼的Web代理中緩存,public是默認值,即Cache-Control:max-age=60等同于Cache-Control:public, max-age=60。
在服務(wù)器設(shè)置了private比如Cache-Control:private, max-age=60的情況下,表示只有用戶的瀏覽器可以緩存private響應(yīng),不允許任何中繼Web代理對其進行緩存 - 例如,用戶瀏覽器可以緩存包含用戶私人信息的 HTML 網(wǎng)頁,但是 CDN 不能緩存。
no-cache
如果服務(wù)器在響應(yīng)中設(shè)置了no-cache即Cache-Control:no-cache,那么瀏覽器在使用緩存的資源之前,必須先與服務(wù)器確認返回的響應(yīng)是否被更改,如果資源未被更改,可以避免下載。這個驗證之前的響應(yīng)是否被修改,就是通過上面介紹的請求頭If-None-match和響應(yīng)頭ETag來實現(xiàn)的。
需要注意的是,no-cache這個名字有一點誤導(dǎo)。設(shè)置了no-cache之后,并不是說瀏覽器就不再緩存數(shù)據(jù),只是瀏覽器在使用緩存數(shù)據(jù)時,需要先確認一下數(shù)據(jù)是否還跟服務(wù)器保持一致。如果設(shè)置了no-cache,而ETag的實現(xiàn)沒有反應(yīng)出資源的變化,那就會導(dǎo)致瀏覽器的緩存數(shù)據(jù)一直得不到更新的情況。
no-store
如果服務(wù)器在響應(yīng)中設(shè)置了no-store即Cache-Control:no-store,那么瀏覽器和任何中繼的Web代理,都不會存儲這次相應(yīng)的數(shù)據(jù)。當下次請求該資源時,瀏覽器只能重新請求服務(wù)器,重新從服務(wù)器讀取資源。
怎樣決定一個資源的Cache-Control策略呢?
下面這個流程圖,可以幫到你。