當前位置:
首頁 > 知識 > 寫給後端程序員的 HTTP 緩存原理介紹

寫給後端程序員的 HTTP 緩存原理介紹

來源:程序員趙鑫 ,

www.cnblogs.com/xinzhao/p/5099807.html

通過Internet獲取資源既緩慢,成本又高。為此,Http協議里包含了控制緩存的部分,以使Http客戶端可以緩存和重用以前獲取的資源,從而優化性能,提升體驗。雖然Http中關於緩存控制的部分,隨著協議演進,有一些變化。但我覺著,作為後端程序員,在開發Web服務時,只需要關注請求頭If-None-Match、響應頭ETag、響應頭Cache-Control就足夠了。因為這三個Http頭就可以滿足你的需求,並且,當今絕大多數的瀏覽器,都支持這三個Http頭。我們所要做的就是,確保每個伺服器響應都提供正確的 HTTP 頭指令,以指導瀏覽器何時可以緩存響應以及可以緩存多久。

緩存在哪兒?

上圖中有三個角色,瀏覽器、Web代理和伺服器,如圖所示Http緩存存在於瀏覽器和Web代理中。當然在伺服器內部,也存在著各種緩存,但這已經不是本文要討論的Http緩存了。所謂的Http緩存控制,就是一種約定,通過設置不同的響應頭Cache-Control來控制瀏覽器和Web代理對緩存的使用策略,通過設置請求頭If-None-Match和響應頭ETag,來對緩存的有效性進行驗證。

響應頭ETag

ETag全稱Entity Tag,用來標識一個資源。在具體的實現中,ETag可以是資源的hash值,也可以是一個內部維護的版本號。但不管怎樣,ETag應該能反映出資源內容的變化,這是Http緩存可以正常工作的基礎。

如上例中所展示的,伺服器在返迴響應時,通常會在Http頭中包含一些關於響應的元數據信息,其中,ETag就是其中一個,本例中返回了值為x1323ddx的ETag。當資源/file的內容發生變化時,伺服器應當返回不同的ETag。

請求頭If-None-Match

對於同一個資源,比如上一例中的/file,在進行了一次請求之後,瀏覽器就已經有了/file的一個版本的內容,和這個版本的ETag,當下次用戶再需要這個資源,瀏覽器再次向伺服器請求的時候,可以利用請求頭If-None-Match來告訴伺服器自己已經有個ETag為x1323ddx的/file,這樣,如果伺服器上的/file沒有變化,也就是說伺服器上的/file的ETag也是x1323ddx的話,伺服器就不會再返回/file的內容,而是返回一個304的響應,告訴瀏覽器該資源沒有變化,緩存有效。

如上例中所示,在使用了If-None-Match之後,伺服器只需要很小的響應就可以達到相同的結果,從而優化了性能。

響應頭Cache-Control

每個資源都可以通過Http頭Cache-Control來定義自己的緩存策略,Cache-Control控制誰在什麼條件下可以緩存響應以及可以緩存多久。 最快的請求是不必與伺服器進行通信的請求:通過響應的本地副本,我們可以避免所有的網路延遲以及數據傳輸的數據成本。為此,HTTP 規範允許伺服器返回一系列不同的 Cache-Control 指令,控制瀏覽器或者其他中繼緩存如何緩存某個響應以及緩存多長時間。

Cache-Control 頭在 HTTP/1.1 規範中定義,取代了之前用來定義響應緩存策略的頭(例如 Expires)。當前的所有瀏覽器都支持 Cache-Control,因此,使用它就夠了。

以下我來介紹可以再Cache-Control中設置的常用指令。

max-age

該指令指定從當前請求開始,允許獲取的響應被重用的最長時間(單位為秒。例如:Cache-Control:max-age=60表示響應可以再緩存和重用 60 秒。需要注意的是,在max-age指定的時間之內,瀏覽器不會向伺服器發送任何請求,包括驗證緩存是否有效的請求,也就是說,如果在這段時間之內,伺服器上的資源發生了變化,那麼瀏覽器將不能得到通知,而使用老版本的資源。所以在設置緩存時間的長度時,需要慎重。

public和private

如果設置了public,表示該響應可以再瀏覽器或者任何中繼的Web代理中緩存,public是默認值,即Cache-Control:max-age=60等同於Cache-Control:public, max-age=60。

在伺服器設置了private比如Cache-Control:private, max-age=60的情況下,表示只有用戶的瀏覽器可以緩存private響應,不允許任何中繼Web代理對其進行緩存 – 例如,用戶瀏覽器可以緩存包含用戶私人信息的 HTML 網頁,但是 CDN 不能緩存。

no-cache

如果伺服器在響應中設置了no-cache即Cache-Control:no-cache,那麼瀏覽器在使用緩存的資源之前,必須先與伺服器確認返回的響應是否被更改,如果資源未被更改,可以避免下載。這個驗證之前的響應是否被修改,就是通過上面介紹的請求頭If-None-match和響應頭ETag來實現的。

需要注意的是,no-cache這個名字有一點誤導。設置了no-cache之後,並不是說瀏覽器就不再緩存數據,只是瀏覽器在使用緩存數據時,需要先確認一下數據是否還跟伺服器保持一致。如果設置了no-cache,而ETag的實現沒有反應出資源的變化,那就會導致瀏覽器的緩存數據一直得不到更新的情況。

no-store

如果伺服器在響應中設置了no-store即Cache-Control:no-store,那麼瀏覽器和任何中繼的Web代理,都不會存儲這次相應的數據。當下次請求該資源時,瀏覽器只能重新請求伺服器,重新從伺服器讀取資源。

怎樣決定一個資源的Cache-Control策略呢?

下面這個流程圖,可以幫到你。

Reference

https://developers.google.com/web/fundamentals/performance/optimizing-content-efficiency/http-caching?hl=zh-cn

小獵推薦

優質IT工作推薦渠道

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 程序源 的精彩文章:

通俗講解比特幣的原理及運作機制
程序員該如何向項目經理估算工時?
HTTP 協議入門
一個3年工作經驗的Web工程師的經驗之談
做程序猿的老婆應該注意的一些事情

TAG:程序源 |

您可能感興趣

詳解HTTP緩存
技術分享:HTTP緩存機制
一篇文章理解 Web 緩存
給 Web 開發者與管理員的緩存指南
CPU緩存有什麼用?科普一下關於CPU緩存的作用
Spark調優的關鍵—RDD Cache緩存使用詳解
如何區分緩存和緩衝?解釋固態硬碟SLC/DRAM緩存
HashCache:低內存緩存存儲系統
技術分享:剖析OkHttp緩存機制
NVMe SSD如何用之應用端緩存加速
清理設備垃圾功能改版,有效清理 iPhone 緩存
MyBatis中的緩存
通俗講懂固態硬碟:SSD為何要用SLC緩存
PC廠商英特爾將Optane緩存當成內存宣傳 完全是在誤導買家啊
解毒|用不完的SLC緩存?威剛XPG S11性能測試
看動畫輕鬆理解「鏈表」實現「LRU 緩存淘汰演算法」
傲騰緩存不等同於DRAM 別被英特爾和OEM廠商給忽悠瘸了
群聯E8T主控的HMB 何以會成為SSD緩存的剋星?
你真的理解 Integer 的緩存問題嗎?
瀏覽器與CDN緩存淺談