Http缓存了解多少

335 阅读5分钟

重用已获取的资源能够有效的提升网站与应用性能wang。Web缓存能够减少延迟与网络堵塞,进而减少显示某个资源所用的时间。借助Http缓存,web站点更有响应性。

1. 浏览器发起请求(携带Cache-Control),先会去本地查看缓存是否有缓存并且命中,加入 有就直接返回缓存资源,反之则转向代理服务器。

2. 代理服务器去查找相关的缓存设置,如s-maxage,以及该资源是否有缓存,反之则到达源 服务器;

** 3**.到达源服务器后,源服务器会返回资源新文件,然后一步步返回。

这大概就是缓存最粗糙的一个基本流程,接下来我们一步步浅析缓存原理。

Cache-Control

Cache-Control 缓存特性

我们一开始看到表格可能会吓一跳,仅仅是一个Cache-Control就几乎有那么多指令。但是实际上,我们可以分为特性模块来看,我们自然就会清晰很多。

可缓存性

  • public:就是该Http所请求的内容,无论是经过代理服务器还是客户端,都可以对该请求进行缓存,都可以对该请求进行缓存。
  • private:只有发起请求的浏览器才可以进行缓存,而代理服务器则不可以。
  • no-cache:这里的意思是可以缓存,但是在缓存之前不管过没过期,都需要向原服务器进行资源有效性验证。

过期性

  • max-age:该缓存什么时候到期
  • s-maxage:在代理服务器中,如果我们设置了max-age,以及s-maxage,那么代理就会读取s-maxage,因为该指令是专门为代理服务器而存在的。

重新验证

  • must-revalidate:假如还没有到过期时间,那么可以使用缓存资源:反之就必须到源服务器进行有效检验;
  • proxy-revalidate:同must-revalidate,只是proxy-revalidate用在缓存服务器;

Expires

Cache-Control可以控制资源缓存状态之外,还有Expires,它是http1.0的产物,但是还是有很多地方用到它。它跟Cache-Control中的max-age有什么区别呢?

  • 表达方式:Expires是绝对时间,如Expires:Tue Jul 09 2019 23:13:28 GMT+0800,而max-age是相对时间,如max-age=3600;
  • 协议版本:Expires是HTTP1.0版本首部字段,而max-age是版本HTTP1.1版本及其之后的首部字段
  • 优先级:当请求协议版本为HTTP1.0时,同时存在Expires和max-age会无视max-age,当请求协议版本为HTTP1.1则会优先处理max-age指令;

除此之外,它们使用方法时是一样的,因此我们就不在演示了,他们就是用来校验强缓存的标识。

缓存校验 Last-Modified &ETag

last-Modified

顾名思义,上次修改时间。主要配件If-Modified-Since或者If-Unmodified-Sice。

基本流程

  1. 首次请求资源,服务器返回资源时带上实体首部字段Last-Modified;
  2. 当我们再次请求资源,浏览器会自动在请求头带上首部字段IF-Modified-since,此时的If-Modified等于Last-Modeified
  3. 服务器接收到请求后会根据IF-Modified-since 配合Last-Modeified来判断资源在该日期之后是否发生过变化。
  4. 如果发生了修改,则返回新的资源并返回新的Last-Modeified反之则返回状态码304 not Modeified,这个过程叫做协商缓存。

ETag

相对于Last-Modeified,ETag是一个更加严格的验证,它主要是通过数字签名表示资源的唯一性,但当该资源发生修改,那么该签名也会随之变化,但是无论如何都会保证它的唯一性。所以根据它的唯一性,就可以f-Match 或者If-Non-Match 知道资源有没有发生修改。

基础流程:同Last-Modified,只是把 Last-Modified 换成 ETag, If- Modified-Since 换成 If-Match 。但是假如 Last-Modified 以及 ETag 同时存在,则后者 ETag 的优先级比较高。

强缓存 & 协商缓存

在进行最后一个实战模拟之前,要先说下这两个十分重要的概念:强缓存以及协商缓存

强缓存

简单粗暴来讲,就是客户端知道资源过期时间后,由客户端来决定要不要缓存。那么怎么知道资源的过期时间呢?由谁来决定它们的过期时间呢?就是由我们上文提到的 Expires 以及 Cache-Control: max-age。

协商缓存

强缓存相反,是由服务器来决定客户端要不要使用缓存。在有ETag 以及Last-Modified 响应首部字段的情况下,客户端会向服务器发起资源的缓存校验,然后服务器会告知客户端是使用缓存(304)还是返回一个全新的资源,表面上看都是会发起一个请求,但是响应的时候则是不是一个完整的响应则看是否需要缓存。
还记得Cache-Control的指令no-cache和no-store吗?这时候应该就清楚两者的区别了。no-cache就是直接跳过强缓存进入协商缓存。no-store则是**不缓存**,效果等同于Chrome浏览器的

Disable Cache,仔细观察,你会发现请求首部字段是不会携带关于缓存的任何首部字段。

总结

这下总算知道为什么有时候Chrome 浏览器会展示 disk cache/memory cache 了吧,它跟 304 Not Modified 同样都是被缓存的意思,这是方式不一样。由此可见,合理的使用缓存是多么的重要,它可以使我们减少无所谓的请求避免资源文件的重复传输减少对源服务器资源占用等等好处,但也不能滥用。