HTTP 缓存策略学习笔记 | 实践记录及工具使用

56 阅读7分钟

以 Chrome 浏览器为例

在当今的互联网世界中,浏览器与服务器之间的交互频繁,而 HTTP 缓存策略对于提高网页加载速度、减少网络流量以及提升用户体验起着至关重要的作用。本文将以 Chrome 浏览器为例,深入分析其在 HTTP 请求中涉及的缓存策略,包括缓存的类型、缓存的控制机制以及缓存的验证过程等。

Chrome 浏览器中的 HTTP 缓存类型

(一)强缓存 强缓存是指浏览器在加载资源时,直接从本地缓存中获取资源,而无需向服务器发送请求。Chrome 浏览器主要通过 Cache-ControlExpires 这两个 HTTP 头部字段来控制强缓存。

  1. Cache-Control 字段
  • max-age:该指令指定资源在缓存中的最大存活时间,以秒为单位。例如,Cache-Control: max-age=3600 表示资源在缓存中可以存活 1 小时。在此期间,浏览器对该资源的请求将直接从缓存中获取,不会与服务器进行通信。
  • no-cache:这个指令比较特殊,它并不是说浏览器不缓存资源,而是在使用缓存资源之前,必须先与服务器进行验证。它主要用于确保资源的时效性和一致性。
  • no-store:该指令表示禁止浏览器缓存资源,每次请求都必须从服务器获取最新的资源。这种情况适用于一些对数据实时性要求极高或者包含敏感信息的资源。
  1. Expires 字段
  • Expires 字段指定了资源过期的具体时间点。例如,Expires: Wed, 21 Nov 2024 08:00:00 GMT 表示在这个时间之后,浏览器需要重新向服务器获取资源。不过,Expires 字段是基于服务器的时间,如果客户端和服务器的时间不一致,可能会导致缓存失效的判断不准确。相比之下,Cache-Control 中的 max-age 更加可靠,因为它是基于相对时间的。
  • Cache-ControlExpires 同时存在时,Chrome 浏览器会优先考虑 Cache-Control 字段。 (二)协商缓存 当强缓存失效后,浏览器会进入协商缓存阶段。在这个阶段,浏览器会向服务器发送请求,但是会携带一些缓存相关的信息,服务器根据这些信息来判断浏览器缓存的资源是否仍然可用。Chrome 浏览器主要通过 Last-ModifiedETag 这两个字段来实现协商缓存。
  1. Last-Modified 字段
  • 服务器在响应资源时,会在 HTTP 头部中添加 Last-Modified 字段,该字段的值是资源最后修改的时间。例如,Last-Modified: Tue, 19 Nov 2024 12:00:00 GMT
  • 当浏览器再次请求该资源时,会在请求头部中添加 If-Modified-Since 字段,其值就是上次服务器响应的 Last-Modified 值。服务器收到请求后,会比较资源的实际最后修改时间与 If-Modified-Since 的值,如果资源没有被修改,服务器会返回 304 Not Modified 状态码,并且不返回资源内容,浏览器则继续使用本地缓存的资源。如果资源已经被修改,服务器会返回 200 OK 状态码,并返回最新的资源内容。 2. ETag 字段
  • ETag 是服务器为资源生成的一个唯一标识,可以是资源内容的哈希值或者其他能够唯一标识资源的字符串。例如,ETag: "5f9a3b4c-1234-5678-9abc-def012345678"
  • 浏览器在再次请求资源时,会在请求头部中添加 If-None-Match 字段,其值就是上次服务器响应的 ETag 值。服务器收到请求后,会比较资源的当前 ETag 值与 If-None-Match 的值,如果两者匹配,说明资源没有变化,服务器返回 304 Not Modified 状态码,浏览器继续使用本地缓存。如果不匹配,服务器返回 200 OK 状态码并提供最新的资源。
  • Last-Modified 相比,ETag 能够更精确地判断资源是否发生变化,因为它不是基于时间,而是基于资源内容本身的标识。

Chrome 浏览器中的缓存控制流程

(一)首次请求资源 当用户在 Chrome 浏览器中首次访问一个网页时,浏览器会向服务器发送 HTTP 请求,服务器返回资源并在响应头部中设置相应的缓存策略信息,如 Cache-ControlExpiresLast-ModifiedETag 等字段。浏览器接收到响应后,根据 Cache-ControlExpires 判断是否将资源缓存到本地。如果可以缓存,浏览器会将资源存储在内存缓存或磁盘缓存中,以便后续使用。 (二)再次请求资源

  1. 强缓存检查
  • 当浏览器再次请求相同的资源时,首先会检查强缓存是否有效。它会查看本地缓存资源的 Cache-ControlExpires 信息,计算资源是否还在有效期内。果强缓存有效,浏览器直接从本地缓存中读取资源并渲染页面,不会向服务器发送请求。
  1. 协商缓存检查
  • 如果强缓存失效,浏览器会进入协商缓存检查阶段。它会在请求头部中添加 If-Modified-SinceIf-None-Match 字段(取决于首次响应中服务器设置的是 Last-Modified 还是 ETag),然后向服务器发送请求。服务器根据这些信息判断资源是否发生变化,如果资源未变化,服务器返回 304 Not Modified 状态码,浏览器继续使用本地缓存资源;如果资源已变化,服务器返回 200 OK 状态码并提供最新的资源内容,浏览器更新本地缓存并渲染页面。

缓存策略的实际应用场景与优化

(一)静态资源缓存 对于网站中的静态资源,如 CSS 文件、JavaScript 文件、图片等,通常可以设置较长的缓存时间。因为这些资源一般不会频繁更新,通过设置强缓存,可以减少浏览器与服务器之间的请求次数,提高页面加载速度。例如,可以设置 Cache-Control: max-age=31536000(一年),让浏览器在一年内直接从缓存中获取这些静态资源。 (二)动态资源缓存 对于动态资源,如 API 接口返回的数据,由于数据可能经常变化,一般不适合设置过长的强缓存时间。可以使用协商缓存机制,通过 ETagLast-Modified 来确保浏览器能够及时获取到最新的数据。同时,对于一些实时性要求极高的动态资源,可以设置 Cache-Control: no-cacheCache-Control: no-store,强制浏览器每次都从服务器获取最新资源。 (三)版本更新与缓存清除 当网站的资源发生更新时,如更新了 CSS 文件的样式或者 JavaScript 文件的功能,需要确保浏览器能够获取到最新的资源。一种常见的做法是在资源的 URL 中添加版本号或哈希值,例如 style.css?v=1.0.1。这样,当资源更新时,URL 发生变化,浏览器会将其视为一个新的资源,不会使用旧的缓存,而是重新向服务器请求。

总结

在 Chrome 浏览器的 HTTP 请求中,缓存策略是一个复杂而又关键的部分。通过合理设置强缓存和协商缓存机制,可以有效地提高网页的加载速度,减少网络流量消耗,提升用户体验。开发人员需要根据资源的特性和更新频率,灵活运用 Cache-ControlExpiresLast-ModifiedETag 等字段来制定合适的缓存策略。同时,在资源更新时,要考虑如何让浏览器及时获取到最新的资源,避免用户看到过期的内容。深入理解和掌握 Chrome 浏览器的 HTTP 缓存策略对于构建高效、快速响应的网站具有重要意义。