HTTP 实用指南 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第 10 天
概述
本节课程主要分为以下五个方面:
-
HTTP 协议简介
-
HTTP 协议的基本结构与发展历程
-
常见场景中的 HTTP 协议应用
-
在不同的环境中发起 HTTP 请求
-
知识扩展,了解更多网络通信协议
课前部分请同学们准备好相关环境,如果有学习过计算机网络等相关课程的同学可以快速回顾下相关知识;课中部分我们会对 HTTP 协议的关键知识点做一下讲解,并结合实际场景,帮助同学们巩固学习;课后部分是一些相关学习资料,帮助同学们进一步完善知识体系。
初识 HTTP
背景知识
HTTP(HyperText Transfer Protocol)是万维网(World Wide Web)的基础协议。自 Tim Berners-Lee 博士和他的团队在 1989-1991 年间创造出它以来,HTTP 已经发生了太多的变化,在保持协议简单性的同时,不断扩展其灵活性。如今,HTTP 已经从一个只在实验室之间交换文件的早期协议进化到了可以传输图片,高分辨率视频和 3D 效果的现代复杂互联网协议。
概念
HTTP 是一种能够获取如 HTML 这样的网络资源的 protocol(通讯协议)。它是在 Web 上进行数据交换的基础,是一种 client-server 协议,也就是说,请求通常是由像浏览器这样的接受方发起的。一个完整的 Web 文档通常是由不同的子文档拼接而成的,像是文本、布局描述、图片、视频、脚本等等。
特点
- 简单
- 虽然下一代 HTTP/2 协议将 HTTP 消息封装到了帧(frames)中,HTTP 大体上还是被设计得简单易读。HTTP 报文能够被人读懂,还允许简单测试,降低了门槛,对新人很友好。
- 可扩展
- 在 HTTP/1.0 中出现的 HTTP headers 让协议扩展变得非常容易。只要服务端和客户端就新 headers 达成语义一致,新功能就可以被轻松加入进来。
- 无状态,有会话
-
HTTP 是无状态的:在同一个连接中,两个执行成功的请求之间是没有关系的。这就带来了一个问题,用户没有办法在同一个网站中进行连续的交互,比如在一个电商网站里,用户把某个商品加入到购物车,切换一个页面后再次添加了商品,这两次添加商品的请求之间没有关联,浏览器无法知道用户最终选择了哪些商品。而使用 HTTP 的头部扩展,HTTP Cookies 就可以解决这个问题。把 Cookies 添加到头部中,创建一个会话让每次请求都能共享相同的上下文信息,达成相同的状态。
-
注意,HTTP 本质是无状态的,使用 Cookies 可以创建有状态的会话。
协议分析
持续发展
- HTTP/0.9 单行协议
- 请求 GET /mypage.html
- 响应只有 HTML 文档
- HTTP/1.0 构建可扩展性
- 增加了 Header
- 有了状态码
- 支持多种文档类型
- ...
- HTTP/1.1 标准化协议
- 链接复用
- 缓存
- 内容协商
- ...
- HTTP/2 更优异的表现
- 二进制协议
- 压缩 header
- 服务器推送
- ...
- HTTP/3 草案
报文解析
HTTP/1.1 以及更早的 HTTP 协议报文都是语义可读的。在 HTTP/2 中,这些报文被嵌入到了一个新的二进制结构,帧。帧允许实现很多优化,比如报文头部的压缩和复用。即使只有原始 HTTP 报文的一部分以 HTTP/2 发送出来,每条报文的语义依旧不变,客户端会重组原始 HTTP/1.1 请求。因此用 HTTP/1.1 格式来理解 HTTP/2 报文仍旧有效。
Method
| Method | Explanation |
|---|---|
| GET | 请求一个指定资源的表示形式。使用 GET 的请求应该只被用于获取数据 |
| POST | 用于将实体提交到指定的资源,通常导致在服务器上的状态变化或副作用 |
| PUT | 用请求有效载荷替换目标资源的所有当前表示 |
| DELETE | 删除指定的资源 |
| HEAD | 请求一个与 GET 请求的响相同的响应,但没有响应体 |
| CONNECT | 建立一个到由目标资源标识的服务器的隧道 |
| OPTIONS | 用于描述目标资源的通信选项 |
| TRACE | 沿着到目标资源的路径执行一个消息环回测试 |
| PATCH | 用于对资源应用部分修改 |
特性:
-
Safe(安全):不会修改服务器数据的方法,例如 GET、HEAD。OPTIONS
-
Independent(幂等):同样的请求被执行一次与连续执行多次的效果是一样的,服务器的状态也是一样的。
- 所有 Safe 的方法 都是 Independent 的
- GET、HEAD、OPTIONS、PUT、DELETE
状态码
| 状态码 | 含义 |
|---|---|
| 1xx | 指示信息,表示请求已接收,继续处理 |
| 2xx | 成功,表示请求已被成功接收、理解、接受 |
| 3xx | 重定向,要完成请求必须进行更进一步的操作 |
| 4xx | 客户端错误,请求有语法错误或请求无法实现 |
| 5xx | 服务器端错误,服务器未能实现合法的请求 |
常见状态码:
- 200 OK - 客户端请求成功
- 301 - 资源(网页等)被永久转移到其他 URL
- 302 - 临时跳转
- 401 Unauthorized - 请求未授权
- 404 - 请求资源不存在,可能是输入了错误的 URL
- 500 - 服务器内部发生了不可预期的错误
- 504 Gateway Timeout - 网关或者代理的服务器无法在规定时间内获得想要的响应
RESTful API
REST - Representational State Transfer
RESTful API :一种 API 设计风格
- 每一个 URI 代表一种资源
- 客户端与服务器之间,传递这种资源的某种表现层
- 客户端通过 HTTP method ,对服务器端资源进行操作,实现 ”表现层状态转化“
| 请求 | 返回码 | 含义 |
|---|---|---|
| GET /zoos | 200 OK | 列出所有动物园,服务器成功返回了 |
| POST /zoos | 201 CREATED | 新建一个动物园,服务器创建成功 |
| PUT /zoos/ID | 400 INVALID REQUEST | 更新某个指定动物园的信息(提供该动物园的全部信息) 用户发出的请求信息有误,服务器没有进行新建或修改数据操作 |
| DELETE /zoos/ID | 204 NO CONTENT | 删除某个动物园,删除数据成功 |
常用请求头
| 请求头 | 含义 |
|---|---|
| Accept | 接收类型,表示浏览器支持的 MIME 类型(对标服务器返回的 Content-Type |
| Content-Type | 客户端发送出去实体内容的类型 |
| Cache-Control | 指定请求和响应遵循的缓存机制,如 no-cache |
| If-Modified-Since | 对应服务端的 Last-Modified ,用来匹配看文件是否变动,只能精确到 1s 之内 |
| Expires | 缓存控制,在这个时间内不会请求,直接使用缓存,服务端时间 |
| Max-age | 代表资源在本地缓存多少秒,有效时间内不会请求,而是使用缓存 |
| If-None-Match | 对应服务端的 ETag ,用来匹配文件内容是否改变(非常精确) |
| Cookie | 有 cookie 并且同域访问时会自动带上 |
| Referer | 该页面的来源 URL(适用于所有类型的请求,会精确到详细页面地址,CSRF 拦截常用到这个字段) |
| Origin | 最初的请求是从哪里发起的(只会精确到端口),Origin 比 Referer 更尊重隐私 |
| User-Agent | 用户客户端的一些必要信息,如 UA 头部等 |
常用响应头
| 响应头 | 含义 |
|---|---|
| Content-Type | 服务器端返回的实体内容的类型 |
| Cache-Control | 指定请求和响应遵循的缓存机制,如 no-cache |
| Last-Modified | 请求资源的最后修改时间 |
| Expires | 应该在什么时候认为文档已经过期,从而不再缓存它 |
| Max-age | 客户端的本地资源应该缓存多少秒,开启了 Cache-Control 后有效 |
| ETag | 资源的特定版本的标识符,Etags 类似于指纹 |
| Set-Cookie | 设置和页面关联的 cookie ,服务器通过这个头部把 cookie传给客户端 |
| Server | 服务器的一些相关信息 |
| Access-Control-Allow-Origin | 服务器端允许的请求 Origin 头部(譬如为 * ) |
缓存
强缓存
- Expires,时间戳
- Cache-Control
- 可缓存性
- no-cache :协商缓存验证
- no-store :不使用任何缓存
- 到期
- max-age :单位是秒,存储的最大周期,相对于请求的时间
- 重新验证 重新加载
- must-revalidate :一旦资源过期,在成功向原始服务器验证之前,不能使用
- 可缓存性
协商缓存
- Etag / If-None-Match :资源的特定版本的标识符,类似于指纹
- Last-Modified / If-Modified-Since :最后修改时间
Cookie
Set-Cookie response
| Name=value | 各种 cookie 的名称和值 |
|---|---|
| Expires=Data | Cookie 的有效期,缺省时 Cookie 仅在浏览器关闭之前有效 |
| Path=Path | 限制指定 Cookie 的发送范围的文件目录,默认为当前 |
| Domain=domain | 限制 Cookie 生效的域名,默认为创建 Cookie 的服务域名 |
| secure | 仅在 HTTPS 安全连接时,才可以发送 Cookie |
| HttpOnly | JavaScript 脚本无法获得 Cookie |
| SameSite=[None|Strict|Lax] | - None 同站、跨站请求都可发送 - Strict 仅在同站发送 - 允许与顶级导航一起发送,并将与第三方网站发起的 GET 请求一起发送 |
发展协议
HTTP/2
HTTPS
场景分析
静态资源
登录
- 业务场景
- 表单登录
- 扫码登录
- 技术方式
- SSO
SSO(Single Sign On):单点登录
实战
浏览器
AJAX 之 XHR
AJAX 之 Fetch
node
标准库:HTTP/HTTPS
axios
用户体验
网络优化
稳定性
了解更多
WebSocket
- 浏览器与服务器进行全双工通讯的网络技术
- 典型场景:实时性要求高,例如聊天室
- URL 使用 ws:// 或 wss:// 等开头
QUIC
Quick UDP Internet Connection
- 0-RTT 建联(首次建联除外)
- 类似 TCP 的可靠传输
- 类似 TLS 的加密传输,支持完美前向安全
- 用户空间的拥塞控制,最新的 BBR 算法
- 支持 h2 的基于流的多路复用,但没有 TCP 的 HOL 问题
- 前向纠错 FEC
- 类似 MPTCP 的 Connection migration
HTTP 学习资料推荐
学习建议:
-
相对来讲 HTTP 协议的常用知识不复杂, “基础篇” 材料中,MDN 可以作为工具查询,“图解HTTP” 与 “HTTP权威指南” 选择一个阅读,作为体系化学习资料
-
进阶篇中提供的是标准协议描述,感兴趣的同学阅读即可,也可作为工具使用
-
基础篇
- An overview of HTTP - HTTP | MDN
- 图解 HTTP
- HTTP 权威指南
-
进阶篇