HTTP 协议分析-报文
HTTP 协议是现代互联网通信的基础,它规定了客户端和服务器之间的通信规则,以实现数据传输和资源交互。
Method
HTTP定义了多种请求方法,用于客户端对服务器发起不同类型的请求,常见的方法包括:
- GET 请求一个指定资源的表示形式,使用 GET 的请求应该只被用于获取数据
- POST 用于将实体提交到指定的资源,通常导致在服务器上的状态变化或副作用
- PUT 用请求有效载荷替换目标资源的所有当前表示
- DELETE 删除指定的资源
- HEAD 请求一个与 GET 请求的响应相同的响应,但没有响应体
- CONNECT 建立一个到由目标资源标识的服务器的隧道
- OPTIONS 用于描述目标资源的通信选项
- TRACE 沿着到目标资源的路径执行一个消息环回测试
- PATCH 用于对资源应用部分修改
Safe (安全的): 不会修改服务器的数据的方法
- GET HEAD OPTIONS
Idempotent(幂等): 同样的请求被执行一次与连续执行多次的效果是一样的,服务器的状态也是一样的 所有 safe 的方法都是 Idempotent的
- GET HEAD OPTIONS PUT DELETE
状态码:
HTTP 状态码用于指示服务器对请求的处理情况
- 1xx: 指示信息,表示请求已接收继续处理
- 2xx: 成功,表示请求已被成功接收、理解、接受
- 200 0K- 客户端请求成功
- 3xx: 重定向,要完成请求必须进行更进一步的操作
- 301- 资源 (网页等) 被永久转移到其它 URL
- 302- 临时跳转
- 4xx: 客户端错误,请求有语法错误或请求无法实现
- 401 Unauthorized - 请求未经授权
- 404 - 请求资源不存在,可能是输入了错误的 URL
- 5xx: 服务器端错误,服务器未能实现合法的请求
- 500- 服务器内部发生了不可预期的错误
- 504 Gateway Timeout-网关或者代理的服务器无法在规定的时间内获得想要的响应。
RESTful API
RESTful API:一种 API 设计风格,REST-Representational State Transfer
- 每一个 URI 代表一种资源;
- 客户端和服务器之间,传递这种资源的某种表现层;
- 客户端通过 HTTP method,对服务器端资源进行操作,实现"表现层状态转化"。
| 请求 | 返回码 | 含义 |
|---|---|---|
| GET /zoos | 200 0K | 列出所有动物园,服务器成功返回了 |
| POST /zoos | 201 CREATED | 新建一个动物园,服务器创建成功 |
| PUT /zoos/ID | 400 INVALID REQUEST | 更新某个指定动物园的信息 (提供该动物园的全部信息)用户发出的请求有错误,服务器没有进行新建或修改数据的操作 |
| DELETE /zoos/ID | 204 NO CONTENT | 删除某个动物园,删除数据成功 |
请求头
| Accept | 接收类型,表示浏览器支持的 MIME 类型 (对标服务端返回的 Content-Type) |
| Content-Type | 客户端发送出去实体内容的类型 |
| Cache-Control | 指定请求和响应遵循的缓存机制,如 no-cache |
| f-Modified-Since | 对应服务端的 Last-Modified,用来匹配看文件是否变动,只能精确到 1s 之内 |
| Expires | 缓存控制,在这个时间内不会请求,直接使用缓存,服务端时间 |
| Max-age | 代表资源在本地缓存多少秒,有效时间内不会请求,而是使用缓存 |
| If-None-Match | 对应服务端的 ETag,用来匹配文件内容是否改变 (非常精确) |
| Cookie | 有 cookie 并且同域访问时会自动带上 |
| Referer | 该页面的来源 URL(适用于所有类型的请求,会精确到详细页面地址,csrf 拦截常用到这个字段) |
| Origin | 最初的请求是从哪里发起的 (只会精确到端口),Origin 比 Referer 更尊重隐私 |
| User-Agent | 用户客户端的一些必要信息,如 UA 头部等 |
响应头
| Content-Type | 服务端返回的实体内容的类型 |
| Cache-Control | 指定请求和响应遵循的缓存机制,如 no-cache |
| Last-Modified | 请求资源的最后修改时间 |
| Expires | 应该在什么时候认为文档已经过期,从而不再缓存它 |
| Max-age | 客户端的本地资源应该缓存多少秒,开启了 Cache-Control 后有效 |
| ETag | 资源的特定版本的标识符,Etags 类似于指纹 |
| Set-Cookie | 设置和页面关联的 cookie,服务器通过这个头部把 cookie 传给客户端 |
| Server | 服务器的一些相关信息 |
| Access-Control-Allow-Origin | 服务器端允许的请求 Origin 头部 (警如为*) |
缓存
HTTP 缓存机制有两种主要类型:强缓存和协商缓存。
- 强缓存允许客户端在一段时间内不向服务器发送请求,直接使用本地缓存。常用的控制头包括:
- Expires 时间戳
- Cache-Control
- 可缓存性
- no-cache:协商缓存验证
- no-store:不使用任何缓存
- 到期
- max-age 单位是秒,存储的最大周期,相对于请求的时间
- 重新验证*重新加载 - must-revalidate: 一旦资源过期,在成功向原始服务器验证之前,不能使用
- 可缓存性
- 协商缓存允许客户端向服务器发送请求,服务器根据条件决定是否返回完整响应内容。常用的控制头包括:
- Etag/lf-None-Match : 资源的特定版本的标识符,类似于指纹
- Last-Modified/if-Modified-Since: 最后修改时间