基本概念
HTTP(Hypertext Transfer Protocol)是一种用于在Web浏览器和服务器之间传输数据的协议。它建立在TCP/IP协议之上,通过客户端-服务器模型进行通信。
- Hyper Text Transfer Protocol 超文本传输协议
- 应用层协议,基于TCP协议
- 请求 响应
- 简单可扩展
- 无状态
特点
-
支持客户/服务器模式。
-
简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
-
灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
-
无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
-
无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。
协议分析
Method
| GET | 请求指定资源的表示,使用 GET 的请求应该只用于请求数据,而不应该包含数据。 |
| POST | 将实体提交到指定的资源,通常导致在服务器上的状态变化或是副作用 |
| PUT | 用请求有效载荷替换目标资源的所有当前表示 |
| DELETE | 删除指定的资源 |
| HEAD | 请求一个与 GET 请求的响应相同的响应,但没有响应体 |
| CONNECT | 建立一个到由目标资源标识的服务器的隧道 |
| OPTIONS | 用于描述目标资源的通信选项 |
| TRACE | 沿着到目标资源的路径执行一个消息环回测试 |
| PATCH | 用于对资源应用部分修改 |
请求特点
- Safe (安全的): 不会修改服务器的数据的方法,如 GET、HEAD、OPTIONS
- Idempotent (幂等): 同样的请求被执行一次与连续执行多次的效果是一样的,服务器的状态也是一样的(所有的 Safe 方法都满足 Idempotent),如 GET、HEAD、OPTIONS、PUT、DELETE
协议码
| 常见状态码 | 说明 |
|---|---|
| 200 OK | 这是一个最常见的状态码, 表示访问成功。抓包抓到的大部分结果都是 200 |
| 404 Not Found | 没有找到资源。URL 标识的资源不存在, 那么就会出现 404 |
| 403 Forbidden | 表示访问被拒绝。有的页面通常需要用户具有一定的权限才能访问(登陆后才能访问).。如果用户没有登陆直接访问, 就容易见到 403 |
| 405 Method Not Allowed | 我们学习了 HTTP 中所支持的方法, 有 GET, POST, PUT, DELETE 等。但是对方的服务器不一定都支持所有的方法(或者不允许用户使用一些其他的方法) |
| 500 Internal Server Error | 服务器出现内部错误. 一般是服务器的代码执行过程中遇到了一些特殊情况(服务器异常崩溃)会产生这个状态码,一般很少见 |
| 504 Gateway Timeout | 当服务器负载比较大的时候, 服务器处理单条请求的时候消耗的时间就会很长, 就可能会导致出现超时的情况 |
| 302 Move temporarily | 临时重定向。在登陆页面中经常会见到 302. 用于实现登陆成功后自动跳转到主页 |
| 301 Moved Permanently | 永久重定向。当浏览器收到这种响应时, 后续的请求都会被自动改成新的地址。301 也是通过 Location 字段来表示要重定向到的新地址 |
RESTful API
一种 API 设计风格,REST - Representational State Transfer
-
每一个 URI 代表一种资源
-
客户端和服务器间,传递这种资源的某种表现层
-
客户端通过 HTTP method,对服务器资源进行操作,实现“表现层状态转化”
常用请求头
| key | value |
|---|---|
| Accept | 接收类型,表示浏览器支持的MIME类型(对标服务端返回的Content-Type) |
| Content-Type | 客户端发送出去实体内容的类型 |
| Cache-Control | 指定请求和响应遵循的缓存机制,如 no - cache |
| If-Modified-Since | 对应服务端的 Last - Modified, 用来匹配看文件是否变动,只能精确到 1s 之内 |
| Expires | 缓存控制,在这个时间内不会请求,直接使用缓存,服务端时间 |
| Max-age | 代表资源在本地缓存多少秒,有效时间内不会请求,而是使用缓存 |
| If-None-Match | 对应服务端的 ETag ,用来匹配文件内容是否改变(非常精确) |
| Cookie | 有cookie并且同域访问时会自动带上 |
| Referer | 该页面的来源URL(适用于所有类型的请求,会精确到详细页面地址, csrf 拦截常用到这个字段) |
| Origin | 最初的请求是从哪里发起的(只会精确到端口), Origin 比 Referer 更尊重隐私 |
| User-Agent | 用户客户端的一些必要信息,如UA头部等 |
常用响应头
| Content-Type | 服务端返回的实体内容的类型 |
| Cache-Control | 指定请求和响应遵循的缓存机制,如 no-cache |
| Last-Modified | 请求资源的最后修改时间 |
| Expires | 应该在什么时候认为文档已经过期,从而不再缓存它 |
| Max-age | 客户端的本地资源应该缓存多少秒,开启了 Cache-Control 后有效 |
| ETag | 资源的特定版本的标识符, Etags 类似于指纹 |
| Set-Cookie | 设置和页面关联的 cookie, 服务器通过这个头部把 cookie 传给客户端 |
| Server | 服务器的一些相关信息 |
| Access-Control-Allow-Origin | 服务器端允许的请求 Origin 头部(譬如为*) |
缓存
处理顺序:
首先发起请求,浏览器会是不是有缓存,缓存是不是之前声明的强缓存,并且还在强缓存的有效期内,如果是的话 既可以直接从本地缓存读取然后响应。 假设强缓存里面不可用了,或者没有强缓存,就可以看看有没有协商缓存相关的信息,在协商缓存中优先看ETag字段,ETag是资源的一个标识符,其次看有没有Last-Modified,是不是可用,返回304or200状态码,然后浏览器根据情况决定是返回给本地缓存还是直接返回sever下发最新信息。