初识 HTTP 协议
HTTP 协议的基本定义
HTTP(Hypertext Transfer Protocol)是一种用于传输超文本的应用层协议。它是一个客户端-服务器协议,用于在Web浏览器和Web服务器之间传输数据。HTTP协议定义了客户端和服务器之间的通信规则,包括请求方法、请求头部、响应状态码、响应头部等。它使用简单的请求-响应模型,在客户端发起请求后,服务器会返回相应的数据。HTTP协议是Web应用程序的基础,用于浏览网页、发送请求和接收响应。
HTTP 协议主要特征
-
简单:HTTP协议采用简单的请求-响应模型,客户端发送请求到服务器,服务器返回响应给客户端。这种简单性使得HTTP协议易于实现和理解。
-
无状态:HTTP协议本身是无状态的,即服务器不会记住之前的请求和响应。每个请求都是独立的,服务器不能识别出两个请求是否来自同一个客户端。这个特性使得HTTP协议具有高度的可伸缩性,但也导致了一些问题,比如需要使用Cookie来维持会话状态。
-
可扩展:HTTP协议是可扩展的,可以通过添加新的请求方法、响应状态码、首部字段等来满足新的需求。
-
明文传输:HTTP协议默认使用明文传输,即请求和响应的内容都是以明文形式传输的。这使得HTTP协议存在安全性问题,容易被中间人攻击窃取数据。为了解决这个问题,可以使用HTTPS(HTTP over SSL/TLS)协议进行加密传输。
-
基于TCP/IP:HTTP协议是基于TCP/IP协议栈的,使用TCP作为传输层的协议,使用IP作为网络层的协议。通过TCP连接和IP地址来进行客户端和服务器之间的通信。
-
支持缓存:HTTP协议支持缓存机制,客户端可以缓存已经获取的资源,减少服务器的负载,提高性能。
HTTP 协议的报文结构
Method
| Method | 描述 |
|---|---|
| GET | 请求一个指定资源的表示形式。使用GET的请求应该只被用于获取数据。 |
| POST | 用于将实体提交到指定的资源,通常导致在服务器上的状态变化或副作用。 |
| PUT | 用请求有效载荷替换目标资源的所有当前表示。 |
| DELETE | 删除指定的资源。 |
| HEAD | 请求一个与GET请求的响应相同的响应,但没有响应体。 |
| CONNECT | 建立一个到由目标资源标识的服务器的隧道。 |
| OPTIONS | 用于描述目标资源的通信选项。 |
| TRACE | 沿着到目标资源的路径执行一个消息环回测试。 |
| PATCH | 用于对资源应用部分修改。 |
safe(安全的):不会修改服务器的数据的方法 GET HEAD OPTIONS
idempotent(幂等):同样的请求被执行一次与连续执行多次的效果是一样的,服务器的状态也是一样的 所有safe的方法都是idempotent的 GET HEAD OPTIONS PUT DELETE
状态码
| 状态码 | |
|---|---|
| 1xx | 指示信息,表示请求已接收,继续处理 |
| 2xx | 成功,表示请求已被成功接收、理解、接受 |
| 3xx | 重定向,要完成请求必须进行更进一步的操作 |
| 4xx | 客户端错误,请求有语法错误或请求无法实现 |
| 5xx | 服务器端错误,服务器未能实现合法的请求 |
-
200 OK-客户端请求成功
-
301-资源(网页等)被永久转移到其它URL
-
302-临时跳转
-
401 Unauthorized-请求未经授权
-
404-请求资源不存在,可能是输入了错误的URL
-
500-服务器内部发生了不可预期的错误
-
504 Gateway Timeout-网关或者代理的服务器无法在规定的时间内获得想要的响应。
RESTful API
RESTful API:一种API设计风格;REST-Representational State Transfer
-
每一个URL代表一种资源
-
客户端和服务器之间,传递这种资源的某种表现层
-
客户端通过HTTP method,对服务器端资源进行操作,实现"表现层状态转化"
| 请求 | 返回码 | 含义 |
|---|---|---|
| GET/zoos | 2000K | 列出所有动物园,服务器成功返回了 |
| POST /zoos | 201 CREATED | 新建一个动物园,服务器创建成功 |
| PUT/zoos/ID | 400 INVALID REQUEST | 更新某个指定动物园的信息(提供该动物园的全部信息) |
| DELETE /zoos/ID | 204 NO CONTENT | 删除某个动物园,删除数据成功 |
常用请求头和响应头
| 常用请求头 | |
|---|---|
| Accept | 接收类型,表示浏览器支持的MIME类型(对标服务端返回的Content-Type) |
| Content-Type | 客户端发送出去实体内容的类型 |
| Cache-Control | 指定请求和响应遵循的缓存机制,如no-cache |
| If-Modified-Since | 对应服务端的Last-Modified,用来匹配看文件是否变动,只能精确到1s之内 |
| Expires | 缓存控制,在这个时间内不会请求,直接使用缓存,服务端时间 |
| Max-age | 代表资源在本地缓存多少秒,有效时间内不会请求,而是使用缓存 |
| If-None-Match | 对应服务端的ETag,用来匹配文件内容是否改变(非常精确) |
| Cookie | 有cookie并且同域访问时会自动带上 |
| Referer | 该页面的来源URL(适用于所有类型的请求,会精确到详细页面地址,cs拦截常用到这个字段) |
| Origin | 最初的请求是从哪里发起的(只会精确到端口),Origin比Referer更尊重隐私 |
| User-Agent | 用户客户端的一些必要信息,如UA头部等 |
| 常用响应头 | |
|---|---|
| Content-Type | 服务端返回的实体内容的类型 |
| Cache-Control | 指定请求和响应遵循的缓存机制,如no-cache |
| Last-Modified | 请求资源的最后修改时间 |
| Expires | 应该在什么时候认为文档已经过期,从而不再缓存它 |
| Max-age | 客户端的本地资源应该缓存多少秒,开启了Cache-Control后有效 |
| ETag | 资源的特定版本的标识符,Etags类似于指纹 |
| Set-Cookie | 设置和页面关联的cookie,服务器通过这个头部把cookie传给客户端 |
| Server | 服务器的一些相关信息 |
| Access-Control-Allow-Origin | 服务器端允许的请求Origin头部(譬如为*) |
缓存
强缓存
- Expires,时间戳
- Cache-Control
- 可缓存性
- no-cache:协商缓存验证
- no-store:不使用任何缓存
- 到期
- max-age:单位是秒,存储的最大周期,相对于请求的时间
- 重新验证*重新加载
- must-revalidate:一旦资源过期,在成 功向原始服务器验证之前,不能使用
- 可缓存性
协商缓存
- Etag/If-None-Match:资源的特定版本的标识符,类似于指纹
- Last-Modified/If-Modified-Since:最后修改时间
cookie
Set-Cookie-response
| Name=value | 各种cookie的名称和值 |
| Expires=Date | Cookie的有效期,缺省时Cookie仅在浏览器关闭之前有效 |
| Path=Path | 限制指定Cookie的发送范围的文件目录,默认为当前 |
| Domain=domain | 限制cookie生效的域名,默认为创建cookie的服务域名 |
| secure | 仅在HTTPS安全连接时,才可以发送Cookie |
| HttpOnly | JavaScript脚本无法获得Cookie |
| SameSite | None同站、跨站请求都可发送; Strict仅在同站发送;允许与顶级导航一起发送,并将与第三方网站发起的GET请求一起发送 |