这是我参与「第四届青训营 」笔记创作活动的的第4天
一、初识http
面试中最常见的题目之一是:浏览器输入url到呈现出页面,发生了什么?
这里面涉及到的就有http协议。
那么什么是http?
- 全称是Hyper Text Transfer Protocol(超文本传输协议)
- 应用层协议,基于TCP协议
- 请求 响应
- 简单可扩展
- 无状态
协议发展
http从最初的版本到现在的3.0版本草案,经过了不断的更新发展。
HTTP/0.9
http刚出现的时候并没有标准建立,在1.0版本之前称为0.9,仅仅能传递html文件,是单行协议。
HTTP/1.0
1996年5月HTTP/1.0诞生,相比0.9版本,构建了可扩展性,它有以下增强:
- 在每个响应的的GET请求中添加版本号
- 在响应的第一行中添加状态行
- 出现了header的概念
- 引入了POST和HEAD命令
- 支持长连接
HTTP/1.1
在1.0版本出现几个月后,就推出了1.1版本,是标准化协议。1.1版本持续最久,如今仍是主流。 相比1.0版本,1.1版本有以下优势:
- 链接复用,可以重复使用连接(keep-alive),从而节省时间
- 添加了Pipeline,允许在第一个请求完全传输回来之前发送第二个请求
- chunked机制
- 缓存机制
- 引入了内容协商
HTTP/2.0
- 二进制协议
- 多路复用协议。可以通过同一连接发出并行请求,从而消除 HTTP/1.x 协议的约束
- 压缩header。一些请求在一组中通常是相似的,因此这能够消除传输数据的重复开销
- 它允许服务器推送,在客户端缓存中填充数据
HTTP/3.0
谷歌在2016年11月国际互联网工程任务组(IETF)召开了第一次QUIC工作组会议,制定的一种基于UDP的低时延的互联网传输层协议,于2018年11月更名为HTTP/3。
二、HTTP协议分析
Method
| METHOD | |
|---|---|
| GET | 请求一个指定资源的表示形式.使用GET的请求应该只被用于获取数据 |
| POST | 用于将实体提交到指定的资源,通常导致在服务器上的状态变化或副作用 |
| PUT | 用请求有效载荷替换目标资源的所有当前表示 |
| DELETE | 删除指定资源 |
| HEAD | 请求一个与GET请求的响应相同的响应,但没有响应体 |
| CONNECT | 请求一个与GET请求的响应相同的响应,但没有响应体 |
| OPTIONS | 用于描述目标资源的通信选项 |
| TRACE | 沿着到目标资源的路径执行一个消息环回测试 |
| PATCH | 用于对资源应用部分修改 |
- safe:不会修改服务器的数据。
GETHEADOPTIONS - Idempotent(幂等):同样的请求被执行一次与连续执行多次的效果是一样的,服务器的状态也是一样的。所有safe的方法都是Idempotent的。
GET、HEAD、OPTIONS、PUT、DELETE
状态码
常见的状态码:
- 200 OK---客户端请求成功
- 301---资源(网页等)被永久转移到其它URL
- 302---临时跳转
- 401 Unauthorized---请求未经授权
- 404---请求资源不存在,可能是输入了错误的URL
- 500---服务器内部发生了不可预期的错误
- 504 Gateway Timeout---网关或者代理的服务器无法在规定的时间内获得想要的响应
请求头
常用请求头:
- Accept -- 接收类型,表示浏览器支持的MIME类型(对标服务端返回的Content -Type)
- Content-Type -- 客户端发送出去实体内容的类型
- Cache-Control -- 指定请求和响应遵循的缓存机制,如no-cache
- If-Modified-Since -- 对应服务端的Last-Modified,用来匹配看文件是否变动,只能精确到1s之内
- Expires -- 缓存控制,在这个时间内不会请求,直接使用缓存,服务端时间
- Max-age -- 代表资源在本地缓存多少秒,有效时间内不会请求,而是使用缓存
- If-None-Match -- 对应服务端的ETag,用来匹配文件内容是否改变(非常精确)
- Cookie -- 有cookie并且同域访问时会自动带上
- Referer -- 该页面的来源URL(适用于所有类型的请求,会精确到详细页面地址,csrf拦截常用到这个字段)
- Origin -- 最初的请求是从哪里发起的(只会精确到端口) ,Origin比Referer更尊重隐私
- User- Agent -- 用户客户端的一些必要信息,如UA头部等
响应头
常用响应头:
- Content-Type -- 服务端返回的实体内容的类型
- Cache-Control -- 指定请求和响应遵循的缓存机制,如no-cache
- Last-Modified -- 请求资源的最后修改时间
- Expires -- 应该在什么时候认为文档已经过期,从而不再缓存它
- Max-age -- 客户端的本地资源应该缓存多少秒,开启了Cache-Control后有效
- ETag-- 资源的特定版本的标识符,Etags类似于指纹
- Set-Cookie -- 设置和页面关联的cookie,服务器通过这个头部把cookie传给客户端
- Server -- 服务器的一些相关信息
- Access-Control-Allow-Origin -- 服务器端允许的请求Origin头部( 譬如为*)