HTTP协议解析笔记 | 青训营

167 阅读5分钟

1_HTTP概念

维基百科的解释:

  • 超文本传输协议(英语:HyperText Transfer Protocol,缩写:HTTP)是一种用于分布式、协作式和超媒体信息系统的应用层协议;
  • HTTP是万维网的数据通信的基础,设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法;
  • 通过HTTP或者HTTPS协议请求的资源由统一资源标识符(Uniform Resource Identifiers,URI)来标识;

HTTP是一个客户端(用户)和服务端(网站)之间请求和响应的标准。

  • 通过使用网页浏览器、网络爬虫或者其它的工具,客户端发起一个HTTP请求到服务器上指定端口(默认端口为80);称这个客户端为用户代理程序(user agent);
  • 响应的服务器上存储着一些资源,比如HTML文件和图像。称这个响应服务器为源服务器(origin server);

HTTP.jpg


2_网页中资源的获取

网页中的资源通常是被放在Web资源服务器中,由浏览器自动发送HTTP请求来获取、解析、展示的。

网页中资源的获取.jpg

页面中很多数据是动态展示的: 比如页面中的数据展示、搜索数据、表单验证等等,也是通过在JavaScript中发送HTTP请求获取的;


3_HTTP的组成

一次HTTP请求主要包括:请求(Request)和响应(Response

HTTP的组成.jpg


4_HTTP的版本

HTTP/0.9

  • 发布于1991年;
  • 只支持GET请求方法获取文本数据,当时主要是为了获取HTML页面内容;

HTTP/0

  • 发布于1996年;
  • 支持POST、HEAD等请求方法,支持请求头、响应头等,支持更多种数据类型(不再局限于文本数据) ;
  • 但是浏览器的每次请求都需要与服务器建立一个TCP连接,请求处理完成后立即断开TCP连接,每次建立连接增加了性能损耗;

==HTTP/1==(目前使用最广泛的版本)

  • 发布于1997年;
  • 增加了PUT、DELETE等请求方法;
  • 采用持久连接(Connection: keep-alive),多个请求可以共用同一个TCP连接;

1015年,HTTP/0 1018年,HTTP/3.0


5_HTTP的请求方式

在RFC中定义了一组请求方式,来表示要对给定资源执行的操作:

  • GET:GET 方法请求一个指定资源的表示形式,使用 GET 的请求应该只被用于获取数据。

  • HEAD:HEAD 方法请求一个与 GET 请求的响应相同的响应,但没有响应体。

    • 比如在准备下载一个文件前,先获取文件的大小,再决定是否进行下载;
  • POST:POST 方法用于将实体提交到指定的资源。

  • PUT:PUT 方法用请求有效载荷(payload)替换目标资源的所有当前表示;

  • DELETE:DELETE 方法删除指定的资源;

  • PATCH:PATCH 方法用于对资源应部分修改;

  • CONNECT:CONNECT 方法建立一个到目标资源标识的服务器的隧道,通常用在代理服务器,网页开发很少用到。

  • TRACE:TRACE 方法沿着到目标资源的路径执行一个消息环回测试。

在开发中使用最多的是GET、POST请求;

不会修改服务器的数据的方法,有GET、 HEAD、OPTIONS

同一个请求执行多次的效果是一样的,服务器的状态也是一样的。比如GET、 HEAD、OPTIONS、PUT、DELETE

6_HTTP Request Header

在request对象的header中也包含很多有用的信息,客户端会默认传递过来一些信息。例如下图

HTTP Request Header.jpg

content-type是这次请求携带的数据的类型:

  • application/x-www-form-urlencoded:表示数据被编码成以 '&' 分隔的键 - 值对,同时以 '=' 分隔键和值
  • application/json:表示是一个json类型;
  • text/plain:表示是文本类型;
  • application/xml:表示是xml类型;
  • multipart/form-data:表示是上传文件;

content-length:文件的大小长度

keep-alive

  • http是基于TCP协议的,但是通常在进行一次请求和响应结束后会立刻中断;
  • 在http1.0中,如果想要继续保持连接:
  • 浏览器需要在请求头中添加 connection: keep-alive;
  • 服务器需要在响应头中添加 connection:keey-alive;
  • 当客户端再次放请求时,就会使用同一个连接,直接一方中断连接;
  • 在http1.1中,所有连接默认是 connection: keep-alive的;
  • 不同的Web服务器会有不同的保持 keep-alive的时间;
  • Node中默认是5s中;

accept-encoding:告知服务器,客户端支持的文件压缩格式,比如js文件可以使用gzip编码,对应 .gz文件;

accept:告知服务器,客户端可接受文件的格式类型;

user-agent:客户端相关的信息;

响应的header中包括一些服务器给客户端的信息

HTTP Request Header发送给客户端.jpg


7_HTTP Response响应状态码

Http状态码(Http Status Code)是用来表示Http响应状态的数字代码:

HTTP Response响应状态码.jpg


安装谷歌浏览器插件:FeHelper,帮助更好地查看数据


8_场景分析

(1)状态码为200就代表一定发起了请求吗?

状态码为200不一定代表该请求经过了一系列完整的HTTP请求的过程,若资源设置了强缓存字段,将会直接从本地读取缓存(from disk cache)。


(2)静态资源部署方案?

缓存+CDN+文件HASH


(3)为什么会有OPTIONS请求?

因为OPTIONS请求用于获知服务端是否允许跨域请求。

补充说明:跨域指请求的主机名和资源所在的主机名的协议、主机名、端口号三个有任意一个不同的部分,就会发生跨域


(4)跨域的解决方案?

代理服务器

IFrame


(5)鉴权方案

Session + Cookie JWT