TCP协议
衡量页面性能的一个重要指标叫FP,是指从页面加载到首次开始绘制的时长,这个指标直接影响了用户的跳出率,更快的页面响应意味着更多的PV、更高的参与度,以及更高的转化率
这个指标的一个重要影响因素就是网络加载速度
而要优化网络加载速度,就必须对网络有充分的了解,而理解网络的关键是要理解其网络协议,而HTTP和WebSocket等都是基于TCP/IP的,所以这一节详细解析一下TCP/IP协议
本节问题:如何保证页面文件能被完整送达浏览器
一个数据包的旅程
下面分别从“数据包如何送达主机”“主机如何将数据包转交给应用”和“数据是如何被完整地送达应用程序”这三个角度来分析数据的传输过程
互联网,实际上是一套理念和协议组成的体系架构
互联网中的数据都是通过数据包来传输的,如果数据很大,就会分成多个小数据包
IP:把数据包送达目的主机
数据包要在互联网上传递,就必须遵循网际协议(IP)
计算机地址就叫做IP地址,访问任何网站实际上只是我们的计算机向另外一台计算机请求信息
如果要想把一个数据包从主机A发送给主机B,那么在传输之前,数据包上会被附加上主机B的IP地址信息,这样在传输过程中才能正确寻址
额外地,数据包上还会附加上主机A本身的IP地址,有了这些信息主机B才可以回复信息给主机A
这些附加的信息会被装进一个叫IP头的数据结构里,IP头是IP数据包开头的信息,包含IP版本、源IP地址、目标IP地址、生存时间等信息
这是简单的网络分层结构传递数据:
所以一个数据包从主机A到主机B的旅程应该这样:
- 上层将含有“极客时间”的数据包交给网络层;
- 网络层再将IP头附加到数据包上,组成新的 IP数据包,并交给底层;
- 底层通过物理网络将数据包传输给主机B;
- 数据包被传输到主机B的网络层,在这里主机B拆开数据包的IP头信息,并将拆开来的数据部分交给上层;
- 最终,含有“极客时间”信息的数据包就到达了主机B的上层了
UDP:把数据包送达应用程序
IP是非常底层的协议,只负责把数据包传送到对方电脑,但是对方电脑并不知道把数据包交给哪个程序
因此,需要基于IP之上开发能和应用打交道的协议,最常见的是“用户数据包协议(User Datagram Protocol)”,简称UDP
UDP中一个最重要的信息是端口号,端口号其实就是一个数字,每个想访问网络的程序都需要绑定一个端口号
通过端口号UDP就能把指定的数据包发送给指定的程序了,所以IP通过IP地址信息把数据包发送给指定的电脑,而UDP通过端口号把数据包分发给正确的程序
和IP头一样,端口号会被装进UDP头里面,UDP头再和原始数据包合并组成新的UDP数据包,UDP头中除了目的端口,还有源端口号等信息
这里把前面的三层结构扩充为四层结构,在网络层和上层之间增加了传输层:
所以现在一个数据包从主机A到主机B的旅程应该这样:
- 上层将含有“极客时间”的数据包交给传输层;
- 传输层会在数据包前面附加上UDP头,组成新的UDP数据包,再将新的UDP数据包交给网络层;
- 网络层再将IP头附加到数据包上,组成新的IP数据包,并交给底层;
- 数据包被传输到主机B的网络层,在这里主机B拆开IP头信息,并将拆开来的数据部分交给传输层;
- 在传输层,数据包中的UDP头会被拆开,并根据UDP中所提供的端口号,把数据部分交给上层的应用程序;
- 最终,含有“极客时间”信息的数据包就旅行到了主机B上层应用程序这里
在使用UDP发送数据时,有各种因素会导致数据包出错,虽然UDP可以校验数据是否正确,但是对于错误的数据包,UDP并不提供重发机制,只是丢弃当前的包,而且UDP在发送之后也无法知道是否能达到目的地
虽说UDP不能保证数据可靠性,但是传输速度却非常快,所以UDP会应用在一些关注速度、但不那么严格要求数据完整性的领域,如在线视频、互动游戏等
TCP:把数据完整地送达应用程序
上述UDP请求有一个缺点,那就是容易丢失
对于浏览器请求,或者邮件这类要求数据传输可靠性的应用,如果使用UDP来传输会存在两个问题:
- 数据包在传输过程中容易丢失;
- 大文件会被拆分成很多小的数据包来传输,这些小的数据包会经过不同的路由,并在不同的时间到达接收端,而UDP协议并不知道如何组装这些数据包,从而把这些数据包还原成完整的文件
所以,我们引入了TCP协议来解决这两个问题,TCP(Transmission Control Protocol,传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议
TCP协议有两个特点:
- 对于数据包丢失的情况,TCP提供重传机制;
- TCP引入了数据包排序机制,用来保证把乱序的数据包组合成一个完整的文件
也就是说,和UDP头一样,TCP头除了包含了目标端口和本机端口号外,还提供了用于排序的序列号,以便接收端通过序号来重排数据包
TCP单个数据包的传输流程和UDP流程差不多,不同的地方在于,通过TCP头的信息保证了一块大的数据传输的完整性
接下来再看下完整的TCP连接过程,分析TCP是如何保证重传机制和数据包的排序功能的
- 首先,建立连接阶段。这个阶段是通过“三次握手”来建立客户端和服务器之间的连接。TCP 提供面向连接的通信传输。面向连接是指在数据通信开始之前先做好两端之间的准备工作。所谓三次握手,是指在建立一个TCP连接时,客户端和服务器总共要发送三个数据包以确认连接的建立。
- 其次,传输数据阶段。在该阶段,接收端需要对每个数据包进行确认操作,也就是接收端在接收到数据包之后,需要发送确认数据包给发送端。所以当发送端发送了一个数据包之后,在规定时间内没有接收到接收端反馈的确认消息,则判断为数据包丢失,并触发发送端的重发机制。同样,一个大的文件在传输过程中会被拆分成很多小的数据包,这些数据包到达接收端后,接收端会按照TCP头中的序号为其排序,从而保证组成完整的数据。
- 最后,断开连接阶段。数据传输完毕之后,就要终止连接了,涉及到最后一个阶段 “四次挥手”来保证双方都能断开连接
所以,TCP为了保证数据传输的可靠性,牺牲了数据包的传输速度,因为“三次握手”和“数据包校验机制”等把传输过程中的数据包的数量提高了一倍
到这里,我们已经解决了开头提出的问题,我们可以通过TCP协议保证页面文件能被完整送达浏览器