TCP/IP面试常见坑为了增强通用性和兼容性，计算机网络都被设计成层次结构，每一层都遵守一定的规则，因此又了OSI这样一

一、谈一谈你对TCP/IP四层模型，OSI七层模型的理解

为了增强通用性和兼容性，计算机网络都被设计成层次结构，每一层都遵守一定的规则，因此又了OSI这样一个抽象的网络通信参考模型，按照这个标准使计算机网络系统可以互相连接。

物理层 通过网线光缆等这种无力方式将电脑连接起来，传递的数据是bit流（01010）
数据链路层，首先把bit流封装成数据帧的格式，对0，1进行分组，电脑连接起来之后，数据都经过网卡来传输，网卡上定义了全世界唯一的MAC地址，然后再通过广播的形式向局域网内所有电脑发送数据，再根据数据中MAC地址和自身对比判断是否是发给自己的
网络层 广播的效率太低下，为了区分哪些mac地址属于哪一个子网，网络层定义了IP地址和子网掩码，通过对IP和子网掩码进行与运算就知道是否是同一个子网，再通过路由器和交换机进行传输，IP协议属于网络层的协议，
传输层，有了IP地址和MAC地址后，为了确认数据包是从那个进程发送过来的，就需要端口号，通过端口来建立通信，tcp/udp就是属于这层的协议。
会话层，负责建立和断开连接
表示层，为了使的数据能够被其他的计算机理解，再次将数据转换成另外一种格式，比如文字，视频和图片等
应用层，最高层，面向用户，提供计算机网络与最终呈现给用户的界面。

TCP/IP 则是四层的结构，相当于是对OSI模型的简化

数据链路层，也有称为网络访问层，网络接口层，包含了OSI模型的物理层和数据链路层，把电脑连接起来
网络层，IP层，处理IP数据包的传输，路由，建立主机间的通信
传输层，就是为两台主机设备提供端到端的通信
应用层，包含OSI的会话层，包含OSI的会话层，表示层和应用层，提供了一些常用的协议规范，比如FTP，SMTP，HTTP等

总结下来，就是物理层负责通过物理手段将电脑连接起来，数据链路层则对bit流的数据进行分组，网络层建立主机到主机的通信，传输层负责建立端口到端口的通信，应用层最终负责建立连接，数据格式转换，最终呈现给用户。

二、说说TCP 3次握手的过程

建立连接前server端需要监听端口，所以初识状态是LISTEN

client建立连接，发送一个SYN同步包，发送之后状态变为SYN_SENT
server端收到SYN之后，同意建立连接，返回一个ACK响应，同时也会给client发送一个SYN包，发送完成之后状态变成SYN_RCVD
client收到server的ACK之后，状态变为ESTABLISHED，返回ACK给server端
server收到之后状态也变为ESTABLISHED，连接建立完成

三、为什么要三次，两次，四次不行吗

因为tcp是双工传输模式，不区分客户端和服务端，连接的建立是双向的过程，如果只有两次，无法做到双向连接的建立，从建立连接server回复的SYN和ACK合并成一次可以看出，他也不需要4次。

四、挥手为什么需要四次

因为挥手的ACK和FIN不同同时发送，因为数据放送的截止时间不同。

五、四次挥手的过程

client端向server端发送FIN包，进入FIN_WAIT_1状态，代表client端已经没有数据要发送了
server端收到之后，返回一个ACK，进入CLOSE_WAIT等待关闭的状态，因为Server端可能还没有发送完成的数据，client端收到ACK编程FIN_WAIT_2状态。
等到server端的数据都发送完毕之后，server端就像client发送FIN，进入LAST_ACK状态
client收到ACK之后，进入TIME_WAIT的状态，同时回复ACK，server收到之后直接进入CLOSED状态，连接关闭
但是clinet要等待2MSL报文最大生存时间，才会进入closed状态

六、为什么要等发你2MSL的时间才关闭

为了保证连接的可靠关闭，如果server没有收到最后ACK，那么就会重发FIN
为了避免端口重用带来的数据混淆，如果client直接进入closed状态，又用相同端口号向server建立一个连接，上一次连接的部分数据在网络中延迟到达server，数据就可能发生混淆

七、TCP怎么保证传输过程的可靠性？

校验和，发送方在发送数据之前计算校验和，接受方收到数据后同样计算，如果不一致，那么传输有误
确认应答，序列号。TCP进行传输时，数据都进行了编号，每次接受方返回ACK都有确认序列号
超时重传，如果发送方发送数据一段时间后没有收到ACK，那么就重发数据，
连接管理，三次握手，四次挥手
流量控制，TCP协议包头包含16位的窗口大小，接收方会在返回ACK时同时把自己的即时窗口填入，发送方就根据报文中窗口的大小控制发送速度
拥塞控制，刚开始发送数据的时候，拥塞窗口是1，以后每次收到ACK，则拥塞窗口加一，然后将拥塞窗口和收到的窗口取较小值作为世纪发送的窗口，如果发生超时重传，拥塞窗口重置为1，这样做的目的是为了保证传输过程的高效性和可靠性。

八、说下浏览器请求一个网址的过程

首先通过DNS服务器把域名解析成IP地址，通过IP和子网掩码判断是否属于同一个子网
构造应用层请求http报文，传输层添加TCP/UDP头部，网络层添加IP头部，数据链路层添加以太网协议头部
数据经过路由器，交换机转发，最终到达目标服务器，
目标服务器同样解析数据，最终拿到http报文，按照对应的程序的逻辑响应回去

九、知道https的工作原理吗

用户通过浏览器请求访问https网站，服务器收到请求后，选择浏览器支持的加密和hash算法，同时返回数字证书给浏览器，包含颁发机构，网址，公钥，证书有效期等信息
浏览器对证书的内容进行校验，如果有问题，会有提示警告，否则，就生成一个随机数X，同时使用证书中的公钥进行加密，发送给服务器
服务器收到之后，使用私钥解密，得到随机数X，然后使用X对网页内容进行加密，返回给浏览器
浏览器使用支持的加密算法和X进行解密，得到最终的网页内容

十、负载均衡有哪些实现方式

按照类型还可以分为DNS负载均衡，硬件负载均衡，软件负载均衡，其中硬件负载均衡价格昂贵，性能最好，能到达百万级，软件负载均衡包括Nginx，lvs

DNS 是最简单的负载均衡方式，一般实现用于地理级别的负载均衡，不同地域的用户通过DNS解析成不同的IP地址，负载均衡方式简单，但是扩展性很差，控制权在域名服务商
http重定向，通过http响应头的location达到负载均衡的目的，http的302重定向，这种方式对性能有影响，而且增加请求耗时，反向代理，作用于应用层的模式，也被称为七层负载均衡，比如常见的Nginx，性能一般可以达到万级，部署简单，成本低，而且容易扩展
IP，作用于网络层和传输层的模式，也被称为四层负载均衡，通过对数据包的IP地址和端口进行修改来达到负载均衡的效果，常见的有LVS，keepalived，通常支持十万级的负载

十一、说说BIO/NIO/AIO的区别

BIO 同步阻塞IO，每一个客户端连接，服务端都会对应一个处理线程，对于没有分配到处理线程的连接就会被阻塞或者拒绝，相当于是一个连接一个线程
NIO同步非阻塞IO，基于Reactor模型，客户端和channel进行通信，channel可以进行读写操作，通过多路复用器selector来轮训注册在其上的channel，而后再进行IO操作，这样再进行IO操作的时候再用一个线程去处理就可以了，也就是一个请求一个线程
AIO异步非阻塞IO，相比NIO更进一步，完全由操作系统来完成请求的处理，然后通知服务器开启线程去进行处理，因此是一个有效请求一个线程

十二、你怎么理解同步和阻塞？

首先可以认为一个IO操作包含两个部分：1. 发起IO请求，2. 实际的IO读写操作

同步和异步在于第二个，实际的IO读写操作，如果操作系统帮你完成了再通知你，就是异步，否则都叫做同步
阻塞和非阻塞在于发起IO请求，对于NIO来说，通过channel发起IO操作请求后，其实就返回了，所以是非阻塞的

十三、谈一谈你对Reactor模型的理解？

Reactor包含两个组件：

Reactor，负责查询，响应IO事件，当检测到IO事件时，分发给Handler处理
Handler，与IO事件绑定，负责IO事件的处理，包含几种实现方式，
- 单线程Reactor，这个模式reactor和handler在一个线程中，如果某个handler阻塞的话，会导致其他所有的handler无法执行，而且无法利用多核的性能
- 单Reactor多线程，由于decode，compute，encode的操作并非IO的操作，多线程Reactor的思路就是充分发挥多核的特性，同时把非IO的操作波离开，但是，单个Reactor承担了所有的事件监听，响应工作，如果连接过多还是存在性能问题
- 多Reactor多线程，为了解决单Reactor的性能问题，就产生了多Reactor的模式，其中mainReactor建立连接，多个subReactor则负责数据读写