阅读 27

TCP全连接和半连接

现网问题: 

 server、client负载都不是很高的时候,居然可能会出现如下两个问题 

 1、Client端在多次重发SYN包得不到响应而返回(connection time out)错误 

 2、client端报错read timeout 或者 connection reset by peer

 负载不是很高的情况下,一般不会出现这种情况,所以估计是linux内核参数哪里不对,需要对整个TCP连接进行回顾。

 TCP连接的基本概念:

三次握手: 

 1、第一次握手:客户端发送syn包(syn=j)到服务器,并进入SYN_SEND状态,等待服务器确认;

 2、第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态; 

 3、第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手。

 四次分手: 

 1、客户端向服务器发送一个FIN为1 的TCP报文 

 2、服务器返回给客户端一个确认ACK报文 

 3、服务器同时发送一个FIN报文 

 4、客户机回复ACK报文后(四次握手),连接结束。

Linux内核协议栈为一个tcp连接管理使用两个队列,一个是半链接队列(用来保存处于SYN_SENT和SYN_RECV状态的请求),一个是全连接队列(accpetd队列)(用来保存处于established状态,但是应用层没有调用accept取走的请求)。

全连接队列的大小取决于:min(tcp_max_syn_backlog, net.core.somaxconn)

半连接队列的大小取决于:max(64, tcp_max_syn_backlog) 

全连接队列、半连接队列溢出很容易忽视,对于一些短连接应用(比如Nginx、PHP)更容易爆发。一旦溢出,Server端从cpu、线程状态看负载正常,但压力上不去。而Client端看来,请求耗时较高,但server端记录的服务响应又很短,同时客户端会不定期出现连接超时、socket 读写超时 的现象。

 客户端调整思路 

 对TCP连接失败,增加重试机制和超时时间 

 启用长连接机制 (可减少连接环节开销,从而降低延时)

服务端调整思路

修改内核参数,适当调整 net.core.somaxconn (调整全队列长度)

修改内核参数,适当调整 tcp_max_syn_backlog (调整半队列长度)

文章分类
后端
文章标签