方舟服务器器连接状态有那么多种！就拿两个来说！TIME WAIT,和established！假设方舟服务器器

点击联系发帖人 时间：2014-10-13 18:32

方舟服务器

休息一下喘口气，一开始只是打算说说TIME_WAIT和CLOSE_WAIT的区别没想到越挖越深，这也是写博客总结的好处总可以有意外的收获。

TIME_WAIT状态可以通过优化方舟服务器器参数得到解决因为发生TIME_WAIT的情况是方舟服务器器自己可控的，要么就是对方连接的异常要么就是自己没有迅速回收资源，總之不是由于自己程序错误导致的

如果你使用的是HttpClient并且你遇到了大量CLOSE_WAIT的情况，那么这篇日志也许对你有用：

所以如果将大量CLOSE_WAIT的解决办法總结为一句话那就是：查代码因为问题出在方舟服务器器程序里头啊。

}

查看系统的网络连接状态检测到方舟服务器器有大量的time_wait决定优化内核参数试验下：

CLOSED：无连接是活动的或正在进行
LISTEN：方舟服务器器在等待进入呼叫
SYN_RECV：一个连接请求已经到達，等待确认
SYN_SENT：应用已经开始打开一个连接
ESTABLISHED：正常数据传输状态，表示正通信
CLOSING：两边同时尝试关闭
TIME_WAIT：另一边已初始化一个释放表示主動关闭　　　　CLOSE_WAIT：被动关闭
LAST_ACK：等待所有分组死掉

在高并发短连接的server端，当处理完client请求后立刻closesocket此时会出现time_waitclient再并发2000个连接，此时部分连接则連接不上了

time_wait状态，持续2*MSL(Max Segment Lifetime)两倍最大段生存期,MSL的值是2分钟缺省240s,但是在实际的实现中，常用的值有以下三种：30秒1分钟，2分钟对于基于TCP的HTTP協议，关闭TCP连接的是Server端这样，Server端会进入TIME_WAIT状态可想而知，对于访问量大的Web

方舟服务器器保持了大量TIME_WAIT状态

这种情况比较常见一些爬虫方舟服务器器或者WEB方舟服务器器（如果网管在安装的时候没有做内核参数优化的话）上经常会遇到这个问题，TIME_WAIT是主动关闭连接的一方保持的狀态对于爬虫方舟服务器器来说他本身就是“客户端”，在完成一个爬取任务之后他就会发起主动关闭连接，从而进入TIME_WAIT的状态然后茬保持这个状态2MSL（max segment lifetime）时间之后，彻底关闭回收资源为什么要这么做？明明就已经主动关闭连接了为啥还要保持资源一段时间呢这个是TCP/IP嘚设计者规定的，主要出于以下两个方面的考虑：

目前的解决思路就是让方舟服务器器能够快速回收和重用那些TIME_WAIT的资源，让每个TIME_WAIT早点过期

}

它会显示例如下面的信息：

方舟垺务器器出现异常最长出现的状况是：

方舟服务器器保持了大量的TIME_WAIT状态

方舟服务器器保持了大量的CLOSE_WAIT状态。

我们也都知道Linux系统中分给每个鼡户的文件句柄数是有限的而TIME_WAIT和CLOSE_WAIT这两种状态如果一直被保持，那么意味着对应数目的通道(此处应理解为socket一般一个socket会占用方舟服务器器端一个端口，方舟服务器器端的端口最大数是65535)一直被占用一旦达到了上限，则新的请求就无法被处理接着就是大量Too Many Open

下面来讨论这两种狀态的处理方法，网络上也有很多资料把这两种情况混为一谈认为优化内核参数就可以解决，其实这是不恰当的优化内核参数在一定程度上能解决time_wait过多的问题，但是应对close_wait还得从应用程序本身出发

方舟服务器器保持了大量的time_wait状态

这种情况比较常见，一般会出现在爬虫方舟服务器器和web方舟服务器器(如果没做内核参数优化的话)上那么这种问题是怎么产生的呢？

从上图可以看出time_wait是主动关闭连接的一方保持的狀态对于爬虫方舟服务器器来说它自身就是客户端，在完成一个爬取任务后就会发起主动关闭连接从而进入time_wait状态，然后保持这个状态2MSL時间之后彻底关闭回收资源。这里为什么会保持资源2MSL时间呢这也是TCP/IP设计者规定的。

TCP要保证在所有可能的情况下使得所有的数据都能够被正确送达当你关闭一个socket时，主动关闭一端的socket将进入TIME_WAIT状态而被动关闭一方则转入CLOSED状态，这的确能够保证所有的数据都被传输当一个socket關闭的时候，是通过两端四次握手完成的当一端调用 close()时，就说明本端没有数据要发送了这好似看来在握手完成以后，socket就都可以处于初始的CLOSED状态了其实不然。原因是这样安排状态有两个问题首先，我们没有任何机制保证最后的一个ACK能够正常传输第二，网络上仍然有鈳能有残余的数据包(wandering duplicates)我们也必须能够正常处理。

TIMEWAIT就是为了解决这两个问题而生的

假设最后的一个ACK丢失，那么被动关闭一方收不到这最後一个ACK则会重发FIN此时主动关闭一方必须保持一个有效的(time_wait状态下维持)状态信息，以便可以重发ACK如果主动关闭的socket不维持这种状态而是进入close狀态，那么主动关闭的一方在收到被动关闭方重新发送的FIN时则响应给被动方一个RST被动方收到这个RST后会认为此次回话出错了。所以如果TCP想偠完成必要的操作而终止双方的数据流传输就必须完全正确的传输四次握手的四步，不能有任何的丢失这就是为什么在socket在关闭后，任嘫处于time_wait状态的第一个原因因为他要等待可能出现的错误(被动关闭端没有接收到最后一个ACK)，以便重发ACK

假设目前连接的通信双方都调用了close(),雙方同时进入closed的终结状态，而没有走 time_wait状态则会出现如下问题：假如现在有一个新的连接建立起来，使用的IP地址与之前的端口完全相同現在建立的一个连接是之前连接的完全复用，我们还假定之前连接中有数据报残存在网络之中这样的话现在的连接收到的数据有可能是の前连接的报文。为了防止这一点TCP不允许新的连接复用time_wait状态下的socket。处于time_wait状态的socket在等待2MSL时间后(之所以是两倍的MSL是由于MSL是一个数据报在网絡中单向发出到认定丢失的时间，即(Maximum Segment Lifetime)报文最长存活时间一个数据报有可能在发送途中或是其响应过程中成为残余数据报，确认一个数据報及其响应的丢弃需要两倍的MSL)将会转为closed状态。这就意味着一个成功建立的连接，必须使得之前网络中残余的数据报都丢失了

再引用網络中的一段话：

值得一说的是，基于TCP的http协议一般(此处为什么说一般呢，因为当你在keepalive时间内主动关闭对方舟服务器器端的连接时那么主动关闭端就是客户端,否则客户端就是被动关闭端。下面的爬虫例子就是这种情况)主动关闭tcp一端的是server端这样server端就会进入time_wait状态，可想而知对于访问量大的web方舟服务器器，会存在大量的time_wait状态假如server一秒钟接收1000个请求，那么就会积压240*个time_wait状态(RFC 793中规定MSL为2分钟，实际应用中常用的昰30秒1分钟和2分钟等。)维持这些状态给方舟服务器器端带来巨大的负担。当然现代操作系统都会用快速的查找算法来管理这些 TIME_WAIT所以对於新的 TCP连接请求，判断是否hit中一个TIME_WAIT不会太费时间但是有这么多状态要维护总是不好。

HTTP协议1.1版本规定default行为是keep-Alive也就是会重用tcp连接传输多个 request/response。之所以这么做的主要原因是发现了我们上面说的这个问题

方舟服务器器保持了大量的close_wait状态

time_wait问题可以通过调整内核参数和适当的设置web方舟服务器器的keep-Alive值来解决。因为time_wait是自己可控的要么就是对方连接的异常，要么就是自己没有快速的回收资源总之不是由于自己程序错误引起的。但是close_wait就不一样了从上图中我们可以看到方舟服务器器保持大量的close_wait只有一种情况，那就是对方发送一个FIN后程序自己这边没有进┅步发送ACK以确认。换句话说就是在对方关闭连接后程序里没有检测到，或者程序里本身就已经忘了这个时候需要关闭连接于是这个资源就一直被程序占用着。这个时候快速的解决方法是：

关闭正在运行的程序这个需要视业务情况而定。

尽快的修改程序里的bug然后测试提交到线上方舟服务器器。

直到写这篇文章的时候我才完全弄明白之前工作中遇到的一个问题程序员写了爬虫(php)运行在采集方舟服务器器A仩，程序去B方舟服务器器上采集资源但是A方舟服务器器很快就发现出现了大量的close_wait状态的连接。后来手动检查才发现这些处于close_wait状态的请求結果都是404那就说明B方舟服务器器上没有要请求的资源。

下面引用网友分析的结论：

服务器A是一台爬虫方舟服务器器它使用简单的HttpClient去请求资源方舟服务器器B上面的apache获取文件资源，正常情况下如果请求成功，那么在抓取完资源后方舟服务器器A会主动发出关闭连接的请求，这个时候就是主动关闭连接方舟服务器器A的连接状态我们可以看到是TIME_WAIT。如果一旦发生异常呢假设请求的资源方舟服务器器B上并不存茬，那么这个时候就会由方舟服务器器B发出关闭连接的请求方舟服务器器A就是被动的关闭了连接，如果方舟服务器器A被动关闭连接之后程序员忘了让HttpClient释放连接那就会造成CLOSE_WAIT的状态了。

}

天天发财游戏网