在epoll边缘触发模式下,哪些常见的编程错误会导致CLOSE_WAIT卡住?
What common programming mistakes can cause stuck CLOSE_WAIT in epoll edge triggered mode?
我想知道什么常见的编程情况/错误可能导致服务器进程,我已经进入CLOSE_WAIT,但实际上没有关闭套接字。
我想做的是触发这种情况,这样我就可以解决它。在正常的开发环境中,我无法触发它,但是在实时服务器上使用的相同代码偶尔会触发它们,因此在许多天之后,我们有数百个。
搜索close_wait,它实际上似乎是一个非常普遍的问题,甚至在成熟的和应该编写良好的服务,如nginx。
CLOSE_WAIT
基本上是指远端关闭套接字,但本地应用程序尚未在其上调用close()
。这通常发生在而不是期望从套接字读取数据,因此不关注其可读性的情况下。
为了方便起见,许多应用程序总是监视套接字的可读性,以检测关闭。
一个可以尝试的场景是:
- 对端发送2k的数据并立即关闭数据
- 你的套接字然后注册epoll并获得可读性通知
- 你的应用程序只读取1k的数据
- 停止监控套接字的可读性
- (我不确定边缘触发epoll是否最终会将关机事件作为单独的事件交付)。
参见:
(from man epoll_ctl
)
EPOLLRDHUP(自Linux 2.6.17起)流套接字对端关闭连接,或关闭正在写的一半连接。(这个标志对书写特别有用简单的代码使用边缘触发监控时检测对等端关闭)
相关文章:
- 警告处理为错误这里有什么问题
- "error: no matching function for call to"构造函数错误
- boost::进程间消息队列引发错误
- C++,OpenCV,尝试显示图像时"OpenCV(4.3.0) Error: Assertion failed (size.width>0 && size.height>0)"此错误
- 有关插入适配器的错误。[错误]请求从 'back_insert_iterator<vector<>>' 类型转换为非标量类型
- QT在错误的班级中寻找空位
- vector.resize()中的分配错误
- 代码在main()中运行,但在函数中出现错误
- 释放错误后堆使用
- (C++)分析树以计算返回错误值的简单算术表达式
- Project Euler问题4的错误解决方案
- 我的字符计数代码计算错误.为什么
- 从"int*"强制转换为"unsigned int"会丢失精度错误
- 尝试导入pybind-opencv模块时出现libgtk错误
- CMake项目Boost库错误:Boost/config/compiler/gcc.hpp:165:10:致命错误:cs
- 在某些循环内使用vector.push_back时出现分段错误
- MSVC多行宏编译器错误
- 静态数据成员的问题-修复链接错误会导致编译器错误
- 为什么在运行时没有向我们提供有关分段错误的更多信息?
- 错误:未在此范围内声明'reverse'