这是从信号处理程序返回值的可靠方法吗

Is this a reliable way of returning values from a signal handler?

本文关键字:方法 返回值 信号处理 程序      更新时间:2023-10-16

我想收集已终止子流程的pid,但我在与信号处理程序通信时遇到了问题。。。我没有c(++)11。这个有效吗?还请考虑到我的程序将是多线程的(但队列将仅从一个线程使用)。

#include <iostream>
#include <csignal>
#include <cstdlib>
#include <cstdio>
#include <unistd.h>
#include <sys/wait.h>
template<typename _ValueType, int _Capacity>
class signal_result_queue
{
public:
    static const int capacity = _Capacity;
    typedef _ValueType value_type;
private:
    //+1 so we can distinguish empty from full
    volatile value_type _data[capacity+1];
    volatile sig_atomic_t _base;
    volatile sig_atomic_t _next;
    volatile sig_atomic_t _overflows;
public:
    signal_result_queue()
    : _base(0)
    , _next(0)
    , _overflows(0)
    {}
    void push_sh(value_type value)
    {
        int base = _base; // we are not interrupted anyway
        int next = _next; // same here
        int before_base = wrap(base-1);
        if(next == before_base)
        {
            ++_overflows;
        }
        else
        {
            _data[next] = value;
            _next = wrap(next+1);
        }
    }
    int overflows_t1()
    {
        int overflows = _overflows;
        _overflows -= overflows;
        return overflows;
    }
    bool pop_t1(value_type& result)
    {
        // this is only changed by us.
        int base = _base;
        // It might increase but no problem
        int next = _next;
        if(base == next)
        {
            return false;
        }
        else
        {
            result = _data[base];
            _base = wrap(base+1);
            return true;
        }
    }
private:
    static int wrap( int i )
    {
        while(i>=capacity+1)
        {
            i-=(capacity+1);
        }
        while(i<0)
        {
            i+=(capacity+1);
        }
        return i;
    }
};
signal_result_queue<pid_t, 20> q;
void sigchld_handler(int)
{
    pid_t pid;
    while((pid = waitpid(static_cast<pid_t>(-1), 0, WNOHANG)) > 0){
        q.push_sh(pid);
    }
}
int main()
{
    struct sigaction sa;
    sa.sa_handler = &sigchld_handler;
    sigemptyset(&sa.sa_mask);
    sa.sa_flags = SA_RESTART | SA_NOCLDSTOP;
    if (sigaction(SIGCHLD, &sa, 0) == -1) {
      perror(0);
      std::exit(1);
    }
    for(int i=0;i<10;i++)
    {
        pid_t pid = fork();
        if(pid == 0) // child
        {
            sleep(i);
            return 0;
        }
        else if(pid == -1) // error
        {
            std::cout << "fork error" << std::endl;
        }
        else // parent
        {
            std::cout << "fork pid: " << pid <<  std::endl;
        }
    }
    int terminated = 0;
    do
    {
        sleep(1);
        int overflows = q.overflows_t1();
        if(overflows > 0)
        {
            std::cout << "Overflow in queue:" << overflows << std::endl;
        }
        pid_t val;
        while(q.pop_t1(val))
        {
            terminated++;
            std::cout << "Terminated: " << val <<  std::endl;
        }
    } while(terminated < 10);
    return 0;
}

这不是一种安全的方法,原因有两个:

  • volatile不足以避免多线程程序中的竞争条件。sig_atomic_t保证是信号重入的原子,但我怀疑它是否足以用于多线程
  • 全局队列变量的使用不符合信号处理程序的可重入性要求

使用C++11,您可以使用atomic而不是volatile。如果没有C++11,您需要使用互斥锁来保护对共享变量的访问,从而保护对队列的并发访问。这将解决上述两个问题。

如有任何疑问,可进行额外演示:

只是为了更详细地说明它有多不安全:

假设处理了第一个过程信号:

    int base = _base; // acces to _base is atomic. It's protected ONLY DURING THE STATEMENT
    int next = _next; // same here
    int before_base = wrap(base-1);

现在假设另一个线程调用处理程序,并在CPU上运行。为了简单起见,假设第一个被系统调度器挂起。因此,处理程序的第二个实例执行:

    int base = _base; // SAME BASE IS STORED LOCALLY  
    int next = _next; // SAME NEXT IS STORED LOCALLY 
    int before_base = wrap(base-1);

因此,此时,处理程序的两个实例在其basenext的本地副本中都具有相同的索引。现在第二个例子还在继续:

        ...
        _data[next] = value;   // value is stored in the queue
        _next = wrap(next+1);  // and _next is incremented.  

在这里,调度器再次唤醒第一个实例,并立即继续:

        _data[next] = value;   // USES ITS LOCAL COPY OF NEXT, WRITE IN SAME PLACE THAN THE OTHER INSTANCE !!
        _next = wrap(next+1);  // and _next is incremented BASED ON LOCAL COPY.  

因此,此时,在您的队列中,您将只拥有本应存储的两个值中的一个。

我的朋友解决了这个问题,他只在信号发生时增加一个volatile sig_atomic_t,并在MAIN线程中使用waitpid。这太简单了。我在信号处理程序中看到了一个调用waitpid的代码,但我没有意识到它稍后可以在主线程中调用。不需要此队列。