在 OpenMP 循环中调用函数

Call a function inside an OpenMP for loop

本文关键字:调用 函数 循环 OpenMP      更新时间:2023-10-16

刚刚开始使用OpenMP。我想知道是否可以在调用外部函数的 for 循环中运行 OpenMP 并行,该函数本身不调用任何其他函数。我输入了一些简单的代码来说明我的观点:

#pragma omp parallel for
for(span=0;span<info.nospanelement;span++)
{
    some_function(info,wakePtr[time][span],P,w_ind,1);
    //additions to be done each repeat
    w_wake[0] += w_ind[0];
    w_wake[1] += w_ind[1];
    w_wake[2] += w_ind[2];
}

我知道我需要在调用中添加更多内容,但是这个 openMp 循环在技术上可以工作吗?

切勿让不同的线程在没有适当同步的情况下编写相同的变量,从而避免争用条件

在程序中,多个线程读取变量的相同值,然后每个线程向其添加另一个值,然后所有线程将结果写入同一位置,以便许多计算被覆盖并且不会加起来达到最终结果。因此,程序计算的结果低于正确值(顺便说一下,您应该准确说明程序的结果与预期结果有何不同)。

一个简单但效率低下的解决方法是使用原子添加:

#pragma omp parallel for
    for(span=0;span<info.nospanelement;span++) {
        some_function(info,wakePtr[time][span],P,w_ind,1);
        //additions to be done each repeat
#pragma omp atomic
    w_wake[0] += w_ind[0];
#pragma omp atomic
    w_wake[1] += w_ind[1];
#pragma omp atomic
    w_wake[2] += w_ind[2];
}

并行求和更有效的方法是让每个线程在私有变量中累积值(仅由该线程看到),从而获得部分总和。

#pragma omp parallel 
{
    int wake0 = wake1 = wake2 = 0; // private variables
    #pragma omp for
    for(span=0;span<info.nospanelement;span++)
    {
        some_function(info,wakePtr[time][span],P,w_ind,1);
        //additions to be done each repeat
        wake0 += w_ind[0];  // accumulate in private variable
        wake1 += w_ind[1];
        wake2 += w_ind[2];
    }
// now we're out of the loop but still inside the parallel region
// so, let's add up the partial sums
#pragma omp atomic
    w_wake[0] += wake0;
#pragma omp atomic
    w_wake[1] += wake1;
#pragma omp atomic
    w_wake[2] += wake2;
}

通常最好让 OpenMP 管理归约操作,但如果您需要将结果存储在数组中,则以这种方式自己执行可能更容易。

另一方面,如果你真的不需要数组,那么你可以简单地这样做:

int wake0 = wake1 = wake2 = 0; // SHARED variables this time
#pragma omp parallel for reduction(+ : wake0, wake1, wake2)
{
    for(span=0;span<info.nospanelement;span++)
    {
        some_function(info,wakePtr[time][span],P,w_ind,1);
        //additions to be done each repeat
        wake0 += w_ind[0];  // accumulate in private variable
        wake1 += w_ind[1];
        wake2 += w_ind[2];
    }
}