线程安全的并行RNG比顺序rand()慢

Thread-safe parallel RNG slower than sequential rand()

本文关键字：rand 顺序安全并行 RNG 线程更新时间：2023-10-16

我使用这个带有线程安全函数的Pi计算版本

rand_r

但是，与使用

的顺序程序相比，并行运行该程序似乎更慢(答案是错误的)。

rand()

不是线程安全的。似乎这种使用方式也不是线程安全的。但是我不明白为什么，因为我读了很多关于线程安全prng的问题，并且了解到rand_r应该足够安全。

#include <iostream>
#include <random>
#include <ctime>
#include "omp.h"
#include <stdlib.h>
using namespace std;
unsigned seed;
int main()
{
double start = time(0);
int i, n, N;
double x, y;

N = 1<<30;
n = 0;
double pi;

#pragma omp threadprivate(seed)
#pragma omp parallel private(x, y) reduction(+:n) 
{
for (i = 0; i < N; i++) {
seed = 25234 + 17 * omp_get_thread_num();
    x = rand_r(&seed) / (double) RAND_MAX;
    y = rand_r(&seed) / (double) RAND_MAX;
    if (x*x + y*y <= 1)
        n++;
}
}
pi = 4. * n / (double) (N);
cout << pi << endl;
double stop = time(0);
cout << (stop - start) << endl;
return 0;
}

注:顺便问一下，

中的神奇数字是什么?

seed = 25234 + 17 * omp_get_thread_num();

?我从一些答案中偷来的。

EDIT: Gilles的评论帮助了我。决议是:1. 切换for循环和种子初始化的行。2. 为

添加#pragma omp

修改后的代码为

#pragma omp parallel private(x, y, seed)
{
seed = 25234 + 17 * omp_get_thread_num();
#pragma omp for reduction(+:n)
for (int i = 0; i < N; i++) {
    x = (double) rand_r(&seed) / (double) RAND_MAX;
    y = (double) rand_r(&seed) / (double) RAND_MAX;
    if (x*x + y*y <= 1)
       n++;
}
}

问题解决

显然，与rand()相比，rand_r()中的指令更多。下面是从一个实现中复制的。因此，rand_r()比rand()需要更多的时间来完成一轮是合理的。

int
rand_r(unsigned int *ctx)
{
    u_long val = (u_long) *ctx;
    int r = do_rand(&val);
    *ctx = (unsigned int) val;
    return (r);
}

static u_long next = 1;
int
rand()
{
    return (do_rand(&next));
}

由于rand()不是线程安全的，如果并行使用rand()，输出可能是不正确的。更糟糕的是，你仍然会得到一个结果，但不知道它在小规模测试中是否正确。