OpenMP 更新结构体的最快方法

OpenMP fastest way to update a struct

本文关键字:方法 更新 结构体 OpenMP      更新时间:2023-10-16

在我的代码中,我有很多部分有一个双循环,我需要更新结构中的值。问题是它是一个结构数组,所以有很多去引用正在进行。下面是一个示例:

    for(i=0;i<y;i++) {
            for(j=0;j<x;j++) {
                index = i*x+j;
                y1 = (i + 1) % y;
                x1 = (j + 1) % x;
                y2 = (i == 0) ? (i + y - 1) : (i - 1);
                x2 = (j == 0) ? (j + x - 1) : (j - 1);
                str[i *x + j].arr[0]  = c[index].arr[0];
                str[i *x + x1].arr[1] = c[index].arr[1]; 
                str[y1*x + j].arr[2]  = c[index].arr[2]; 
                str[i *x + x2].arr[3] = c[index].arr[3];
                str[y2*x + j].arr[4]  = c[index].arr[4]; 
                str[y1*x + x1].arr[5] = c[index].arr[5];
                str[y1*x + x2].arr[6] = c[index].arr[6];
            }
   }

我想尽可能加快速度,也许使用 OpenMP。我认为会有很多虚假共享,我也无法使用指针。你们知道一种有效的方法来加快速度(和类似的代码(吗?

你试过这样的事情吗?

#pragma omp parallel for
for(i=0;i<y;i++) {
    y1 = (i + 1) % y;
    y2 = i? i-1 : y-1;
    for(j=0;j<x;j++) {
        index = i*x+j;
        x1 = (j + 1) % x;
        x2 = j? j-1:x-1;
        str[i *x +  j].arr[0] = c[index].arr[0];
        str[i *x + x1].arr[1] = c[index].arr[1]; 
        str[y1*x +  j].arr[2] = c[index].arr[2]; 
        str[i *x + x2].arr[3] = c[index].arr[3];
        str[y2*x +  j].arr[4] = c[index].arr[4]; 
        str[y1*x + x1].arr[5] = c[index].arr[5];
        str[y1*x + x2].arr[6] = c[index].arr[6];
    }
}

我认为不会有那么多的错误共享,因为str[]只是从线程中读取的,并且c[]线程之间似乎很好地分离(不同线程写入的缓存行应该很少重叠(。试着计时。如果它扩展良好,那么虚假共享就不是问题。