使用OpenACC设置设备内存中变量的值

Using OpenACC to set the value of a variable in device memory

本文关键字:变量 内存 OpenACC 设置 使用      更新时间:2023-10-16

为什么下面的代码不允许我通过函数intfunvar设置为10

#include <iostream>
void intfun(int * variable){
    #pragma acc parallel deviceptr(variable) num_gangs(1) num_workers(1)
    {
        *variable = 10;
    }
}
int main(){
    int var;
    #pragma acc enter data create(var)
    #pragma acc host_data use_device(var)
    {
        intfun(&var);
    }
    #pragma acc exit data copyout(var)
    std::cout << var << std::endl;
}

编译:

pgcpp -acc main.cpp

执行:

PGCC-S-0155-Compiler failed to translate accelerator region (see -Minfo messages): Unknown variable reference (main.cpp: 5)
PGCC/x86 Linux 14.9-0: compilation completed with severe errors

如何让intfun在设备上设置参数int var的值?

您没有向编译器提供足够的信息来确定*variableintfun中的使用范围。

以下操作似乎很好:

$ cat main7.cpp
#include <iostream>
void intfun(int * variable){
    #pragma acc parallel copy(variable[:1])
    {
        *variable = 10;
    }
}
int main(){
    int var;
        intfun(&var);
    std::cout << var << std::endl;
}
$ pgcpp -acc -Minfo main7.cpp
intfun(int *):
      5, Generating copy(variable[:1])
         Accelerator kernel generated
         Generating Tesla code
$ ./a.out
10
$

在我有copy(variable[:1])的情况下,对于这个特定的例子,copyout(variable[:1])也可以工作。