将内核函数的参数作为C++结构传递
passing parameters of an kernel function as C++ struct?
我想将内核函数的参数作为给定的结构传递,如下所示
struct kernel_data {
double *A;
double *B;
double *C;
const int *A_dims;
const int *B_dims;
int C_dims[2];
};
为此,我需要用cudaMalloc()
初始化设备指针,但我如何初始化它。 这个函数的这种结构包括我打算传递的这些参数。还是我必须单独通过它们?
只需按值将结构传递给内核,就像将任何其他参数一样:
struct kernel_data args;
cudaMalloc(&(args.A), sizeof(double)*.....);
cudaMalloc(&(args.B), sizeof(double)*.....);
cudaMalloc(&(args.C), sizeof(double)*.....);
cudaMalloc(&(args.A_dims), sizeof(int)*.....);
cudaMalloc(&(args.B_dims), sizeof(int)*.....);
kernel<<<....>>>(args);
参数列表大小有一个理论上的限制,从 256 字节到 4Kb,具体取决于您使用的硬件,如果超过它,请将args
结构复制到设备分配并将其作为指针传递,或将其复制到常量内存指针。
要从主机初始化数组,只需使用标准cudaMemcpy
调用:
cudaMemcpy(args.A, hostA, sizeof(double)*....., cudaMemcpyHostToDevice);
等。
您可以通过复制将此结构传递给内核。请记住,在费米预费米卡上 4KB 上传递给内核的参数的总大小不得超过 256B。
因此,您必须使用 cudaMalloc 来分配设备内存,而不是在结构中设置指向设备内存的指针。最后,你通过复制将你的结构传递给内核。
我强烈建议您避免在C++代码中使用此 struc。而不是
struct kernel_data {
double *A;
double *B;
double *C;
const int *A_dims;
const int *B_dims;
int C_dims[2];
};
你应该做这样的事情
class DeviceData{
public:
DeviceData(...){//Do cudaMalloc here}
~DeviceData(...){//Do cudaFree here}
private:
double *_A;
int _dims;
};
此类将保存设备上可用的数据,并且异常安全。比你可以实现一个可以传递给内核的包装器
class DeviceDataWrapper{
public:
__host__ DeviceDataWrapper(DeviceData& device):
_A(device._A),
_dims(device._dims)
{}
__forceinline__ __device__ double* data(){return _A;}
__forceinline__ __device__ int dims()const{return _dims;}
private:
double *_A;
int _dims;
}
然后以这种方式调用内核
__global__ void myKernel(DeviceDataWrapper a, DeviceDataWrapper b, DeviceData2Wrapper c){
//do something like a.data()[0] = 1;
}
DeviceData A,B;
DeviceData2 C;
myKernel<<< >>>(A,B,C);
相关文章:
- 如何循环打印顶点结构
- 通过方法访问结构
- 使用不带参数的函数访问结构元素
- 预处理器:插入结构名称中的前一个行号
- 为什么在没有显式默认构造函数的情况下,将另一个结构封装在联合中作为成员的结构不能编译
- 孤立代码块在结构中引发异常
- 有什么方法可以遍历结构吗
- 如何在 C# 中映射双 C 结构指针?
- 如何在C++中使用结构生成映射
- 无法将结构注册为增强几何体3D点
- 多成员Constexpr结构初始化
- C++将文本文件中的数据读取到结构数组中
- 如何重构类层次结构以避免菱形问题
- 如何在C++中序列化结构数据
- std::vector的包装器,使数组的结构看起来像结构的数组
- 没有为自己的结构调用列表推回方法
- 奇怪的结构&GCC&clang(void*返回类型)
- 在 c++ 中拥有一组结构的正确方法是什么?
- vscode g++链路故障:体系结构x86_64的未定义符号
- C++概念:如何使用'concept'检查模板化结构的属性?