更有效的零设备矢量的方法

More efficient way to zero a device vector

本文关键字:方法 有效      更新时间:2023-10-16

什么是最好的(有效的)方式来零设备矢量分配cudaMalloc之前?

在GPU中启动一个线程来完成它?

链接到cudaMemset()

cudaError_t cudaMemset ( void* devPtr, int  value, size_t count )

将设备内存初始化或设置为一个值。用常量字节值value填充devPtr所指向的内存区域的第一个count字节。

注意,除非devPtr指向固定的主机内存,否则这个函数对主机是异步的。

注意:

  • 注意,此函数也可能返回先前异步启动时的错误代码。