capp继承了Class和*.cu设备代码编译

cusp inherited Class and *.cu device code compilation

本文关键字:代码 编译 cu 继承 Class capp      更新时间:2023-10-16

如果这不是小事,请原谅。我有一个小课堂,围绕着cusp::csr_matrix<int,float,cusp::device_memory>,就像这样:

class CuspMatrix 
: public cusp::csr_matrix<int,float,cusp::device_memory>
{
 ...
}

到目前为止,我还没有做任何我认为需要为设备编译的事情。然而,作为一个成员/函数,我确实计划在这个特定的类中编写应该在设备上执行的代码,但如果我理解正确,cusp已经为我提供了这个功能了吗?例如:

ValueType v_nrm2 = cusp::blas::nrm2(V);
cusp::transpose(M,M_t);

理想情况下,计算范数或换位应该编译用于设备执行。如果这是类方法的一部分,在这种情况下我该怎么办?

我是否将类的整个*.hpp头文件作为*.cu,并将其添加到nvcc编译中?我是否只标记*.cu中的实际代码(而不是标头声明),并将其添加到nvcc编译中?或者这些都没有必要吗?

您必须记住的是,尖端是一个建立在thrust之上的模板库,它也是一个模板库。尖点类和推力类方法都包含大量的设备代码,所以如果从它们继承,也会继承大量的设备编码。

这意味着,无论您选择如何构建代码,在"经典"CUDA编译中,类的实例化点和所有包含的尖点和推力模板代码都必须在同一个翻译单元中,并且必须以它认为需要设备代码编译的形式(即在.cu文件中或使用适当的编译器开关)呈现给nvcc。

因此,定义派生类并实例化它的顺序是:

class CuspMatrix 
: public cusp::csr_matrix<int,float,cusp::device_memory>
{
    ...
}
...
{
    CuspMatrix A;
    ...
}

必须使用nvcc进行编译。