为什么没有CUDA __device__属性定义类头工作?(c++)
Why defining class headers without CUDA __device__ attribute works? (C++)
我有一个.h文件,声明如下:
class Foo{
public:
inline int getInt();
};
和我的.cu文件定义如下:
__device__ int Foo::getInt(){
return 42;
}
这非常棒,因为尽管我不能从host调用getInt
,但我可以在。cpp文件中包含。h文件,这样我就可以在主机上看到类型声明。但对我来说,它似乎不应该工作,所以为什么我不需要把__device__
属性放在。h文件?
如果它工作,它不应该。这可能是CUDA编译器中的一个错误,将来可能会修复-所以不要依赖它。
然而,如果你想让类对主机(和非cuda编译器)可见,但是你有一些__device__
功能,你不需要在主机上,你可以总是用#ifdef __CUDACC__
—#endif
封装这些功能。__CUDACC__
是在使用nvcc编译时预定义的,否则不是。所以你可以在标题中写这样的内容:
class Foo{
public:
#ifdef __CUDACC__
inline __device__ int getInt();
#endif
};
如果你害怕有太多的预处理器ifdef,你也可以做如下的技巧:
#ifdef __CUDACC__
#define HOST __host__
#define DEVICE __device__
#else
#define HOST
#define DEVICE
#endif
...
class Foo{
public:
inline HOST DEVICE int getInt();
};
改成:
__device__ int Foo::getInt(){
return 42;
}
问题在于函数的返回类型。它不是void
,它是int
。
相关文章:
- QSqlquery prepare()和bindvalue()不工作
- 导入库可以跨dll版本工作吗
- 以螺旋方式打印矩阵的程序.(工作不好)
- 对象指针在c++中是如何工作的
- 为什么在Windows上的VS 2019和Clang 9中"size_t"在没有标题的情况下工作
- VSOMEIP-2个设备之间的通信(TCP/UDP)不工作
- 为字符串中每 N 个字符插入空格的函数没有按照我认为的方式工作?
- C++为线程工作动态地分割例程
- 为什么我的 std::ref 无法按预期工作?
- 布尔比较运算符是如何在C++中工作的
- SampleConsensusPrerejective(ext.RANSAC)是如何真正工作的
- 不确定要在我的main中放入什么才能使我的代码正常工作
- 为什么std::condition_variable notify_all的工作速度比notify_one快(对于随机请
- <<操作员在下面的行中工作
- 有人能解释一下为什么下界是这样工作的吗C++的
- ExtractIconEx:可以工作,但偶尔会崩溃
- C++中的memset函数工作不正常
- 当我在第一个循环中使用"auto"时,它工作正常,但是使用"int"它会给出错误,为什么?
- 链表c++插入,所有情况都已检查,但没有任何工作
- 为什么stream::忽略未按预期工作