CUDA内核作为类的成员函数
CUDA kernel as member function of a class
我使用的是CUDA 5.0和Compute Capability 2.1卡。
问题很简单:内核可以成为类的一部分吗?例如:
class Foo
{
private:
//...
public:
__global__ void kernel();
};
__global__ void Foo::kernel()
{
//implementation here
}
如果不是,那么解决方案是制作一个包装器函数,该函数是类的成员,并在内部调用内核?
如果是,那么它是否可以作为一个正常的私有函数访问私有属性?
(我不只是尝试一下,看看会发生什么,因为我的项目现在还有其他几个错误,而且我认为这是一个很好的参考问题。我很难找到将CUDA与C++一起使用的参考。可以找到基本功能示例,但找不到结构化代码的策略。)
让我暂时不讨论cuda动态并行性(即假设计算能力为3.0或更高版本)。
记住__global__用于cuda函数,这些函数将(仅)从主机调用(但在设备上执行)。如果你在设备上实例化这个对象,它将无法工作。此外,为了使设备可访问的私有数据可用于成员函数,必须在设备上实例化对象。
因此,您可以在宿主对象成员函数中嵌入内核调用(即mykernel<<<blocks,threads>>>(...);
),但内核定义(即带有__global__decorator的函数定义)通常会在源代码中的对象定义之前。如前所述,这种方法不能用于设备上实例化的对象。它也不能访问对象中其他地方定义的普通私有数据。(可能会为一个仅限主机的对象想出一个方案,该对象使用全局内存中的指针来创建设备数据,然后在设备上可以访问这些数据,但乍一看,这样的方案似乎很复杂)。
通常,设备可用的成员函数前面会有__device__decorator。在这种情况下,设备成员函数中的所有代码都是从调用它的线程中执行的
这个问题给出了一个C++对象的例子(在我编辑的答案中),该对象具有可从主机和设备调用的成员函数,并在主机和设备对象之间进行适当的数据复制。
- 对RValue对象调用的LValue ref限定成员函数
- 为什么使用 "this" 指针调用派生成员函数?
- 将公共但非静态的成员函数与ALGLIB集成
- 使用指向成员的指针将成员函数作为参数传递
- 将重载的成员函数传递给函数模板
- 我不小心调用了一个没有自己类对象的成员函数.但这是怎么回事呢
- 如何在C++中使用非静态成员函数作为回调函数
- C++错误C2600:无法定义编译器生成的特殊成员函数(必须首先在类中声明)
- 关联容器的下界复杂性:成员函数与非成员函数
- 在 C++ 中用派生类型重写成员函数
- 链表的泛型函数remove()与成员函数remove)
- 如何将lambda作为模板类的成员函数参数
- constexpr构造函数需要常量成员函数时出现问题
- 将自由函数绑定为类成员函数
- 区分非成员函数和头文件中的成员函数
- 如何从子成员函数修改父公共成员变量
- 保留对其他类的成员函数的引用
- 在运算符重载定义中使用成员函数(const错误)
- 内联如何影响模块接口中的成员函数
- 将成员函数指针作为参数传递给模板方法