lua/c++中用户定义的CUDA内核
User-defined CUDA kernels in lua/c++
我希望允许用户定义要在CUDA内核中使用的函数(或由CUDA内核调用)。
我不想向用户公开CUDA API。这些函数应该看起来像典型的c++/lua函数。
我已经检查了pyCUDA,但它似乎只是围绕.cu代码的包装。
我宁愿有一个.loa或.cc文件,并使用函数指针。这有可能吗?
不,这根本不可能。
CUDA内核,通过设计,在GPU上执行。它们被编译成(NVIDIA)GPU特定的机器语言,并在一个与C++函数运行的任何东西完全不同的执行环境中执行,更不用说Lua了。它们不能简单地调用任意代码。
你可能做的最多的事情就是编写一个编译器,从C++/Lua编译到CUDA库中。但对于任何一种语言来说,这都是一项实质性的任务。
相关文章:
- CUDA内核和数学函数的显式命名空间
- 将 2D 推力::d evice_vector 复矩阵传递给 CUDA 内核函数
- 如何将矢量的数据传递给 CUDA 内核?
- 无法在 cuda 内核中使用我的模板类
- CUDA内核printf()在终端中不产生输出,在探查器中工作
- 编译为 cuda 内核调用提供了"expression must have integral or unscoped enum type"
- 使用模板模式优化 CUDA 内核
- 带有大结构变量的 CUDA 内核函数给出了错误的结果
- CUDA 内核在第二次运行时运行得更快 - 为什么?
- 在CUDA内核中传递一个常数整数
- 如何将函数作为CUDA内核参数传递
- 验证调用 cuda 内核的次数
- cuda 内核调用/传递参数中的编译错误
- 预期;在 CUDA 内核上
- CUDA 内核"Only a single pack parameter is allowed"解决方法?
- 降低CUDA内核运行时:内核中矩阵的动态内存分配
- 如何在多个 GPU 上同时执行 cufftXt 和 CUDA 内核
- 执行 CUDA 内核时黑屏C++输出正确的结果
- CUDA 内核中的竞争条件
- 优化三角矩阵计算的 CUDA 内核执行