如何在CUDA线程内计算矩阵的指数
How to compute exponential of a matrix inside CUDA thread?
我需要以某种方式能够在CUDA内核中计算矩阵的指数。是否有任何库的函数可以从CUDA线程内调用此任务?或者也许有可能从头开始实现这个函数作为__device__
函数?
我使用Microsoft Visual Studio 2008 Express进行主机代码编译,并从toolkit 3.2v中使用nvcc编译器。
GPU: NVIDIA GeForce GT640(计算能力3.0)
不,CUDA库中没有这样的东西,但您可以查看以下代码来帮助您在CUDA中设计解决方案:
https://github.com/poliu2s/MKL/blob/master/matrix_exponential.cpp如果你使用的是3.5的体系结构,可以通过从另一个__global__
内核调用__global__
内核而不返回主机,这样你就可以设置你想要执行的配置(线程和块)来更容易地解决你的问题(动态并行)。
:
__global__ child( ... )
{
....
}
__global__ parent( ... )
{
child<<< ..., ... >>>( ... )
}
希望对大家有所帮助
相关文章:
- 为什么"do while"循环不断退出,即使条件计算结果为 false?
- 递归函数计算序列中的平方和(并输出过程)
- (C++)分析树以计算返回错误值的简单算术表达式
- 我的字符计数代码计算错误.为什么
- 在计算中使用二的幂有多有利可图
- 如何计算文件中的"columns"数?
- 使用简单类型列表实现的指数编译时间.为什么
- 计算排序向量的向量中唯一值的计数
- 如何使用 std::累积在 C++ 中计算总和立方体
- 使用Qt C++计算类似Git的SHA1哈希
- OpenCV C++.快速计算混淆矩阵
- 如何计算复矩阵的指数
- 该递归代码用于计算指数的运行时间是多少
- 您将如何计算指数移动平均线的 X° 步长?
- Chris Hamilton的紧致希尔伯特码-用于计算紧致希尔伯特指数
- C++程序计算热量指数,但没有提供预期结果
- 进行非常小的(或大的)指数计算
- C++函数,从double开始进行基数为10的有效+指数计算
- 如何计算指数分数
- 如何在CUDA线程内计算矩阵的指数