开源库复杂的数学问题,如矩阵多,LU, FFT等在OpenCL
Open Source Library for complex mathematical problems like Matrix Mul, LU, FFT etc in OpenCL
GPU在General Purpose中的使用已经很普遍了。最基本的东西,矩阵乘法是OpenCL教程的第一个。而不是为特定的gpu编写代码和内核代码。是否有可能从像MKL之类的库调用它们。Arrayfire在那里,但不是免费的。我试图将我的仿真软件移植到具有矩阵多,LU分解,FFT等的GPU。我正在寻找这些健壮的代码,而不是从头开始编写它们。我已经有一个工作的多开放程序与我,但只是缺乏一些知识在集成它与我的代码。在下一步中,我尝试使用LU,是否有任何可以帮助我的LU代码。
查看ViennaCLhttp://viennacl.sourceforge.net/viennacl-about.html
它有线性代数支持(BLAS1-3),求解器等
除了ViennaCl还有clMagma:
http://icl.cs.utk.edu/magma/news/news.html?id=303相关文章:
- 1D中的非均匀FFT正向和反向测试
- 如何加快本征C++中的LU分解?
- 多 GPU 批处理 1D FFT:似乎只有一个 GPU 可以工作
- 如何使用FFTW库C++计算3D阵列的FFT?
- 如何修复 LU 分解?
- FFT函数的参数是什么意思
- 关于FFTW3大师接口的困惑:3个同时复杂的FFT
- Boost FFT示例-编译时出错,这段代码在做什么
- 寻求有关 FFT 模板的帮助
- 如何使用c++中的ipp库从信号中进行fft
- 如何在 c++ 中使用 FFT 从 32 位浮点数组中提取频率
- FFT的研究 - 为什么它不快?
- 如何在FFT之后设置我的数组的频带
- 如何在SDL2音频流数据上执行实时FFT
- 使用C++ / Python的wav文件的FFT
- 我没有从使用 FFTW 的重叠添加 FFT 卷积中获得预期结果
- 为什么 OpenMP 在这个 fft 代码中停留在 10% 的 CPU 消耗?
- 在同一应用中用浮子和双支持来编译吻FFT
- 如何在cv::dft中指定FFT长度,就像在Python numpy.FFT.rfft中一样
- 开源库复杂的数学问题,如矩阵多,LU, FFT等在OpenCL