将所有CUDA功能更改为__host____device__

Change all CUDA functions to __host__ __device__

本文关键字:host device CUDA 功能      更新时间:2023-10-16

我想在CUDA中使用一个exist函数,但它包含许多类和其他函数。在每个函数之前添加__host__ __device__是微不足道的。那么,有没有一种自动的方法可以做到这一点?或者如何让nvcc将所有函数编译为__device__ __host__

基本上,GPU编程都是关于大规模并行性的。它与普通的单线程编程完全不同。除非你只想同时将这些函数应用于大型阵列的单个元素,否则将其编码到GPU中是没有好处的。事实上,GPU核心时钟比处理器慢得多。如果你将主要针对CPU编写的函数以单线程风格编译到GPU,你将面临潜在的性能损失。你需要将你的问题重新思考到GPU范式中。