卤化物::GPU 上的缓冲区
Halide::Buffer on GPU
我已经有一个应用程序可以获取输入图像,将它们复制到GPU,然后将一些CUDA过滤器应用于该图像。因此,当我想实现一个新过滤器时,我只编写过滤器本身(即内核(,因为 CPU-GPU 复制逻辑已经存在。
现在我想尝试使用 Halide 为 CUDA 编写图像过滤器,我遇到了一个问题,即表示输入图像的 Halide::Buffer 被分配在 CPU 上,所以我必须更改我现有的复制逻辑。
有没有办法使用GPU上已有的数据初始化Halide::Buffer,并避免额外的复制。
是的,您可以使用 Halide::Buffer(nullptr, ...尺寸...构造函数,然后调用 Buffer::d evice_wrap_native 以将 cuda 指针与其关联。
相关文章:
- C++字符*缓冲区的大小
- 为什么msgrcv()将垃圾字符馈送到缓冲区
- 使用动态分配的数组会导致代码分析发出虚假的C6386缓冲区溢出警告
- ostream过载时的缓冲区冲洗
- C++中的高效循环缓冲区,它将被传递给C样式数组函数参数
- Xaudio2在更改缓冲区或循环时弹出声音
- 为什么我在leetcode上收到AddressSanitizer:地址0x602000000058上的堆缓冲区溢出错误
- 如何将图像传输到c++(dll)中的缓冲区,然后在c#的缓冲区中读/写
- 如何在cpp.中使用协议缓冲区存储大缓冲区/数组(char/int)
- 多线程双缓冲区
- 在使用GPU支持编译Tensorflow时,会遇到CUDA_TOOLKIT_PATH未绑定变量
- Android P-9.0.0_r53 Logcat主缓冲区超出定义大小
- 套接字读取后,我在缓冲区中看到意外输入
- std::带有自定义缓冲区的 iostream 不允许我写入
- 在 DirectX 11 中从 GPU 读回顶点缓冲区(并获取顶点)
- 卤化物::GPU 上的缓冲区
- 计算gpu前缓冲区中像素的平均值,而无需将前缓冲区复制回系统内存
- 是否可以在没有完全定义着色器的情况下测试缓冲区数据是否成功加载到GPU上?(C++、OpenGL 4.4、GLFW)
- GPU上不同类型的缓冲区
- 如何通过 OpenGL 缓冲区将 glm 数据类型直接传递给 GPU