设备内存空间中的 CUDA 程序内核代码
cuda program kernel code in device memory space
有没有办法找出,gpu(设备)内存中有多少内存占用了内核代码(执行)?如果我有 512 MB 的设备内存,我如何知道有多少可供分配?可视探查器可以显示此类信息吗?
程序代码占用的内存非常少。CUDA 上下文的其余部分(本地内存、常量内存、printf 缓冲区、堆和堆栈)使用更多。CUDA 运行时 API 包括cudeGetMemInfo
调用,它将返回代码可用的可用内存量。请注意,由于碎片和页面大小限制,您将无法分配内存的每个最后一个可用字节。最佳策略是从最大值开始,然后递归尝试连续分配较小的分配,直到获得成功的分配。
您可以在我对类似问题的回答中看到对设备内存消耗的更全面的解释,
相关文章:
- 如何在 cuda 中将 kd 树从主机复制到驱动程序
- Cuda 基本程序 (将值写入矩阵和 std:cout 不起作用) ;主功能不启动
- 使用Cmake进行简单的CUDA程序
- CUDA 程序没有预期的那么快
- 将Parralel CUDA程序转换为顺序运行
- CUDA 程序不测量执行时间:cuda事件记录
- 示例CUDA程序崩溃
- 为什么我的 CUDA 程序的初始执行比后续执行花费更长的时间
- 执行 CUDA 程序时分段错误
- CUDA 程序比 CPU 程序慢,但内核更快
- 设备内存空间中的 CUDA 程序内核代码
- CUDA程序崩溃驱动程序
- 哪个opencv cuda库我需要运行一个简单的opencv cuda程序
- "Lane User Stack Overflow"调试 CUDA 程序
- 在linux上编译一个基本的OpenCV + Cuda程序
- 为什么这个CUDA程序在我写入设备内存时崩溃?
- 算术Cuda程序编译错误
- 如何调试混合cuda C++程序中的主机代码
- 基本 CUDA 程序的问题.代码或编译器
- 是否可以在多GPU机器上执行CUDA程序的多个实例