C1060 GPU的奇怪设备特性
Strange Device Properties of C1060 GPU
我正在运行一些代码,这些代码只需获取有关GPU的信息并打印出来。然而,我得到了非常奇怪(和变化)的数字。该代码只是一堆cudaDeviceProperties
打印。
输出:
Global memory: 0mb
Shared memory: 136723055446kb
Constant memory: 136723055540kb
Block registers: 1359818672
Warp size: 32597
Threads per block: 1359826784
Max block dimensions: [ 32597, 1357152712, 32597 ]
Max grid dimensions: [ 1359925824, 32597, -1220823104 ]
这些数字都没有任何意义,这让我认为卡/驱动程序/OS可能有问题。
英伟达SMI:340.93。操作系统:Ubuntu 14.04。
如果能对这里可能发生的事情提供任何帮助,我们将不胜感激。
cudaDeviceProp props;
cudaGetDeviceProperties(&props, i);
cout << i << ": " << props.name << ": " << props.major << "." << props.minor << endl;
cout << " Global memory: " << props.totalGlobalMem / mb << "mb" << endl;
cout << " Shared memory: " << props.sharedMemPerBlock / kb << "kb" << endl;
cout << " Constant memory: " << props.totalConstMem / kb << "kb" << endl;
cout << " Block registers: " << props.regsPerBlock << endl << endl;
cout << " Warp size: " << props.warpSize << endl;
cout << " Threads per block: " << props.maxThreadsPerBlock << endl;
cout << " Max block dimensions: [ " << props.maxThreadsDim[0] << ", " << props.maxThreadsDim[1] << ", " << props.maxThreadsDim[2] << " ]" << endl;
cout << " Max grid dimensions: [ " << props.maxGridSize[0] << ", " << props.maxGridSize[1] << ", " << props.maxGridSize[2] << " ]" << endl;
cout << endl;
在这种特殊情况下,问题恰好是代码生成。C1060是一款具有计算能力的老式gpu。1.3.CUDA 6.5默认情况下(可能)为较新的体系结构生成代码,但通过在使用nvcc编译时显式声明--gpu-arch=compute_13
解决了问题。希望这能帮助任何面临这种情况的人。
相关文章:
- 在使用GPU支持编译Tensorflow时,会遇到CUDA_TOOLKIT_PATH未绑定变量
- 有没有办法简单地从 GPU 调用多个 cpp 输出文件?
- 在 DirectX 11 中从 GPU 读回顶点缓冲区(并获取顶点)
- 跨平台 GPU 计算
- C++:从GPU内存(cudaMemcpy2D)获取BGR图像(cv::Mat)
- 请求最简单的 OpenMP 目标 GPU 示例
- DirectX 11 如何处理来自 GPU 上的 sharedHandle 的图像
- 编译 GPU 的张量流示例自定义操作
- 多 GPU 批处理 1D FFT:似乎只有一个 GPU 可以工作
- 如何在GPU支持下编译tflite?
- OpenCL 在 NVIDIA 和 Intel GPU 上启动内核时CL_INVALID_COMMAND_QUEUE
- OpenGL glGetUniformBlockIndex 在 nvidea GPU 上返回INVALID_INDEX
- SDL GPU 为什么将两个图像分成两个单独的循环更快?
- 使 C++ Pi 近似在 GPU Nvidia 970M CUDA 上的 Paralell 中运行
- 具有 GPU 时间表的卤化物产生黑色图像
- TensorFlow c++ SetDefaultDevice 在多 GPU 模式下
- 在C++应用程序中使用 Tensorflow:如何释放 GPU 内存
- 利用 GPU 的最佳方式
- Cuda 中的多个 GPU - 以前可以使用代码,但现在不再使用
- C1060 GPU的奇怪设备特性