咖啡因多gpu CUDNN_STATUS_EXECUTION_FAILED
caffe multi-gpu CUDNN_STATUS_EXECUTION_FAILED
我正在windows环境中的一个启动多个线程的c++项目(VS2105)中工作。PC有两个NVIDIA GeForce GTX 1080。每个线程在GPU模式下使用不同的caffe分类器。
如果所有线程都使用一个GPU,则程序运行良好。无论是使用GPU0还是使用GPU1,它都能很好地工作。当我为每个线程使用不同的GPU时,问题就来了。例如,如果程序启动两个线程,线程1中的分类器使用GPU 0(Caffe::SetDevice(0);
),线程2中的分类器使用GPU1(Caffe::SetDevice(1);
),则预测开始工作,但突然我得到错误cudnn_conv_layer.cu:28] Check failed: status == CUDNN_STATUS_SUCCESS (8 vs. 0) CUDNN_STATUS_EXECUTION_FAILED
我在使用python接口的多线程项目中看到过类似的错误,这些错误与使用一个GPU的CuDNN线程安全问题有关,但在单个GPU中程序运行良好。
我的模型是在单个GPU上训练的。我应该在GPU 0和GPU 1中训练单独的模型吗?。我应该以任何特殊的方式配置分类器以在多GPU多线程环境中使用它吗?。
我使用cuda 8.0的caffe的windows分支,并使用caffe作为静态库链接到项目的c++接口。
遇到了同样的问题。。。解决了"锁定",现在用一个gpu 一次性工作
相关文章:
- C++,OpenCV,尝试显示图像时"OpenCV(4.3.0) Error: Assertion failed (size.width>0 && size.height>0)"此错误
- LLVM 编译:目标的配方 '../lib/IR/Release+Asserts/Intrinsics.gen.tmp' failed
- 流行"Debug Assertion Failed"
- 提升获取文本的区域设置"Conversion failed"
- dopen():不以 root 身份运行时"failed to map segment from shared object"
- Qt 错误消息"qt.network.ssl: QSslSocket::connectToHostEncrypted: TLS initialization failed"
- 使用外部依赖项运行 VC++ 单元测试时"Failed to set up execution context"
- QListWidget 的 editItem() 输出"edit: editing failed"
- 我在C++中收到错误" [Error] ld returned 1 exit status".帮我解决这个问题
- 为什么错误"permission denied","id returned 1 exit status"仅在 IM 使用 C++ 中的头文件 fstream 时才出现
- 无法将 IOKit 驱动程序与 IOHIDFamily 链接:"dependency load failed"
- ISALPHA 导致 C++ "Debug Assertion Failed"
- SDL_Init失败并显示'SDL_Error: Failed to connect to the Mir Server'
- 仅在测试中"dlopen failed: is 32-bit instead of 64-bit"
- 凯撒密码程序中"Debug Assertion Failed!"问题
- Assertion desc failed at src/libswscale/swscale_internal.h:6
- C++链接器错误 ( "Linker command failed with exit code 1" )
- wifi.status(),在AP_Mode运行时返回WL_Disconnected(6)
- 如何修复张量流中的"Non-OK-status: Not found: Op type not registered 'NoOp' in binary running"
- java.lang.UnsatisfiedLinkError: dlopen failed: 无法加载"libPrivateSsl.so"所需的库"libcrypto.so.1.0.0";