如何在使用 GPU 时更改 Caffe2 中的 blob 值 (C++）

How to change blob value in Caffe2 while using GPU (C++)

本文关键字：blob 中的 Caffe2 C++ GPU 更新时间：2023-10-16

我正在尝试手动访问 blob 值并更改它。
我有一个名为"1conv1_w"的 blob，我通过以下方式访问它：

auto 1conv1_w = caffe2::TensorCPU((*workspace.GetBlob("1conv1_w")).Get<caffe2::TensorCPU>()).data<float>();

这将返回指向1conv1_w float*指针。在CPU模式下，我可以使用

std::cout << *1conv1_w << std::endl

以访问 Blob"1conv1_w"中的第一个值以及修改该值。但是，当切换到 GPU 模式时，这将返回错误，因为指针中没有值。如果我使用

auto 1conv1_w = caffe2::TensorCPU((*workspace.GetBlob("1conv1_w")).Get<caffe2::TensorCUDA>()).data<float>()[0];

然后，我可以访问第一个值，但仍然无法访问 blob 中的其他值。
我想问题是因为在使用 GPU 时，内存实际上是一个临时内存。该值在 CPU 和 GPU 之间复制（可能是内存）。当我使用Get<caffe2::TensorCUDA>()它只是复制我想要的地址或值。因此，即使我更改此地址中的值，也不会影响保存在某处的实际值。

有没有人面临同样的问题并知道如何更改 blob 的实际值？

首先，您无法直接从 CPU 上下文访问 GPU 内存。您可以考虑为您的目的编写 CUDA 内核。如果您确实需要在CPU上执行此操作，则可以通过以下方式将数据从GPU获取到CPU：

CPUContext context;
TensorCPU output;
auto& input = (*workspace.GetBlob("1conv1_w")).Get<TensorCUDA>();
output.ResizeLike(input);
context.CopyItems<CUDAContext, CPUContext>(
    input.meta(),
    input.size(),
    input.raw_data(),
    output.raw_mutable_data(input.meta()));

然后，您可以修改CPU版本并以相同的类比方式将其放回GPU。