C++:从GPU内存(cudaMemcpy2D)获取BGR图像(cv::Mat)

C++: Get BGR image (cv::Mat) from GPU memory (cudaMemcpy2D)

本文关键字:BGR cv Mat 获取 图像 cudaMemcpy2D GPU 内存 C++      更新时间:2023-10-16

我正在研究图像处理,并使用OpenCV为RGB和单色相机开发相机包装器。现在,我必须使用与 CUDA 配合使用的现有算法来处理这两个相机图像流。为此,我必须将Mat图像复制到我的设备(该算法不采用gpumat(。我使用cv::Mat::ptr来访问图像的数据。当我使用cudaMemcpy2D将图像返回主机时,我收到 RGB 图像的暗图像(仅限零(。即使我使用cudaMemcpy2D将其加载到设备并在下一步中将其带回cudaMemcpy2D它也不会工作(我的意思是我不在两者之间进行任何图像处理(。不过,它适用于单色图像:

width = 1920; (image dimensions are the same for mono and BGR)
height = 1080;
Mat mat_mono(height, width, CV_8UC1);
Mat mat_mono_disp(height, width, CV_8UC1);
size_t pitch_mono;
uint8_t* image_mono_gpu,
size_t matrixLenMono = width;
cudaMallocPitch(&image_mono_gpu, &pitch_mono, width, height);
mat_mono = MonoCamera.CaptureMat(1); // wrapper for the mono camera that grabs the image
// copy to device
cudaMemcpy2D(image_mono_gpu, pitch_mono, mat_mono.ptr(), width, matrixLenMono, height, cudaMemcpyHostToDevice);
// copy back to host
cudaMemcpy2D(mat_mono_disp.ptr(), matrixLenMono, image_mono_gpu, pitch_mono, matrixLenMono, height, cudaMemcpyDeviceToHost);
namedWindow("Display window", WINDOW_AUTOSIZE);
imshow("Display window", mat_mono_disp);

这是 RGB(或者更确切地说是 BGR(图像的代码,其中我仅在从设备检索图像后收到深色图像:

Mat mat_BGR(height, width, CV_8UC3);
Mat mat_BGR_disp(height, width, CV_8UC3);
size_t pitch_BGR;
uint8_t* image_BGR_gpu,
size_t matrixLenBGR = width * 3;
cudaMallocPitch(&image_BGR_gpu, &pitch_BGR, matrixLenBGR, height);
mat_BGR = RGBCamera.CaptureMat(1); // wrapper for the RGB camera that grabs the image
// copy to device
cudaMemcpy2D(image_BGR_gpu, pitch_BGR, mat_BGR.ptr(), width, matrixLenBGR, height, cudaMemcpyHostToDevice);
// copy back to host
cudaMemcpy2D(mat_BGR_disp.ptr(), matrixLenBGR, image_BGR_gpu, pitch_BGR, matrixLenBGR, height, cudaMemcpyDeviceToHost);
namedWindow("Display window", WINDOW_AUTOSIZE);
imshow("Display window", mat_BGR_disp);

这是否意味着将cv::Mat:ptr与单色图像一起使用,因为这是一种特殊情况?我不知道在使用 BGR 图像时还需要考虑什么。

如之前的回答所述,当将 OpenCV Mat 的 2D 内存复制到使用cudaMallocPitch(或任何跨步 2D 内存(分配的设备内存时,我们必须使用 OpenCV Mat 的step成员来指定每行的对齐方式。

在提供的代码中,正确的方法是在cudaMemcpy2D的第 4 个参数中使用mat_BGR.step而不是width

cudaMemcpy2D(image_BGR_gpu, pitch_BGR, mat_BGR.ptr(), mat_BGR.step, matrixLenBGR, height, cudaMemcpyHostToDevice);
^^^^