nppiResizeSqrPixel_32f_C4R() 的工作原理

How nppiResizeSqrPixel_32f_C4R() works?

本文关键字:工作 32f C4R nppiResizeSqrPixel      更新时间:2023-10-16

上述函数如何在 cuda 中执行操作。我们是否需要编写 CudaMalloc(( 或 MemCopy(( 以及这个,或者只是一个内部调用来完成所有这些。

我写了

nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);

这里的"in"是具有输入图像的向量,"out"是具有输入图像的向量。但是在执行上述函数后,输出向量仍然是"0"。您能否指导我如何调整函数的大小。

它对设备数据进行操作,因此您需要使用设备分配(例如 cudaMalloc ( 并将数据复制到设备(例如 cudaMemcpy (,等。

通常的位置提供了有限数量的 npp 调用文档,并且有 CUDA 示例代码演示了 npp 库调用利用率的一些示例。

对于这些资源未解决的问题,您可能还需要查看英特尔 ipp 文档。 在许多情况下,NPP 例程非常模仿英特尔 ipp 功能,因此您可能会在其中获得一些见解。 下面是一个示例文档。

还可以检查任何适当的 CUDA 或 npp 调用的返回值,您还可以使用 cuda-memcheck 运行代码以获取有关可能出错的提示。