nppiResizeSqrPixel_32f_C4R(）的工作原理

How nppiResizeSqrPixel_32f_C4R() works?

本文关键字：工作 32f C4R nppiResizeSqrPixel 更新时间：2023-10-16

上述函数如何在 cuda 中执行操作。我们是否需要编写 CudaMalloc(( 或 MemCopy(( 以及这个，或者只是一个内部调用来完成所有这些。

我写了

nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);

这里的"in"是具有输入图像的向量，"out"是具有输入图像的向量。但是在执行上述函数后，输出向量仍然是"0"。您能否指导我如何调整函数的大小。

它对设备数据进行操作，因此您需要使用设备分配(例如 cudaMalloc ( 并将数据复制到设备(例如 cudaMemcpy (，等。

在

通常的位置提供了有限数量的 npp 调用文档，并且有 CUDA 示例代码演示了 npp 库调用利用率的一些示例。

对于这些资源未解决的问题，您可能还需要查看英特尔 ipp 文档。在许多情况下，NPP 例程非常模仿英特尔 ipp 功能，因此您可能会在其中获得一些见解。下面是一个示例文档。

还可以检查任何适当的 CUDA 或 npp 调用的返回值，您还可以使用 cuda-memcheck 运行代码以获取有关可能出错的提示。