nppiResizeSqrPixel_32f_C4R() 的工作原理
How nppiResizeSqrPixel_32f_C4R() works?
上述函数如何在 cuda 中执行操作。我们是否需要编写 CudaMalloc(( 或 MemCopy(( 以及这个,或者只是一个内部调用来完成所有这些。
我写了
nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);
这里的"in"是具有输入图像的向量,"out"是具有输入图像的向量。但是在执行上述函数后,输出向量仍然是"0"。您能否指导我如何调整函数的大小。
它对设备数据进行操作,因此您需要使用设备分配(例如 cudaMalloc
( 并将数据复制到设备(例如 cudaMemcpy
(,等。
通常的位置提供了有限数量的 npp 调用文档,并且有 CUDA 示例代码演示了 npp 库调用利用率的一些示例。
对于这些资源未解决的问题,您可能还需要查看英特尔 ipp 文档。 在许多情况下,NPP 例程非常模仿英特尔 ipp 功能,因此您可能会在其中获得一些见解。 下面是一个示例文档。
还可以检查任何适当的 CUDA 或 npp 调用的返回值,您还可以使用 cuda-memcheck
运行代码以获取有关可能出错的提示。
相关文章:
- QSqlquery prepare()和bindvalue()不工作
- 导入库可以跨dll版本工作吗
- 以螺旋方式打印矩阵的程序.(工作不好)
- 对象指针在c++中是如何工作的
- 为什么在Windows上的VS 2019和Clang 9中"size_t"在没有标题的情况下工作
- VSOMEIP-2个设备之间的通信(TCP/UDP)不工作
- 为字符串中每 N 个字符插入空格的函数没有按照我认为的方式工作?
- C++为线程工作动态地分割例程
- 为什么我的 std::ref 无法按预期工作?
- 布尔比较运算符是如何在C++中工作的
- SampleConsensusPrerejective(ext.RANSAC)是如何真正工作的
- 不确定要在我的main中放入什么才能使我的代码正常工作
- 为什么std::condition_variable notify_all的工作速度比notify_one快(对于随机请
- <<操作员在下面的行中工作
- 有人能解释一下为什么下界是这样工作的吗C++的
- ExtractIconEx:可以工作,但偶尔会崩溃
- C++中的memset函数工作不正常
- 当我在第一个循环中使用"auto"时,它工作正常,但是使用"int"它会给出错误,为什么?
- 链表c++插入,所有情况都已检查,但没有任何工作
- 为什么stream::忽略未按预期工作