性能不佳基于OpenCL的OpenCV平方实现

Bad Performance OpenCL based OpenCV Squares Implemenation

本文关键字:方实现 实现 OpenCV OpenCL 性能      更新时间:2023-10-16

尝试运行泛型square.cpp示例:https://github.com/Itseez/opencv/blob/master/samples/ocl/squares.cpp

我有一个装有AMD Radeon HD 6750M的Macbook Pro,它安装在/opt/AMDAPP上的正确OpenCL库,以及一个CMake编译的OpenCV2.4,它正确地检测到了CL库。此外,我使用fglrx更新来利用专有驱动程序。然而,性能似乎是CPP运行时的两倍。我尝试了大约200次迭代,但遇到了同样的问题。

内置:g++-o square.out square.cpp-L/usr/local/lib-L/opt/AMDAPP/lib-I/usr/local/include-I/opt/AMDAPP/include-lopencv_core-lopencv_highgui-lopencv _ocl-lopencc_gpu-lopencv/imgproc-lOpenCL

结果:

cpp平均时间:233.192ms

ocl平均时间:568.043ms

我在带有FirePro V5900 的Windows上看到了同样的行为

cpp: 66ms
ocl: 90ms

样品进行预热步骤。也许没有足够的迭代。