图像大小调整数组的 C++ 优化
c++ optimization of image resize array
试图增加图像数组的宽度以返回到opencv垫。当temp_mat阵列需要随着图像大小的增加而移动一定量时,问题在于速度。请参阅下面的功能:
这条线将以良好的速度运行:
//temp_mat[height][width] = in_mat[i][j];
但是当更改为以下速度时,速度会降低很多:
temp_mat[height][width + int(((width - middle_point) * -1) * FLOAT_HERE)] = in_mat[i][j];
循环的运行时间要长很多毫秒。这是完整的函数,变量名称已更改。
#define D_HEIGHT 1000
#define D_WIDTH 1200
int DEFAULT_HEIGHT = 1000;
int DEFAULT_WIDTH = 1200;
float FLOAT_HERE = .04;
static int temp_mat[D_HEIGHT][D_WIDTH];
cv::Mat get_mat(int in_mat[D_HEIGHT][300]){
int height = 0;
int width = 0;
int middle_point = DEFAULT_WIDTH/2;
for(int i=0;i < DEFAULT_HEIGHT;i++){
width = 0;
for(int j =0;j < DEFAULT_WIDTH / 4;j++){
for(int il = 0; il < DEFAULT_WIDTH / (DEFAULT_WIDTH/4); il++){
//This is to slow, but what I need
temp_mat[height][width + int(((width - middle_point) * -1) * FLOAT_HERE)] = in_mat[i][j];
//This is ok
//temp_mat[height][width] = in_mat[i][j];
width++;
}
}
height++;
}
return cv::Mat(D_HEIGHT,D_WIDTH,CV_8UC4,temp_mat);
}
欢迎任何使其更快的想法。我希望避免新线程。
你做错了,只需使用仿射变换,OpenCV将以最快的方式做到这一点。
尽管DEFAULT_WIDTH
没有声明const
但它似乎被用作常量,并且变量的命名也表明了这一点。您可能应该使其恒定,即使其中本身不会提高性能。我这样说是因为您正在计算一个middle_point
,该也是恒定的,并且可以预先计算。FLOAT_HERE
也是如此,它似乎也是恒定的。
将这些常量作为计算中的唯一变量后,您多次创建该变量是width
变量。由于您始终循环相同的迭代次数,因此您可以考虑预先计算不同的值,只需创建值缓存而不是动态计算。
对于每个宽度值,您可以创建一个相应的计算值,您可以将其存储在数组中,其中索引是宽度,该值是计算的值:
int width_cache[DEFAULT_WIDTH];
...
for (int i = 0; i < DEFAULT_WIDTH; ++i) {
width_cache[i] = i + int(((i - middle_point) * -1) * FLOAT_HERE);
}
在你的循环中,你可以做:
temp_mat[height][width_cache[width]] = in_mat[i][j];
相关文章:
- 空基优化子对象的地址
- 关闭||运算符优化
- 如何解决gcc编译器优化导致的centos双编译器设置中的分段错误
- 返回值优化:显式移动还是隐式
- 人脸跟踪arduino代码的优化
- 使用仅使用一次的变量调用的复制构造函数.这可能是通过调用move构造函数进行编译器优化的情况吗
- 纯函数,为什么没有优化
- 为什么大多数 pair 实现默认不使用压缩(空基优化)?
- 如何以优化的方式同时迭代两个间距不相等的数组
- 小字符串优化(调试与发布模式)
- 浮点定向舍入和优化
- Visual Studio 调试优化如何工作?
- 为什么开关的优化方式与 c/c++ 中的链接不同?
- 线性优化目标函数中的绝对值
- GCC 会优化内联访问器吗?
- gcc 如何优化此循环?
- 如何防止 CUDA-GDB 中的<优化输出>值
- 为什么我的程序在 O0 和 O2 的优化级别返回不同的结果
- 这个C++编译器优化(在自身的实例上调用对象自己的构造函数)的名称是什么,它是如何工作的?
- 使用 std::p air 进行返回值优化