filter2D实现中的差异

Differences in filter2D implementation

本文关键字：实现 filter2D 更新时间：2023-10-16

我试图实现convolute2D(OpenCV中的filter2D)，并产生了以下代码。

Mat convolute2D(Mat image, double** kernel, int W){
Mat filtered_image = image.clone();
// find center position of kernel (half of kernel size)
int kCenterX = W / 2;
int kCenterY = W / 2;
int xx = 0;
int yy = 0;
cout << endl << "Performing convolution .." << endl;
cout << "Image Size : " << image.rows << ", " << image.cols <<endl;
for (int i = 0; i < image.rows; ++i){
for (int j = 0; j < image.cols; ++j){
for(int x = 0; x < W; ++x){
xx = W - 1 - x;
for(int y = 0; y < W; ++y){
yy = W - 1 - y;
int ii = i + (x - kCenterX);
int jj = j + (y - kCenterY);
if( ii >= 0 && ii < image.rows && jj >= 0 && jj < image.cols) {
filtered_image.at<uchar>(Point(j, i)) += image.at<uchar>(Point(jj, ii)) * kernel[xx][yy];
}
}
}
}
}
return filtered_image;
}

假设我们总是有一个平方核。但我的结果与filter2D有很大不同。是因为可能溢出还是我的实现有问题？

感谢

您的代码有两个问题：

在添加值之前，您不会将输出图像设置为零。因此，您计算的是"输入+过滤输入"，而不仅仅是"过滤输入"。
假设kernel的值很小，"输入像素*内核值"可能会产生一个小数字，当写入uchar时，该数字会向下取整。将内核的每个值加起来，最终会得到一个过低的结果。

我建议你这样做：

double res = 0;
for(int x = 0; x < W; ++x){
int xx = W - 1 - x;
for(int y = 0; y < W; ++y){
int yy = W - 1 - y;
int ii = i + (x - kCenterX);
int jj = j + (y - kCenterY);
if( ii >= 0 && ii < image.rows && jj >= 0 && jj < image.cols) {
res += image.at<uchar>(Point(jj, ii)) * kernel[xx][yy];
}
}
}
filtered_image.at<uchar>(Point(j, i)) = res;

这同时解决了这两个问题。此外，这应该更快一点，因为访问输出图像需要一些开销。

要想获得更快的速度，请考虑检查越界读取(内部循环中的if)会显著降低代码的速度，并且对于大多数像素来说是完全不必要的(因为图像边缘附近的像素很少)。相反，您可以将循环拆分为[0,kCenterX]、[kCenterX,image.rows-kCenterX]和[image.rows-kCenterX,image.rows]。中间循环通常是迄今为止最大的，不需要检查越界读取。

使用cv:：saturate_cast对uchar进行正确赋值，例如：

filtered_image.at<uchar>(Point(j, i)) = cv::saturate_cast<uchar>(res);