OpenCV-SVM总是预测更高级的标签
OpenCV SVM always predicts higher class label
我使用OpenCV SVM实现来二进制预测图像特征的重要性。因此,我在正图像特征和负图像特征上训练它,并在{0,1}中寻找分类。
我遇到的问题是,在训练之后,SVM总是预测具有更高/更大类别标签的类别。我可以更改训练数据集的标签,但此问题仍然存在。我仔细检查了生成的标签和培训cv::Mat矩阵,没有发现任何问题。
下面是我的SVM类和附带的SVM参数
//Populate the SVM parameters
void SVM::setSVMParams()
{
params.svm_type = cv::SVM::C_SVC;
params.kernel_type = cv::SVM::RBF;
params.term_crit = cv::TermCriteria(CV_TERMCRIT_ITER, 100, 1e-6);
params_set = true;
}
//Train the SVM with the given data
void SVM::train(cv::Mat train_data, cv::Mat labels)
{
//Set the SVM parameters if they haven't been already
if (!params_set)
{
setSVMParams();
}
svm.train(train_data, labels, cv::Mat(), cv::Mat(), params);
}
//Based on training, predict the class of the given data
float SVM::predict(cv::Mat sample)
{
return svm.predict(sample, false);
}
这里是负责生成训练数据和相应标签的功能
//Creates the appropriate training data and class labels for subsequent SVM training according to supplied D threshold
void Matchings::createSVMTrainingObjects(const float t_D, const float positive_label, const float negative_label, bool print_info)
{
cv::Mat train_data_l((int)matchings_list.size(), 132, CV_32FC1);
cv::Mat labels_l((int)matchings_list.size(), 1, CV_32FC1);
int num_pos = 0;
int num_neg = 0;
for (int i = 0; i < matchings_list.size(); i++)
{
matching_d entry = matchings_list[i];
//Important feature, label 1
if (entry.D > t_D)
{
labels_l.at<float>(i) = positive_label;
num_pos++;
}
//Unimportant feature, label -1
else
{
labels_l.at<float>(i) = negative_label;
num_neg++;
}
int j = 0;
//Copy feature into current row of openCV matrix
train_data_l.at<float>(i, j++) = entry.feature.x;
train_data_l.at<float>(i, j++) = entry.feature.y;
train_data_l.at<float>(i, j++) = entry.feature.scale;
train_data_l.at<float>(i, j++) = entry.feature.angle;
for (int k = 0; k < 128; k++)
{
train_data_l.at<float>(i, j + k) = entry.feature.vec[k];
}
}
std::cout << "For training: #+ves=" << num_pos << ", #-ves=" << num_neg << std::endl;
train_data = train_data_l;
labels = labels_l;
}
最后,这里是一个函数,它实际调用SVM预测结果来保留重要的图像特征
matchingslist ASIFT::filterFeaturesWithSVM(matchingslist matchings, SVM& svm)
{
matchingslist new_matchings;
for (int i = 0; i < (int)matchings.size(); i++)
{
cv::Mat first = Utility::keypointToMat(matchings[i].first);
cv::Mat second = Utility::keypointToMat(matchings[i].second);
//If both features are of importance, retain them
if (svm.predict(first) == 1.0f && svm.predict(second) == 1.0f)
{
new_matchings.push_back(matchings[i]);
}
else
{
std::cout << "Feature removed" << std::endl;
}
}
return new_matchings;
}
该方法的一个主要问题是,在使用RBF时,您没有设置SVM的超功率计,因此可能是C=1
和gamma=1/d
(或1/mean ||x||^2
),因为它们是大多数SVM实现中的默认值。
而这些对于建立一个有效的模型至关重要。特别是,如果你的C
值太低(1
可能太低,取决于数据的许多特征),那么SVM只需构建一个平凡的模型,总是预测其中一个类。
你该怎么办?您应该同时检查C
和gamma
的多个值。这些参数的含义是什么?
C
(你的1
)是错误分类的权重——C
越大,SVM将更难准确地学习训练数据,可能会以过拟合为代价gamma
(默认值)是RBF核的2倍方差的倒数。换句话说,伽马越大,高斯越小,因此,你的方法在几何意义上更"局部"。再次强调,大伽马有助于最大限度地减少训练误差(偏差),但会导致更高的测试误差(方差)
正确选择方差偏差之间的折衷是机器学习技术的关键因素。在RBF SVM的情况下,你可以通过上面的方法来控制它。和他们一起玩,检查训练集错误和测试集错误,看看发生了什么。如果您的训练集错误很大,请增加C和/或gamma。一旦你的训练集错误很好,看看测试集-如果它太大-试着减少值等等。这通常是通过对参数的网格搜索进行一些内部交叉验证来自动完成的。
查看模型选择和超参数优化的材料。
此外,您还修复了的迭代次数
params.term_crit = cv::TermCriteria(CV_TERMCRIT_ITER, 100, 1e-6);
而对于SVM,你永远不应该这样做。让它收敛(或者至少假设100000),在仅仅100步之后,SVM可能甚至没有接近收敛(因此导致了琐碎的模型)。
- 如何正确指定 goto 语句的标签?
- 在C++中存储要输入的标签列表
- 无法将行编辑中的文本打印到 Qt C++ 中的标签
- 如何根据C++中的标签运行特定函数?
- 在 gcc/clang (C++) 中获取函数范围之外的标签地址
- 根据现有的标签(而不是二进制图像)查找使用 OpenCV 连接的组件
- 在作为表后面图层的标签上绘图
- 具有C 的Antlr4中的标签生成不允许访问标签值
- 提升灵气:改变特uint_parser的标签
- 如何通过最快的方法删除指定的标签组件
- 如何获取与 objdump 输出的标签相对应的 ELF 二进制文件中的文件偏移量
- Qt 更改其他类的标签文本
- C++中的标签和枚举调度有什么区别
- 在2D数组C 上的标签得出了错误的结果
- 如何在 ubuntu 的 C/C++ 包含目录中生成带有旺盛的 ctags 的标签文件以用于 gvim?
- 如何添加实现C 接口的标签
- 为什么case语句中的标签应该是常量
- 在内联程序集中使用函数范围的标签
- 如何更改在不同线程中打开的表单的标签文本
- OpenCV-SVM总是预测更高级的标签