将空间金字塔匹配(SPM)用于SIFT,然后在c++中输入到SVM中

Spatial pyramid matching (SPM) for SIFT then input to SVM in C++

本文关键字:然后 c++ SIFT 输入 SVM 用于 金字塔 空间 SPM      更新时间:2023-10-16

我正在尝试使用c++和OpenCV对脑肿瘤的MRI图像进行良性和恶性分类。我计划在使用kmeans聚类SIFT描述符后使用词袋(BoW)方法。意思是,我将每个图像表示为直方图,整个"代码本"/字典为x轴,它们在图像中的出现次数为y轴。这些直方图将成为我的SVM(带有RBF核)分类器的输入。

但是,使用BoW的缺点是忽略了图像中描述符的空间信息。有人建议用SPM代替。我读了一下,看到了这个链接,给出了以下步骤:

  1. 从训练集中计算K个视觉词,并将所有局部特征映射到它的视觉词。
  2. 对于每张图像,初始化K个多分辨率坐标直方图为零。每个坐标直方图由L个级别和每个级别组成它有4^i个单元格,均匀地划分当前图像。
  3. 对于该图像中的每个局部特征(假设其视觉词ID为k),挑出第k个坐标直方图,然后累积1计数到这个直方图中L个对应的细胞,根据局部特征的坐标。L细胞是局部特征所在的单元格在L个不同的分辨率下。
  4. 连接K个多分辨率坐标直方图,形成最终的图像"长"直方图。当连接时,第k直方图由第k个视觉词的概率加权。
  5. 要计算两幅图像的核值,将它们的"长"直方图相交的所有单元相加。

现在,我有以下问题:

  1. 什么是坐标直方图?直方图不就是在x轴上显示每个分组的数量吗?它如何提供点坐标的信息?
  2. 我如何计算第k个视觉单词的概率?
  3. 我将得到的"内核值"的用途是什么?如何将它作为支持向量机的输入?如果我理解对了,核值是在测试阶段使用的,而不是在训练阶段?如果是,那么我将如何训练支持向量机?
  4. 或者你认为我不需要用空间信息来负担自己,只要坚持使用正常的BoW来处理我的情况(良性和恶性肿瘤)?

谁来帮帮这个可怜的小本科生。如果你这样做,我将永远感激你。如果您有什么需要说明的,请尽管提。

这是实际论文的链接,http://www.csd.uwo.ca/~olga/Courses/Fall2014/CS9840/Papers/lazebnikcvpr06b.pdf

MATLAB代码在这里提供http://web.engr.illinois.edu/~slazebni/research/SpatialPyramid.zip

坐标直方图(在你的帖子中提到)只是你计算直方图的图像中的子区域。这些幻灯片直观地解释了它,http://web.engr.illinois.edu/~slazebni/slides/ima_poster.pdf。

这里有多个直方图,每个直方图对应图像中的不同区域。概率(或项目数量将取决于该子区域的筛选点)。

我认为你需要像幻灯片中提到的那样定义你的金字塔内核。

如果你有足够的训练样本,卷积神经网络可能更适合你的任务。你可以看看Torch或者Caffe。

相关文章: