在OpenCV中使用PCA进行降维

Dimension reduction with PCA in OpenCV

本文关键字:降维 PCA OpenCV      更新时间:2023-10-16

我有一个 3xN Mat 数据,它保存在 yaml 文件中,看起来像:

%YAML:1.0
data1: !!opencv-matrix
rows: 50
cols: 3
dt: d
data: [ 7.1709999084472656e+01, -2.5729999542236328e+01,
-1.4074000549316406e+02, 7.1680000305175781e+01,
-2.5729999542236328e+01, -1.4075000000000000e+02,
7.1639999389648438e+01, -2.5729999542236328e+01,
-1.4075000000000000e+02, 7.1680000305175781e+01,
-2.5729999542236328e+01, -1.4075000000000000e+02, ...

我想将我的 3D 数据的维度缩小到 1D 或更确切地说是 2D,然后在 QwtPlotCurve 上可视化它。为了做到这一点,我在opencv下实现了pca函数,但不知道如何从pca结果中获取计算出的x和y坐标:

int numOfComponents= 100;
PCA pca(data, cv::Mat(), CV_PCA_DATA_AS_ROW, numOfComponents);
Mat mean= pca.mean.clone();
Mat eigenvalues= pca.eigenvalues.clone();
Mat eigenvectors= pca.eigenvectors.clone();

下面是一个 2D 数据集的示例。

x=[2.5, 0.5, 2.2, 1.9, 3.1, 2.3, 2, 1, 1.5, 1.1];
y=[2.4, 0.7, 2.9, 2.2, 3.0, 2.7, 1.6, 1.1, 1.6, 0.9];

我们可以使用以下代码在 OpenCV 中编写这些数组。

float X_array[]={2.5,0.5,2.2,1.9,3.1,2.3,2,1,1.5,1.1};
float Y_array[]={2.4,0.7,2.9,2.2,3.0,2.7,1.6,1.1,1.6,0.9};
cv::Mat x(10,1,CV_32F,X_array);   //Copy X_array to Mat (PCA need Mat form)
cv::Mat y(10,1,CV_32F,Y_array);   //Copy Y_array to Mat

接下来,我们将 x 和 y 组合成一个统一的 cv::Mat 数据。因为整个数据必须放在一个地方才能使PCA函数工作,所以我们必须合并我们的数据。(如果您的数据是 2D 格式,例如图像,那么您可以简单地将 2D 转换为 1D 信号并将它们组合在一起)

x.col(0).copyTo(data.col(0));  //copy x into first column of data
y.col(0).copyTo(data.col(1));  //copy y into second column of data

最后一个代码之后的数据将如下所示:

data=
[2.5, 2.4;
0.5, 0.7;
2.2, 2.9;
1.9, 2.2;
3.1, 3;
2.3, 2.7;
2,   1.6;
1,   1.1;
1.5, 1.6;
1.1, 0.9]

使用 cv::P CA,我们可以计算 2D 信号的特征值和特征向量。

cv::PCA pca(data,                 //Input Array Data
Mat(),                //Mean of input array, if you don't want to pass it   simply put Mat()
CV_PCA_DATA_AS_ROW,   //int flag
2);                   // number of components that you want to retain(keep)


Mat mean=pca.mean;                // get mean of Data in Mat form
Mat eigenvalue=pca.eigenvalues;
Mat eigenvectors=pca.eigenvectors;

我们的eigenValueeigenvectors如下:

EigenValue=
[1.155625;
0.044175029]

EigenVectors=
[0.67787337, 0.73517865;
0.73517865, -0.67787337]

正如你在eigenValue中看到的,第一行的值是1.55,比0.044大得多。所以在eigenvectors中,第一行比第二行更重要,如果你在EigenVectors中保留相应的行,你可以拥有几乎完整的1D数据(只是你压缩了数据,但你的2D模式在新1D数据中可用)

我们如何提取最终数据?

要提取最终数据,您可以将eigenVector乘以原始数据并获得新数据,例如,如果我想将数据转换为 1D,我可以使用以下代码

Mat final=eigenvectors.row(0)*data.t(); //firts_row_in_eigenVector * tranpose(data)

在您的示例中,如果要将 3D 转换为 2D,请将维度设置为保留 2,如果要转换为 1D,请将此参数设置为 1,如下所示

1D

int numOfComponents= 1;
PCA pca(data, cv::Mat(), CV_PCA_DATA_AS_ROW, numOfComponents);

阿拉伯数字

int numOfComponents= 2;
PCA pca(data, cv::Mat(), CV_PCA_DATA_AS_ROW, numOfComponents);