在OpenCV中使用PCA进行降维

Dimension reduction with PCA in OpenCV

本文关键字：降维 PCA OpenCV 更新时间：2023-10-16

我有一个 3xN Mat 数据，它保存在 yaml 文件中，看起来像：

%YAML:1.0
data1: !!opencv-matrix
rows: 50
cols: 3
dt: d
data: [ 7.1709999084472656e+01, -2.5729999542236328e+01,
-1.4074000549316406e+02, 7.1680000305175781e+01,
-2.5729999542236328e+01, -1.4075000000000000e+02,
7.1639999389648438e+01, -2.5729999542236328e+01,
-1.4075000000000000e+02, 7.1680000305175781e+01,
-2.5729999542236328e+01, -1.4075000000000000e+02, ...

我想将我的 3D 数据的维度缩小到 1D 或更确切地说是 2D，然后在 QwtPlotCurve 上可视化它。为了做到这一点，我在opencv下实现了pca函数，但不知道如何从pca结果中获取计算出的x和y坐标：

int numOfComponents= 100;
PCA pca(data, cv::Mat(), CV_PCA_DATA_AS_ROW, numOfComponents);
Mat mean= pca.mean.clone();
Mat eigenvalues= pca.eigenvalues.clone();
Mat eigenvectors= pca.eigenvectors.clone();

下面是一个 2D 数据集的示例。

x=[2.5, 0.5, 2.2, 1.9, 3.1, 2.3, 2, 1, 1.5, 1.1];
y=[2.4, 0.7, 2.9, 2.2, 3.0, 2.7, 1.6, 1.1, 1.6, 0.9];

我们可以使用以下代码在 OpenCV 中编写这些数组。

float X_array[]={2.5,0.5,2.2,1.9,3.1,2.3,2,1,1.5,1.1};
float Y_array[]={2.4,0.7,2.9,2.2,3.0,2.7,1.6,1.1,1.6,0.9};
cv::Mat x(10,1,CV_32F,X_array);   //Copy X_array to Mat (PCA need Mat form)
cv::Mat y(10,1,CV_32F,Y_array);   //Copy Y_array to Mat

接下来，我们将 x 和 y 组合成一个统一的 cv：：Mat 数据。因为整个数据必须放在一个地方才能使PCA函数工作，所以我们必须合并我们的数据。(如果您的数据是 2D 格式，例如图像，那么您可以简单地将 2D 转换为 1D 信号并将它们组合在一起)

x.col(0).copyTo(data.col(0));  //copy x into first column of data
y.col(0).copyTo(data.col(1));  //copy y into second column of data

最后一个代码之后的数据将如下所示：

data=
[2.5, 2.4;
0.5, 0.7;
2.2, 2.9;
1.9, 2.2;
3.1, 3;
2.3, 2.7;
2,   1.6;
1,   1.1;
1.5, 1.6;
1.1, 0.9]

使用 cv：:P CA，我们可以计算 2D 信号的特征值和特征向量。

cv::PCA pca(data,                 //Input Array Data
Mat(),                //Mean of input array, if you don't want to pass it   simply put Mat()
CV_PCA_DATA_AS_ROW,   //int flag
2);                   // number of components that you want to retain(keep)


Mat mean=pca.mean;                // get mean of Data in Mat form
Mat eigenvalue=pca.eigenvalues;
Mat eigenvectors=pca.eigenvectors;

我们的eigenValue和eigenvectors如下：

EigenValue=
[1.155625;
0.044175029]

EigenVectors=
[0.67787337, 0.73517865;
0.73517865, -0.67787337]

正如你在eigenValue中看到的，第一行的值是1.55，比0.044大得多。所以在eigenvectors中，第一行比第二行更重要，如果你在EigenVectors中保留相应的行，你可以拥有几乎完整的1D数据(只是你压缩了数据，但你的2D模式在新1D数据中可用)

我们如何提取最终数据？

要提取最终数据，您可以将eigenVector乘以原始数据并获得新数据，例如，如果我想将数据转换为 1D，我可以使用以下代码

Mat final=eigenvectors.row(0)*data.t(); //firts_row_in_eigenVector * tranpose(data)

在您的示例中，如果要将 3D 转换为 2D，请将维度设置为保留 2，如果要转换为 1D，请将此参数设置为 1，如下所示

1D

int numOfComponents= 1;
PCA pca(data, cv::Mat(), CV_PCA_DATA_AS_ROW, numOfComponents);

阿拉伯数字

int numOfComponents= 2;
PCA pca(data, cv::Mat(), CV_PCA_DATA_AS_ROW, numOfComponents);