矩阵乘法优化

Matrix multiplication optimization

本文关键字：优化更新时间：2023-10-16

我正在执行一系列具有相当大矩阵的矩阵乘法。通过所有这些操作进行操作需要很长时间，我需要我的程序在大循环中执行此操作。我想知道是否有人有任何想法可以加快这一目标？我刚刚开始使用eigen，所以我的知识非常有限。

我正在使用root-cern内置的tmatrix类，但是执行矩阵操作的速度非常差。我使用特征元设置了一些对角矩阵，希望它以更优化的方式处理乘法操作。它可能，但我真的看不到性能差异。

// setup matrices
int size = 8000;
Eigen::MatrixXf a(size*2,size);
// fill matrix a....
Eigen::MatrixXf r(2*size,2*size); // diagonal matrix of row sums of a
// fill matrix r
Eigen::MatrixXf c(size,size); // diagonal matrix of col sums of a
// fill matrix c
// transpose a in place
a.transposeInPlace();
Eigen::MatrixXf c_dia;
c_dia = c.diagonal().asDiagonal();
Eigen::MatrixXf r_dia;
r_dia = r.diagonal().asDiagonal();
// calc car
Eigen::MatrixXf car;
car = c_dia*a*r_dia;

您在这里做的工作太多了。如果您的对角矩阵，仅存储对角线(并将其直接用于产品(。一旦将对角矩阵存储在方形矩阵中，结构的信息就会丢失给特征。

另外，您无需存储a的转换变体，只需在产品中使用a.transpose()(这只是一个小问题...(

(

// setup matrices
int size = 8000;
Eigen::MatrixXf a(size*2,size);
// fill matrix a....
a.setRandom();
Eigen::VectorXf r = a.rowwise().sum(); // diagonal matrix of row sums of a
Eigen::VectorXf c = a.colwise().sum(); // diagonal matrix of col sums of a
Eigen::MatrixXf car = c.asDiagonal() * a.transpose() * r.asDiagonal();

最后，当然要确保启用优化的编译，并启用矢量化(使用gcc或clang用-O2 -march=native编译(。