BLAS 2 级波段矩阵向量积多个向量

BLAS Level 2 band matrix-vector product multiple vectors

本文关键字:向量 段矩阵 BLAS      更新时间:2023-10-16

BLAS Level 2 中存在带状矩阵向量积的例程,适用于一般情况和对称情况(MKL 实现的链接(。

cblas_?GBMV

cblas_?SBMV

在这种情况下,有没有办法使用多个向量(不使用外部 for 循环(来最大限度地提高性能?

我认为 Spike 库应该有这样一个对称情况的例程。不过,恐怕我不能再帮忙了,因为我从未使用过它。

Spike的算法和实现(用于系统求解(在[Polizzi & Sameh, Comp. Fluids (36(, 2007]中概述。

AFAIK 答案是否定的。

可在此处找到 3 级 BLAS 子例程的完整列表

http://www.netlib.org/blas/#_level_3

并且没有带状矩阵子例程。


额外信息:如果您正在使用blas/lapack&C++,最近有一项设计C++界面的举措:

http://www.netlib.org/na-digest-html/17/v17n21.html#1

(cblas和lapacke更倾向于C用法(