使用 MPI 和犰狳在C++中并行化
Parallelization in C++ using MPI and Armadillo
这是我的问题:openBLAS/LAPACK库(在犰狳库下)是否能够在MPI框架下利用并行性?
我担心的是,在使用mpirun -np 1 executable
运行程序时,由于我特别要求操作系统仅使用一个处理器运行我的程序,我认为 openBLAS/LAPACK 将仅使用一个处理器而不是其他处理器闲置来乘/添加矢量/矩阵。我是否限制 openBlas/LAPACK 通过 -np 1
在不同的处理器上执行多个线程?如何在通过-np 1?
选择的一个处理器上使用可用的不同内核
No.OpenBLAS 仅支持线程。拉帕克也一样。
ScaLAPACK支持利用MPI的类似LAPACK的功能。
您可以在本网站上找到有关并行线性代数软件的其他问题以获取更多详细信息。
相关文章:
- 如何使用OpenMP并行化此矩阵时间矢量运算
- 如何使用 MPI 的远程内存访问 (RMA) 功能并行化数据聚合?
- 在C++中使用并行化的预期速度是多少(不是 OpenMp,而是 <thread>)
- 如何使用 OpenMP 并行化最近邻搜索
- Malloc 在使用线程并行化 SSH 调用时存在问题
- 如何使用 OpenMP 正确并行化 for 循环?
- 如何将矩阵的行随机复制到内存中的另一个矩阵的过程并行化?
- 如何使用 Pthreads 并行化图像翻转?
- MPI:反复并行化缓冲区
- 是否可以使用OpenMP并行化一个列表,该列表可以在每次迭代中添加新元素
- 如何在Visual Studio中并行化armadillo
- 嵌套循环 OpenMP 并行化、私有索引还是公共索引?
- 如何并行化增加循环的大小
- 在 C++ 中使用 OpenMP 并行化两个 for 循环不会提供更好的性能
- OpenMP C++:并行化 for 循环的负载不平衡
- OpenMP 条件并行化 - 并行部分中 if 子句的语法
- C++ 犰狳和OpenMp:外积求和的并行化 - 定义犰狳矩阵的约简
- 将 for 循环与嵌套的 while 循环并行化时出现 OpenMP 分段错误
- 迭代卡拉苏巴算法在C++中使用OpenACC并行化和矢量化
- 如何在 OpenACC 中并行化内部具有"min"功能的循环