并行提案 N3554 中的 [包含/排除]_scan算法<algorithm>
Algorithm for [inclusive/exclusive]_scan in parallel <algorithm> proposal N3554
针对C++14的建议N3554(并行算法库)提出了当前std::partial_sum
的并行版本,例如:
template<
class ExecutionPolicy,
class InputIterator,
class OutputIterator,
class BinaryOperation>
OutputIterator inclusive_scan(
ExecutionPolicy &&exec,
InputIterator first,
InputIterator last,
OutputIterator result,
BinaryOperation binary_op);
带解释
效果:对于[result,result+(last-first)]中的每个迭代器i,执行*i=prefix_sum,其中prefix_sum是相应和init+*iter_0+*iter_1+*iter_2的结果+…或binary_op对于范围[first,first+(i-result)-1)中的每个迭代器iter_j…和的操作数顺序未指定。
如何将此操作并行?似乎,几乎根据定义,每个输出prefixsum都必须为下一个要计算的输出进行计算——本质上导致串行操作。
编辑非常感谢Aasmund Eldhuset的回答。就我个人而言,我发现"前缀和Guy E.Blelloch的"及其应用"是非常有用的。
Parallel prefix sum是一种经典的分布式编程算法,它优雅地使用了减少后的分布(如本文所示)。关键的观察结果是,在知道前导项之前,可以计算部分和的部分。
相关文章:
- 为什么这个运算符<重载函数对 STL 算法不可见?
- 基于ELO的团队匹配算法
- C++选择排序算法中的逻辑错误
- 有没有办法将谓词中的元素偏移量传递给 std 算法?
- C++A*算法并不总是在路径中具有目标节点
- 排序算法c++
- 构建可组合有向图(扫描仪生成器的汤普森构造算法)
- 算法问题:查找从堆栈中弹出的所有序列
- 下面是排序算法O(n)吗
- KMP算法和LPS表构造的运行时间
- 为什么我的排序算法会更改数组值
- 求最大元素位置的分治算法
- 具有非整数边容量的最大流量的Dinic算法
- 到连接组件算法的问题(递归)
- STL算法函数在多个一维容器上的使用
- 读取最后一行代码算法 - c++ 时出现问题
- 括号更改 O(n) 算法
- std::unordered_map 搜索算法是如何实现的?
- 如何实现高效的算法来计算大型数据集的多个不同值?
- 磁盘调度程序SCAN算法错误