在TBB中实现MapReduce
Implementing MapReduce in TBB
我想使用TBB"模拟"mapreduce的软件分配,管道范式似乎是一个很好的方式来看待它,因为串行过滤器可以是I/O,并行的可以是Map和Reduce实现,但是这个函数实现接收并返回单个元素(这对于Map来说是ok的,如果只有一个元组是由输入生成的,但是像单词计数这样需要多个输出的东西呢?)reduce在全局hashmap上简单地聚合,而不返回"某些东西"
是否有一种方法可以使用管道来达到这个目的,或者我应该使用类似parallel_while/for的东西?
谢谢!
并行管道通常不像parallel_for那样可伸缩,所以我倾向于尝试使用parallel_for或一些并行递归方案。我建议参考并行排序算法,因为map-reduce与排序非常相似,只是重复的键是合并的。对于较小的核心计数,类似于并行样本排序的东西似乎是很好的灵感。(参见http://parallelbook.com/sites/parallelbook.com/files/code20131121.zip以获得在TBB中的实现)。对于较大的核数,类似于并行归并排序的东西可能更好(参见https://software.intel.com/en-us/articles/a-parallel-stable-sort-using-c11-for-tbb-cilk-plus-and-openmp获得讨论和代码)。
相关文章:
- 如果没有malloc,链表实现将失败
- 如何在c++中实现处理器调度模拟器
- 如何在c++中使用引用实现类似python的行为
- 实现无开销push_back的最佳方法是什么
- 使用简单类型列表实现的指数编译时间.为什么
- 如何在BST的这个简单递归实现中消除警告
- 实现一个在集合上迭代的模板函数
- 我应该实现右值推送功能吗?我应该使用std::move吗
- 如何正确实现和访问运算符的各种自定义枚举器
- C++Union/Struct位域的实现和可移植性
- 这个极客对极客的trie实现是否存在内存泄漏问题
- 在c++中实现LinkedList时,应出现未处理的错误
- 为左值和右值的包装器实现C++范围
- 使用模板进行堆栈实现; "name followed by :: must be a class or namespace"
- 使用GSoap实现ONVIF
- 在用于格式4的arm模拟器中实现功能时的一个问题
- 用于AVX的ln(x)的实现,m256
- 用常见虚拟函数实现的任意组合来实现派生类的正确方法是什么
- 在C++中,如何在类和函数(可能是模板化的)的头中编写完整的实现
- 在TBB中实现MapReduce