Hadoop mapreduce使用2个mapper,1个reducer使用c++
Hadoop mapreduce using 2 mapper and 1 reducer using c++
按照这个链接上的说明,我使用单个映射器和单个reducer在c++中实现了一个wordcount程序。现在,对于同一个问题,我需要使用两个映射器和一个reducer。
在这方面有人能帮我吗?
映射器的数量取决于创建的输入拆分的数量。输入拆分的数量取决于输入的大小、块的大小、输入文件的数量(每个输入文件至少创建一个输入拆分)、输入文件是否可拆分等
您可以将减速器的数量设置为任意数量。我想在hadoop管道中,您可以通过在运行hadoop时设置-D mapred.reduce.tasks=...
来实现这一点。请参阅SO.中的这篇文章
如果您想快速测试您的程序如何使用多个映射器,只需在输入路径中放入一个新文件即可。这将使hadoop创建另一个输入拆分,从而创建另一项映射任务。
PS:您提供的链接无法访问。
相关文章:
- IPC使用多个管道和分支进程来运行Python程序
- 使用2个键的cpp-stl::优先级队列排序不正确
- C++声明双链表,使用两个 for 循环双向遍历列表并打印
- CMake 库链接使用两个不同的编译器版本
- 在Linux Mint上使用多个版本的libboost
- 我可以在Visual Studio 2019上的项目下使用多个主函数吗?
- C++对开销较少的容器使用多个过滤器
- 如何在 c 中使用 2 个 strtok?
- JNI,使用两个 .so 文件时出错,其中一个文件需要另一个文件
- 使用多个源文件时对类成员函数的未定义引用
- 使用多个输入向量中值的笛卡尔乘积调用 lambda
- 有人可以展示一个使用多个功能的示例吗?
- 使用三个数字比较器进行排序
- 如何在构造函数初始值设定项列表中使用 n 个元素初始化 std::vector<std::time_t>
- 使用两个 for 循环生成以下星号
- 使用 XOR 操作仅使用 2 个指针反转链表
- 在C++中使用 4 个交换函数修复程序
- 使用两个uint_32数的倍数时,模幂溢出
- ZeroMQ:如何使用 C < C11 使用多个发布服务器和单个客户端
- C++ 使用 2 个容器进行线程处理