帮助提高地图遍历 C++ 的效率
help with efficiency of map traversal c++
我有一个地图定义为
map<string,map<string,int> > subjectCodes;
每个主题字符串都有自己的课程地图
我还定义了 2 个迭代器
map<string,map<string,int> >::iterator it;
map<string,int>::iterator jt;
一个用于迭代每个主题,另一个用于迭代每个主题的每个课程
我需要让我的程序读取 50,000 行信息,将它们分类到地图中,并在 1 秒内打印所有信息。我想我已经找到了将所有内容添加到地图中的最快方法,但我正在努力加快打印速度,目前打印速度为 0(n 平方),导致我的程序运行大约需要 3 秒。
这是我的打印代码:
//print out sorted list
for(it=subjectCodes.begin();it!=subjectCodes.end();it++)
{
cout<<it->first<<": "<<(it->second).size()<<" courses"<<endl;
for(jt=(it->second).begin();jt!=(it->second).end();jt++)
{
cout<<" "<<jt->first<<": "<<jt->second<<" classes"<<endl;
}
}
有没有更有效的在地图上打印地图的方法,有人可以向我展示?谢谢
一个简单的效率节约:
cout<<" "<<jt->first<<": "<<jt->second<<" classes"<<endl;
应该是:
cout<<" "<<jt->first<<": "<<jt->second<<" classes"<< 'n';
endl
操纵器冲洗流,如果您不需要冲洗,这可能是一项非常昂贵的操作。您应该能够在一分钟内轻松地将 50K 行写入流,尽管可能不会写入连接到某种终端(即 xterm 或 Windows cmd 提示窗口)的流。
我无法判断您的数据是什么样子的,但使用"组合键"可能会有更好的运气。 也就是说,不要使用充满地图的地图,而是将两个键连接在一起,并将结果用作单个地图中的键。
此外,如果在创建地图后未对其进行修改,请考虑改用排序向量(使用 std::sort
和 std::binary_search
)。 迭代数据时,数据在内存中都是连续的,您将获得更好的缓存性能。
您是否考虑过并行化您的应用程序,例如使用线程或 OpenMP?
另一个提示:printf()
功能可能比流式选项更快。
另外,您是否使用完全优化进行编译? 这也可能显著提高性能。
当您遇到性能问题时,重要的是要追求唾手可得的果实。为此,您需要弄清楚算法的瓶颈在哪里。什么时间太长了?
一旦你弄清楚了什么需要时间,你就可以开始问更具体的问题了。通常,追求唾手可得的果实意味着你应该追求对算法速度有很大影响的简单问题。在这个线程中已经指出了两个例子(将 std::endl 替换为 '' 以减少刷新量,并使用 printf over std::cout 来减少函数调用/不同算法的数量)。
还有更多的可能性:
- 使用字符串流并在单个操作中写入
- 重新设计您的结构,以便以您通常使用它的方式更快地使用它(可以使用矢量而不是第二级的地图吗? 与您
- 编写的代码块完全无关的东西;)
- 有什么方法可以遍历结构吗
- 在循环中按顺序遍历成员变量
- 遍历模板参数
- 在遍历处理程序的向量时注册和注销处理程序
- C++RapidXml-使用first_node()遍历以修改XML文件中节点的值
- 遍历并行数组以确定C++中的最大数字
- 遍历顺序由 std::文件系统directory_iterator给出
- 遍历链表时的无限循环
- 遍历unordered_map向量
- 从预序遍历构造 bst 的 c++ 和 python 解决方案之间的区别
- C++声明双链表,使用两个 for 循环双向遍历列表并打印
- 如何正确地推回然后遍历堆中对象的向量?
- 遍历二维数组的所有子数组
- 如何在可变参数模板函数中遍历可变参数元组?
- 避免在遍历 IShellItemArray 时出现代码重复
- 从特定键开始遍历地图
- 关于链表遍历和调试的困惑
- 将树节点添加到向量向量中的 n 元树遍历的平均和最坏情况时间复杂度是多少?
- 为什么即使使用 for 循环遍历我的向量,它也没有输出到控制台?(C++)
- 二叉树级别顺序遍历在leetcode中