帮助提高地图遍历 C++ 的效率

help with efficiency of map traversal c++

本文关键字:遍历 C++ 效率 地图 高地图 帮助      更新时间:2023-10-16

我有一个地图定义为

map<string,map<string,int> > subjectCodes;

每个主题字符串都有自己的课程地图

我还定义了 2 个迭代器

map<string,map<string,int> >::iterator it;
map<string,int>::iterator jt;

一个用于迭代每个主题,另一个用于迭代每个主题的每个课程

我需要让我的程序读取 50,000 行信息,将它们分类到地图中,并在 1 秒内打印所有信息。我想我已经找到了将所有内容添加到地图中的最快方法,但我正在努力加快打印速度,目前打印速度为 0(n 平方),导致我的程序运行大约需要 3 秒。

这是我的打印代码:

//print out sorted list
for(it=subjectCodes.begin();it!=subjectCodes.end();it++)
{
    cout<<it->first<<": "<<(it->second).size()<<" courses"<<endl;
    for(jt=(it->second).begin();jt!=(it->second).end();jt++)
    {
        cout<<"  "<<jt->first<<": "<<jt->second<<" classes"<<endl;
    }
}

有没有更有效的在地图上打印地图的方法,有人可以向我展示?谢谢

一个简单的效率节约:

   cout<<"  "<<jt->first<<": "<<jt->second<<" classes"<<endl;

应该是:

   cout<<"  "<<jt->first<<": "<<jt->second<<" classes"<< 'n';

endl操纵器冲洗流,如果您不需要冲洗,这可能是一项非常昂贵的操作。您应该能够在一分钟内轻松地将 50K 行写入流,尽管可能不会写入连接到某种终端(即 xterm 或 Windows cmd 提示窗口)的流。

我无法判断您的数据是什么样子的,但使用"组合键"可能会有更好的运气。 也就是说,不要使用充满地图的地图,而是将两个键连接在一起,并将结果用作单个地图中的键。

此外,如果在创建地图后未对其进行修改,请考虑改用排序向量(使用 std::sortstd::binary_search )。 迭代数据时,数据在内存中都是连续的,您将获得更好的缓存性能。

您是否考虑过并行化您的应用程序,例如使用线程或 OpenMP?

另一个提示:printf()功能可能比流式选项更快。

另外,您是否使用完全优化进行编译? 这也可能显著提高性能。

当您遇到性能问题时,重要的是要追求唾手可得的果实。为此,您需要弄清楚算法的瓶颈在哪里。什么时间太长了?

一旦你弄清楚了什么需要时间,你就可以开始问更具体的问题了。通常,追求唾手可得的果实意味着你应该追求对算法速度有很大影响的简单问题。在这个线程中已经指出了两个例子(将 std::endl 替换为 '' 以减少刷新量,并使用 printf over std::cout 来减少函数调用/不同算法的数量)。

还有更多的可能性:

  • 使用字符串流并在单个操作中写入
  • 重新设计您的结构,以便以您通常使用它的方式更快地使用它(可以使用矢量而不是第二级的地图吗?
  • 与您
  • 编写的代码块完全无关的东西;)