使用迭代器时的性能问题

Performance issues when using iterators?

本文关键字:性能 问题 迭代器      更新时间:2023-10-16

我有一个函数,它接受一个字符列表并生成下一个字典顺序排列。为了好玩,我尝试将代码泛化以使用迭代器,并能够生成更多不同类型的排列。

template<typename ITER>
bool nextPermutation(ITER start, ITER end, std::random_access_iterator_tag)
{
    for(ITER i = end-1; i != start; --i)
    {
        if(*(i-1) < *i)
        {
            // found where can be swapped
            for(ITER j = end-1; j != (i-1); --j)
            {
                if(*(i-1) < *j)
                {
                    // found what to swap with
                    auto temp = *j;
                    *j = *(i-1);
                    *(i-1) = temp;
                    // put everything from i on into "sorted" order by reversing
                    for(ITER k = end-1; k > i; --k,++i)
                    {
                        temp = *k;
                        *k = *i;
                        *i = temp;
                    }
                    return true;
                }
            }
        }
    }
    return false;
}

然而,当我不使用原始指针时,我遇到了代码性能明显变慢的问题。这是我的测试设备:

template<typename ITER>
bool nextPermutation(ITER start, ITER end, std::random_access_iterator_tag);
template<typename ITER>
bool nextPermutation(ITER start, ITER end)
{
    return nextPermutation(start, end, std::iterator_traits<ITER>::iterator_category());
}
#define USE_VECTOR
int main(void)
{
    bool hasNext = true;
#ifdef USE_VECTOR
    std::vector<char> c;
    for(char i = '0'; i <= '9'; ++i)
    {
        c.push_back(i);
    }
    for(size_t i = 0; i < 999999 && hasNext; ++i)
    {
        hasNext = nextPermutation(c.begin(), c.end());
    }
#else
    char c[] = "0123456789";
    size_t LENGTH = 10;
    for(size_t i = 0; i < 999999 && hasNext; ++i)
    {
        hasNext = nextPermutation(c, c+LENGTH);
    }
#endif
    std::cout << "done" << std::endl;
    std::cin.ignore();
    return 0;
}

当定义USE_VECTOR时,运行该试验台需要~20秒。当我不定义它时,代码在不到一秒的时间内运行(我没有编写任何计时代码,但这足以说明性能上存在非常显著的差异)。

现在我的问题是,在使用迭代器(std::string迭代器,std::vector迭代器等)和原始指针时,我在哪里承受了如此巨大的性能冲击?

如果没有优化,由于大量的迭代器调试(_ITERATOR_DEBUG_LEVEL在调试模式下默认为2,即完全调试),代码在我的机器上也很慢。
然而,在/02中,迭代器调试完全被禁用,代码在控制台窗口显示之前完全执行。这里有一个很好的调试示例,它使事情变慢但更安全。:)

在我的盒子上,这些是计时,从上面的计时,删除cin.ignore(),并使用基准测试:

$ g++-4.6 -O4 -DUSE_VECTOR -std=gnu++0x t.cpp -o t
$ time for a in $(seq 1 1000); do ./t; done > /dev/null

0 m10.145s真实用户0 m7.204ssys 0 m1.088s

$ g++-4.6 -O4 -std=gnu++0x t.cpp -o t
$ time for a in $(seq 1 1000); do ./t; done > /dev/null

0 m7.693s真实用户0 m3.280ssys 0 m0.984s

**没有惊人的差异,如果你问我的话**

现在是重拳:

$ g++-4.6 -O0 -std=gnu++0x t.cpp -o t
$ time for a in $(seq 1 1000); do ./t; done > /dev/null

0 m29.540s真实用户0 m27.294ssys 0 m0.976s