为什么矢量迭代器指向越界

Why does the vector iterator point out of bounds?

本文关键字:越界 迭代器 为什么      更新时间:2023-10-16

我正在研究一种递归合并排序算法,其中一个迭代器超出了界限。我确信我的问题的根源是我的算法有缺陷,但我花了好几天的时间来研究它,我只是没有看到我的失误。我不知道该往哪个方向走。能找一个比我更有经验/更聪明的人看看吗?(带有驱动程序的完整程序可在Github上获得。)

输出为:

before: 50 5 40 10 30 15 20 20 10 25 
after : -1808873259 5 10 10 15 20 20 25 30 40 50 
/*      ^  
 *      Extra recursive call, and out-of-bounds.
 */

需要明确的是,我只能返回类型为T的向量,在本例中为int,但我从这篇文章中知道,使用void函数更好。

template <typename T>
vector<T> mergesort(typename vector<T>::iterator begin, typename vector<T>::iterator end){
    vector<T> newVector;
    if (begin!=end){
        vector<T> tmp1;
        vector<T> tmp2;
        typename vector<T>::iterator mid1 = begin;
        typename vector<T>::iterator mid2 = begin;
        long origDistance = distance(begin,end);
        long endOfRange1 = origDistance/2;
        long begOfRange2 = endOfRange1+1;
        advance(mid1,endOfRange1);
        advance(mid2,begOfRange2);
        tmp1 = mergesort<T>(begin,mid1);
        tmp2 = mergesort<T>(mid2,end);
        //"merge()" is from the STL, link in comments. 
        merge(tmp1.begin(),tmp1.end(),tmp2.begin(),tmp2.end(), back_inserter(newVector));
    } else {
        newVector.push_back(*begin);
    }
    return newVector;
}

begin == end时取消引用begin。这是未定义的行为。可能您想要if (origDistance == 1),然后push_back单个元素并返回。

如果end指向向量的最后一个元素,那么函数看起来可以工作。然而,在你的示例程序中,你这样称呼它:

newVector = mergesort<int>(vec.begin(), vec.end());

vec.end()指向矢量的末尾,它不指向最后一个元素。因此,您的函数会出错,因为它最终试图访问您传入的第二个迭代器所指向的元素

您可以调用您的函数,如:mergesort<int>(vec.begin(), vec.end() - 1);

然而,这会让其他阅读您代码的人感到惊讶。最好重写mergesort函数以遵循正常的C++范围约定,也就是说,名为end的参数应该超过末尾。mid1应等于mid2

好吧-如果不弄清楚这一点,我就睡不着了,约翰·兹温克和M.M让我走上了正确的方向,这是得到正确输出的代码:

template <typename T>
vector<T> mergesort(typename vector<T>::iterator begin, typename vector<T>::iterator end){
    vector<T> newVector;
    long origDistance = distance(begin,end); /*Get distance first.*/
    if (origDistance==1){ /*Added better anchor case checking for distance.*/
        newVector.push_back(*begin);
        return newVector;
    }
    vector<T> tmp1;
    vector<T> tmp2;
    typename vector<T>::iterator mid1 = begin;
    typename vector<T>::iterator mid2 = begin;
    long endOfRange1 = origDistance/2;
    long begOfRange2 = endOfRange1;/*Edited from: endOfRange+1*/
    advance(mid1,endOfRange1);
    advance(mid2,begOfRange2);
    tmp1 = mergesort<T>(begin,mid1);
    tmp2 = mergesort<T>(mid2,end);
    merge(tmp1.begin(),tmp1.end(),tmp2.begin(),tmp2.end(), back_inserter(newVector));
        return newVector;
}

这里我将向您展示如何做到这一点。

template <typename T>
void mergesort(typename vector<T>::iterator, typename vector<T>::iterator);
// ...
    mergesort<int>(vec.begin(), vec.end());
    newVector = vec;
// ...
template <typename T>
void mergesort(typename vector<T>::iterator begin, typename vector<T>::iterator end){
    auto const N = std::distance(begin, end);
    if (N <= 1) return;                   
    auto const middle = std::next(begin, N / 2);
    mergesort<T>(begin, middle);
    mergesort<T>(middle, end);
    std::inplace_merge(begin, middle, end); 
}

正确输出:

before: 50 5 40 10 30 15 20 20 10 25 
after : 5 10 10 15 20 20 25 30 40 50 

STL已经有了inplace_merge,为什么要重新实现它呢?有了这种方法,你就不必去想有什么难以逾越的界限。