C++ vector.erase() function bug

C++ vector.erase() function bug

本文关键字:function bug vector erase C++      更新时间:2023-10-16

我有这个向量:

list.push_back("one");
list.push_back("two");
list.push_back("three");

我使用list.erase(list.begin() + 1)删除"2",它工作。但是当我尝试再次输出列表时:

cout<<list[0]<<endl;
cout<<list[1]<<endl;
cout<<list[2]<<endl;

生产:

one
three
three

我尝试用list.erase(list.begin() + 2)来擦除最后一个元素,但重复的三个元素仍然存在。我想象索引2应该被移位,list[2]应该没有输出。List[3]没有输出任何内容,正如它应该的那样。

我试图擦除"两个"并仅输出列表:

one
three

当使用cout<<list[2]<<endl;时,您假设仍然有三个元素。但实际上,你正在访问内存中不再使用的部分的剩余数据。

您应该使用list.size ()来获得元素的数量。比如:

for ( size_t i = 0; i < list.size (); i++ )
{
    cout<<list[i]<<endl;
}

但是您删除了元素,因此容器的大小减少了1,即从3到2。

所以,在擦除之后,你不应该这样做:

cout<<list[0]<<endl;
cout<<list[1]<<endl;
cout<<list[2]<<endl; // Undefined Behaviour!!

但这:

cout<<list[0]<<endl;
cout<<list[1]<<endl;

在您的示例中,"3"只是复制到索引1,这是预期的。你现在是vector.size() == 2

这是因为vector会做预分配,这有助于提高性能。

为了避免每次更改都必须重新调整大小,vector获取比它需要的更大的内存块并保留它,直到强制变大或指示变小。

为了简化,可以把它想象成

string * array = new string[100];
int capacity = 100
int size = 0;

在这种情况下,您可以在不导致程序崩溃的情况下写入所有100个元素的数组,因为它是良好和有效的内存,但是只有size下面的值已经初始化并且是有意义的。当你读到上面的size时,会发生什么是未定义的。因为读取越界是一个坏主意,防止越界的性能成本不应该通过正确使用来支付,所以c++标准没有浪费任何时间来定义这样做的惩罚是什么。一些调试或安全关键版本将测试并抛出异常,或者用金丝雀值标记未使用的部分,以帮助检测错误,但大多数实现的目标是最大速度,什么也不做。

现在你推回"1"、"2"answers"3"。数组仍然是100个元素,capacity仍然是100个元素,但size现在是3个元素。

您擦除array[1],并且在1之后的每个元素(直到大小)将被复制一个元素(注意这里潜在的巨大性能成本)。vector不是正确的数据结构选择(如果您在随机位置添加和删除项目),size将减少1,导致"1","3"answers"3"。数组仍然是100个元素,capacity仍然是100,但size现在是2。

假设你又添加了99个字符串。这将在每次添加字符串时推入size,当size超过capacity时,将生成一个新数组,将旧数组复制到新数组中,并释放旧数组。类似以下语句:

capacity *= 1.5;
string * temp = new string[capacity];
for (int index = 0; index < size; index ++)
{
    temp[index] = array[index];
}
delete array;
array = temp;

数组现在是150个元素,capacity现在是150个元素,size现在是101个元素。

结果:

通常在vector的末尾会有一些空白,允许读取越界而不会导致程序崩溃,但不要将其与程序工作混淆。