C++ vector.erase() function bug

本文关键字：function bug vector erase C++ 更新时间：2023-10-16

我有这个向量:

list.push_back("one");
list.push_back("two");
list.push_back("three");

我使用list.erase(list.begin() + 1)删除"2"，它工作。但是当我尝试再次输出列表时:

cout<<list[0]<<endl;
cout<<list[1]<<endl;
cout<<list[2]<<endl;

生产:

one
three
three

我尝试用list.erase(list.begin() + 2)来擦除最后一个元素，但重复的三个元素仍然存在。我想象索引2应该被移位，list[2]应该没有输出。List[3]没有输出任何内容，正如它应该的那样。

我试图擦除"两个"并仅输出列表:

one
three

当使用cout<<list[2]<<endl;时，您假设仍然有三个元素。但实际上，你正在访问内存中不再使用的部分的剩余数据。

您应该使用list.size ()来获得元素的数量。比如:

for ( size_t i = 0; i < list.size (); i++ )
{
    cout<<list[i]<<endl;
}

但是您删除了元素，因此容器的大小减少了1，即从3到2。

所以，在擦除之后，你不应该这样做:

cout<<list[0]<<endl;
cout<<list[1]<<endl;
cout<<list[2]<<endl; // Undefined Behaviour!!

但这:

cout<<list[0]<<endl;
cout<<list[1]<<endl;

在您的示例中，"3"只是复制到索引1，这是预期的。你现在是vector.size() == 2

这是因为vector会做预分配，这有助于提高性能。

为了避免每次更改都必须重新调整大小，vector获取比它需要的更大的内存块并保留它，直到强制变大或指示变小。

为了简化，可以把它想象成

string * array = new string[100];
int capacity = 100
int size = 0;

在这种情况下，您可以在不导致程序崩溃的情况下写入所有100个元素的数组，因为它是良好和有效的内存，但是只有size下面的值已经初始化并且是有意义的。当你读到上面的size时，会发生什么是未定义的。因为读取越界是一个坏主意，防止越界的性能成本不应该通过正确使用来支付，所以c++标准没有浪费任何时间来定义这样做的惩罚是什么。一些调试或安全关键版本将测试并抛出异常，或者用金丝雀值标记未使用的部分，以帮助检测错误，但大多数实现的目标是最大速度，什么也不做。

现在你推回"1"、"2"answers"3"。数组仍然是100个元素，capacity仍然是100个元素，但size现在是3个元素。

您擦除array[1]，并且在1之后的每个元素(直到大小)将被复制一个元素(注意这里潜在的巨大性能成本)。vector不是正确的数据结构选择(如果您在随机位置添加和删除项目)，size将减少1，导致"1"，"3"answers"3"。数组仍然是100个元素，capacity仍然是100，但size现在是2。

假设你又添加了99个字符串。这将在每次添加字符串时推入size，当size超过capacity时，将生成一个新数组，将旧数组复制到新数组中，并释放旧数组。类似以下语句:

capacity *= 1.5;
string * temp = new string[capacity];
for (int index = 0; index < size; index ++)
{
    temp[index] = array[index];
}
delete array;
array = temp;

数组现在是150个元素，capacity现在是150个元素，size现在是101个元素。

结果:

通常在vector的末尾会有一些空白，允许读取越界而不会导致程序崩溃，但不要将其与程序工作混淆。