矢量内存分配策略

vector memory allocation strategy

本文关键字：策略分配内存更新时间：2023-10-16

我写了一小段代码来确定如何在向量中分配内存。

#include <iostream>
#include <vector>
using namespace std;
int main ()
{
  vector<unsigned int> myvector;
  unsigned int capacity = myvector.capacity();
  for(unsigned int i = 0; i <  100000; ++i) {
    myvector.push_back(i);
    if(capacity != myvector.capacity())
    {
      capacity = myvector.capacity();
      cout << myvector.capacity() << endl;
    }
  }
  return 0;
}

我在Ubuntu上使用Visual Studio 2008和g++4.5.2编译了这篇文章，得到了以下结果：

Visual Studio:

1 2 3 4 6 9 13 19 28 63 94 141 211 316 474 711 1066 1599 2398 3597 5395 8092 12138 18207 27310 40965 61447 92170 138255

capacity = capacity * 1.5;

g++：

1 2 4 8 16 32 64 128 256 512 1024 4096 8192 16384 32768 65536 131072

capacity = capacity * 2;

正如你所看到的，这是两个非常不同的结果。为什么会这样？它是仅仅取决于编译器，还是沉迷于其他因素？

即使对于大量元素，继续将容量翻倍真的有意义吗？

vector如何增长是实现定义的。因此，在插入相同数量的元素后，可以使用不同的策略来产生不同的容量

如果您需要依赖于分配的项目数量，则应使用vector 的reserve和/或resize方法

正如您所看到的，VS正在用较小的块添加额外的空间，而G++i则用2的幂来添加。这只是相同基本思想的实现：添加的元素越多，下次分配的空间就越多（因为添加额外数据的可能性更大）。

假设你在向量上加了一个元素，我加了1000。这更有可能再增加1000，而你不太可能再增加。这就是这种空间分配策略的理由。

确切的数字当然取决于某些东西，但这是编译器制造商的推理，因为他们可以用任何他们想要的方式实现它。

标准只定义向量的行为。内部真正发生的事情取决于实现。将容量加倍会导致推送/弹出n个元素的摊销O（n）成本，我想这是向量所必需的。查看此处了解更多详细信息。