为什么 Microsoft 的 std：：string 实现需要堆栈上的 40 个字节？

Why does Microsoft's implementation of std::string require 40 bytes on the stack?

本文关键字：字节堆栈 std Microsoft string 实现为什么更新时间：2023-10-16

最近看了这个关于Facebook实现字符串的视频，我很想知道Microsoft实现的内部结构。不幸的是，字符串文件(%VisualStudioDirectory%/VC/include(似乎不包含实际的定义，而只是转换函数(例如atoi(和一些运算符重载。

我决定从用户级程序中对其进行一些戳戳和刺激。当然，我做的第一件事就是测试sizeof(std::string)。令我惊讶的是，std：：string 需要 40 个字节！(无论如何在 64 位计算机上。前面提到的视频详细介绍了Facebook的实现只需要24字节，而gcc的实现需要32字节，所以这至少可以说是令人震惊的。

我们可以通过编写一个简单的程序来更深入地挖掘，该程序逐字节打印数据的内容(包括c_str地址(，如下所示：

#include <iostream>
#include <string>
int main()
{
    std::string test = "this is a very, very, very long string";
    // Print contents of std::string test.
    char* data = reinterpret_cast<char*>(&test);
    for (size_t wordNum = 0; wordNum < sizeof(std::string); wordNum = wordNum + sizeof(uint64_t))
    {
        for (size_t i = 0; i < sizeof(uint64_t); i++)
            std::cout << (int)(data[wordNum + i]) << " ";
        std::cout << std::endl;
    }
    // Print the value of the address returned by test.c_str().
    // (Doing this byte-by-byte to match the above values).
    const char* testAddr = test.c_str();
    char* dataAddr = reinterpret_cast<char*>(&testAddr);
    std::cout << "c_str address: ";
    for (size_t i = 0; i < sizeof(const char*); i++)
        std::cout << (int)(dataAddr[i]) << " ";
    std::cout << std::endl;
}

这将打印出来：

48 33 -99 -47 -55 1 0 0
16 78 -100 -47 -55 1 0 0
-52 -52 -52 -52 -52 -52 -52 -52
38 0 0 0 0 0 0 0
47 0 0 0 0 0 0 0
c_str address: 16 78 -100 -47 -55 1 0 0

检查这一点，我们可以看到第二个字包含指向字符串分配数据的地址，第三个字是垃圾(短字符串优化的缓冲区(，第四个字是大小，第五个字是容量。但是第一个词呢？它似乎是一个地址，但为了什么？难道不应该一切都已经计算在内了吗？

为了完整起见，以下输出显示 SSO(字符串设置为"短字符串"(。请注意，第一个单词似乎仍然表示一个指针：

0 36 -28 19 123 1 0 0
83 104 111 114 116 32 83 116
114 105 110 103 0 -52 -52 -52
12 0 0 0 0 0 0 0
15 0 0 0 0 0 0 0
c_str address: 112 -9 79 -108 23 0 0 0

编辑：好的，所以做了更多的测试，似乎std：：string的大小在编译发布时实际上减少到32字节，并且第一个单词不再存在。但我仍然非常想知道为什么会这样，以及该额外指针在调试模式下的用途。

更新：根据用户Yuushi的提示，额外的单词似乎与调试迭代器支持有关。当我关闭调试迭代器支持时，这得到了验证(此处显示了执行此操作的示例(，并且 std：：string 的大小减少到 32 字节，现在缺少第一个单词。

但是，看看调试迭代器支持如何使用该附加指针来检查不正确的迭代器使用仍然非常有趣。

>Visual Studio 2015使用xstring而不是string来定义std::basic_string

注意：此答案仅适用于VS2015，VS2013使用不同的实现，但是，它们或多或少是相同的。

它实现为：

template<class _Elem,
class _Traits,
class _Alloc>
class basic_string
    : public _String_alloc<_String_base_types<_Elem, _Alloc> >
{
// This class has no member data
}

_String_alloc使用_Compressed_pair<_Alty, _String_val<_Val_types> >来存储它的数据，在std::string中，_Alty是std::allocator<char>的，_Val_types是_Simple_types<char>的，因为std::is_empty<std::allocator<char>>::value是true的，sizeof _Compressed_pair<_Alty, _String_val<_Val_types> >与sizeof _String_val<_Val_types>相同

类_String_val继承自_Container_base，这是#if _ITERATOR_DEBUG_LEVEL == 0时_Container_base0的typedef，否则_Container_base12。它们之间的区别在于_Container_base12包含指向用于调试目的的_Container_proxy的指针。除此之外，_String_val还有这些成员：

union _Bxty
    {   // storage for small buffer or pointer to larger one
    _Bxty()
        {   // user-provided, for fancy pointers
        }
    ~_Bxty() _NOEXCEPT
        {   // user-provided, for fancy pointers
        }
    value_type _Buf[_BUF_SIZE];
    pointer _Ptr;
    char _Alias[_BUF_SIZE]; // to permit aliasing
    } _Bx;
size_type _Mysize;  // current length of string
size_type _Myres;   // current storage reserved for string

_BUF_SIZE是 16。

pointer_type，size_type在这个系统中很好地对齐在一起。无需对齐。

因此，当_ITERATOR_DEBUG_LEVEL == 0 时，sizeof std::string为：

_BUF_SIZE + 2 * sizeof size_type

否则就是

sizeof pointer_type +  _BUF_SIZE + 2 * sizeof size_type