std::string移动构造函数真的会移动吗

Does std::string move constructor actually move?

本文关键字:移动 真的 构造函数 std string      更新时间:2023-10-16

所以我得到了一个小的测试程序:

#include <string>
#include <iostream>
#include <memory>
#include <vector>
class Test
{
public:
Test(const std::vector<int>& a_, const std::string& b_)
: a(std::move(a_)),
b(std::move(b_)),
vBufAddr(reinterpret_cast<long long>(a.data())),
sBufAddr(reinterpret_cast<long long>(b.data()))
{}
Test(Test&& mv)
: a(std::move(mv.a)),
b(std::move(mv.b)),
vBufAddr(reinterpret_cast<long long>(a.data())),
sBufAddr(reinterpret_cast<long long>(b.data()))
{}
bool operator==(const Test& cmp)
{
if (vBufAddr != cmp.vBufAddr) {
std::cout << "Vector buffers differ: " << std::endl
<< "Ours: " << std::hex << vBufAddr << std::endl
<< "Theirs: " << cmp.vBufAddr << std::endl;
return false;
}

if (sBufAddr != cmp.sBufAddr) {
std::cout << "String buffers differ: " << std::endl
<< "Ours: " << std::hex << sBufAddr << std::endl
<< "Theirs: " << cmp.sBufAddr << std::endl;
return false;
}
}
private:

std::vector<int> a;
std::string b;
long long vBufAddr;
long long sBufAddr;
};
int main()
{
Test obj1 { {0x01, 0x02, 0x03, 0x04}, {0x01, 0x02, 0x03, 0x04}};
Test obj2(std::move(obj1));
obj1 == obj2;


return 0;
}

我用于测试的软件:

编译器:gcc 7.3.0

编译器标志:-std=c++11

操作系统:Linux Mint 19(tara)与上游版本Ubuntu 18.04 LTS(仿生)

我在这里看到的结果是,移动后,向量缓冲区仍然有相同的地址,但字符串缓冲区没有。所以在我看来,它分配了一个新的,而不仅仅是交换缓冲区指针。是什么导致了这种行为?

您可能看到了小/短字符串优化(SSO)的效果。为了避免对每个微小字符串进行不必要的分配,std::string的许多实现包括一个固定大小的小数组来容纳小字符串,而不需要new(当没有使用动态分配时,这个数组通常会重新利用一些不必要的其他成员,因此它消耗很少或没有额外的内存来提供它,无论是对于小的还是大的string),这些字符串不会从std::move中受益(但它们很小,所以没关系)。较大的字符串将需要动态分配,并且将按预期传输指针。

只是为了演示,g++:上的代码

void move_test(std::string&& s) {
std::string s2 = std::move(s);
std::cout << "; After move: " << std::hex << reinterpret_cast<uintptr_t>(s2.data()) << std::endl;
}
int main()
{
std::string sbase;
for (size_t len=0; len < 32; ++len) {
std::string s1 = sbase;
std::cout << "Length " << len << " - Before move: " << std::hex << reinterpret_cast<uintptr_t>(s1.data());
move_test(std::move(s1));
sbase += 'a';
}
}

在线试用!

生成高(堆栈)地址,该地址在移动构造时更改长度为15或以下(可能随体系结构指针大小而变化),但在达到长度16或更高时切换到低(堆)地址,在移动构造后保持不变(切换为16,而不是17,因为它是NUL-终止字符串,因为C++11及更高版本需要它)。

要100%清楚:这是一个实施细节。C++规范的任何部分都不需要这种行为,所以你根本不应该依赖它的出现,当它出现时,你不应该依赖于它在特定字符串长度上的出现。