原子负载是否可以合并到C++内存模型中

Can atomic loads be merged in the C++ memory model?

本文关键字：C++ 内存模型合并负载是否更新时间：2023-10-16

请考虑下面的C++ 11 片段。对于 GCC 和 clang，这会编译为两个(顺序一致的(foo负载。 (编者注：编译器不会优化原子学，请参阅此问答以获取更多详细信息，特别是 http://wg21.link/n4455 标准讨论，讨论这可能产生的问题，而标准没有为程序员提供解决方法。这个语言律师问答是关于当前标准，而不是编译器所做的。

C++内存模型是否允许编译器将这两个加载合并为单个加载，并对 x 和 y 使用相同的值？

(编者注：这是标准组织正在做的事情：http://wg21.link/n4455 和 http://wg21.link/p0062。目前的纸面标准允许不受欢迎的行为。

我认为它无法合并这些负载，因为这意味着轮询原子不再有效，但我在内存模型文档中找不到相关部分。

#include <atomic>
#include <cstdio>
std::atomic<int> foo;
int main(int argc, char **argv)
{
    int x = foo;
    int y = foo;
    printf("%d %dn", x, y);
    return 0;
}

是的，因为我们无法观察到差异！

允许实现将您的代码段转换为以下内容(伪实现(。

int __loaded_foo = foo;
int x = __loaded_foo;
int y = __loaded_foo;

原因是您无法观察到上述内容与给定顺序一致性保证的两个单独的 foo 负载之间的差异。

_{注意：不仅仅是编译器可以进行这样的优化，处理器可以简单地推断出没有办法观察差异并加载一次foo的值 - 即使编译器可能要求它这样做两次。}

解释

给定一个不断以增量方式更新 foo 的线程，您可以保证的是，与 x 的内容相比，y将具有相同或更晚的写入值。

// thread 1 - The Writer
while (true) {
  foo += 1;
}

// thread 2 - The Reader
while (true) {
  int x = foo;
  int y = foo;
  assert (y >= x); // will never fire, unless UB (foo has reached max value)
}

想象一下，由于

某种原因，编写线程在每次迭代时暂停执行(由于上下文切换或其他实现定义的原因(;您无法证明这是导致x和y具有相同值的原因，或者是否是因为"合并优化"。

换句话说，我们必须给定本节中的代码的潜在结果：

在两次读取之间没有向 foo 写入新值 ( x == y (。
在两个读取(x < y(之间写入一个新值到foo。

由于两者中的任何一个都可能发生，因此实现可以自由地缩小范围，以始终执行其中之一;我们绝不能观察到其中的区别。

《标准》怎么说？

实现可以进行它想要的任何更改，只要我们看不到我们表达的行为与执行期间的行为之间的任何差异。

这在[intro.execution]p1中有所介绍：

本标准中的语义描述定义了参数化非确定性抽象机。这个国际标准对符合性结构没有要求实现。特别是，他们不需要复制或模仿抽象机器的结构。相反，符合实现 需要(仅(模拟抽象的可观察行为机器如下所述。

另一部分使其更加清晰[intro.execution]p5：

执行格式良好的程序的符合实现应产生与其中一个可能的执行相同的可观察行为具有相同功能的抽象机器的相应实例程序和相同的输入。

延伸阅读：

究竟什么是"假设"规则"？

循环轮询呢？

// initial state
std::atomic<int> foo = 0;

// thread 1
while (true) {
  if (foo)
    break;
}

// thread 2
foo = 1

问题：鉴于前面部分中的推理，实现是否可以简单地在线程 1 中读取一次foo，然后即使线程 2 写入foo也永远不会脱离循环？

答案;不。

在顺序一致的环境中，我们保证线程 2 中对 foo 的写入将在线程 1 中可见;这意味着当写入发生时，线程 1 必须观察这种状态变化。

_{注意：实现可以将两个读取转换为单个读取，因为我们无法观察到差异(一个栅栏与两个栅栏一样有效(，但它不能完全忽略本身存在的读取。}

_{注意：本节的内容由 [atomics.order]p3-4 保证。}

_{如果我真的想阻止这种形式的"优化"怎么办？}

_{如果你想强制实现在你编写它的每个点实际读取某个变量的值，你应该研究volatile的用法(请注意，这绝不会增强线程安全性(。}

但在实践中，编译器不会优化原子学，标准组织建议不要出于这种原因使用volatile atomic，直到这个问题尘埃落定。看

http://wg21.link/n4455
http://wg21.link/p0062
为什么编译器不合并冗余的 std：：atomic writes？
以及这个问题的副本，编译器可以并且是否优化了两个原子负载？

是的，在您的特定示例中(没有其他方法(。

您的特定示例具有单个执行线程，foo具有静态存储持续时间和初始化(即，在输入main之前(，否则在程序的生命周期内永远不会修改。
换句话说，没有外部可观察到的差异，并且可以合法地应用原样规则。事实上，编译器可以完全取消原子指令。x或y的价值不可能有任何不同。

在修改foo的并发程序中，情况并非如此。

您没有指定内存模型，因此使用默认模型，即顺序一致性。顺序一致性定义为提供与释放/获取相同的发生前/内存排序保证，并建立所有原子操作的单个总修改顺序。最后一点是重要的部分。

单个总修改顺序意味着，如果你有三个(原子(操作，例如 A、B 和 C，它们按该顺序发生(可能同时发生在两个线程中(，并且 B 是写入操作，而 A 和 C 是读取操作，那么 C 必须看到 B 建立的状态，而不是其他一些早期状态。也就是说，在点 A 和 C 处看到的值将不同。

就代码示例而言，如果另一个线程在您将其读入x之后(但在将值读入y之前(立即修改foo，则放入y的值必须是写入的值。因为如果操作按该顺序发生，则也必须按该顺序实现。

当然，恰好在两个连续加载指令之间发生的写入是一件不太可能的事情(因为时间窗口非常小，只是一个刻度(，但是否不太可能并不重要。
编译器必须生成代码，以确保如果出现此星座，操作仍会完全按照其发生的顺序查看。