为什么禁止对位域进行非常量引用

Why are non-const references to bitfields prohibited?

本文关键字：非常常量引用禁止位域为什么更新时间：2023-10-16

C++11 中的第 9.6/3 节异常清晰："非常量引用不应绑定到位域。这项禁令背后的动机是什么？

我知道不可能直接绑定对位域的引用。但是如果我宣布这样的事情，

struct IPv4Header {
  std::uint32_t version:4,         // assumes the IPv4 Wikipedia entry is correct
                IHL:4,
                DSCP:6,
                ECN:2,
                totalLength:16;
};

为什么我不能这么说？

IPv4Header h;
auto& ecn = h.ECN;

我希望底层代码能够实际绑定到包含我感兴趣的位的整个std::uint32_t，并且我希望读取和写入操作生成代码以执行适当的屏蔽。结果可能又大又慢，但在我看来，它应该有效。这与标准中提到的const位域引用的工作方式一致(再次从 9.6/3 开始(：

如果引用的初始值设定项类型为 const T& 是一个引用位字段的左值，引用绑定到一个临时初始化为保存位字段的值;引用不直接绑定到位字段。

这表明写入位域是问题所在，但我看不出它是什么。我考虑了必要的屏蔽可能会在多线程代码中引入竞争的可能性，但是，根据 1.7/3，出于多线程的目的，非零宽度的相邻位域被视为单个对象。在上面的示例中，IPv4Header对象中的所有位字段都将被视为单个对象，因此根据定义，尝试在读取其他字段时修改字段的多线程代码已经是不雅的。

我显然错过了一些东西。这是什么？

非常量引用不能绑定到位字段，原因与指针不能指向位字段的原因相同。

虽然没有指定引用是否占用存储空间，但很明显，在非平凡的情况下，它们是作为伪装的指针实现的，并且引用的这种实现是由语言的作者"打算"的。就像指针一样，引用必须指向可寻址的存储单元。在普通硬件中，最小的可寻址存储单元是每字节(而不是每位(。不可能将非常量引用绑定到不可寻址的存储单元。由于非常量引用需要直接绑定，因此非常量引用不能绑定到位字段。您只能采用 const 引用，因为允许编译器复制该值。

生成可以指向位字段的指针/引用的唯一方法是实现某种"超级指针"，除了存储中的实际地址外，它还包含某种位偏移和位宽信息，以便告诉编写代码要修改哪些位。请注意，此附加信息必须存在于所有数据指针类型中，因为C++中没有"指向位字段的指针/引用"之类的类型。这基本上相当于实现更高级别的存储寻址模型，与底层操作系统/硬件平台提供的寻址模型完全分离。C++语言从未打算出于纯粹的效率考虑而要求从底层平台进行这种抽象。

一种可行的方法是引入一类单独的指针/引用，例如"指向位字段的指针/引用"，其内部结构比普通数据指针/引用更复杂。此类类型可以从普通数据指针/引用类型转换，但不能从其他方式转换。但这似乎不值得。

在实际情况下，当我必须处理打包成位和位序列的数据时，我通常更喜欢手动实现位字段并避免使用语言级位字段。位字段的名称是一个编译时实体，不可能进行任何类型的运行时选择。当需要运行时选择时，更好的方法是声明一个普通的uint32_t数据字段，并手动管理其中的各个位和位组。这种手动"位域"的运行时选择很容易通过掩码和移位(两者都可以是运行时值(来实现。基本上，这接近于上述"超级指针"的手动实现。

你不能对位域进行非const引用，原因与不能用&获取其地址的原因相同：它的实际地址不一定与char对齐，在定义上是C++抽象机器中最小的可寻址内存单元。您可以对它进行const引用，因为编译器可以自由复制该值，因为它不会被改变。

考虑单独编译的问题。采用const uint32_t&的函数需要使用相同的代码才能在任何const uint32_t&上进行操作。如果普通值和位字段值需要不同的写入行为，则类型不会编码足够的信息，以使函数在两者上正常工作。