为什么禁止对位域进行非常量引用

Why are non-const references to bitfields prohibited?

本文关键字:非常 常量 引用 禁止 位域 为什么      更新时间:2023-10-16

C++11 中的第 9.6/3 节异常清晰:"非常量引用不应绑定到位域。这项禁令背后的动机是什么?

我知道不可能直接绑定对位域的引用。但是如果我宣布这样的事情,

struct IPv4Header {
  std::uint32_t version:4,         // assumes the IPv4 Wikipedia entry is correct
                IHL:4,
                DSCP:6,
                ECN:2,
                totalLength:16;
};

为什么我不能这么说?

IPv4Header h;
auto& ecn = h.ECN;

我希望底层代码能够实际绑定到包含我感兴趣的位的整个std::uint32_t,并且我希望读取和写入操作生成代码以执行适当的屏蔽。结果可能又大又慢,但在我看来,它应该有效。这与标准中提到的const位域引用的工作方式一致(再次从 9.6/3 开始(:

如果引用的初始值设定项 类型为 const T& 是一个引用位字段的左值,引用绑定到一个临时初始化为 保存位字段的值;引用不直接绑定到位字段。

这表明写入位域是问题所在,但我看不出它是什么。我考虑了必要的屏蔽可能会在多线程代码中引入竞争的可能性,但是,根据 1.7/3,出于多线程的目的,非零宽度的相邻位域被视为单个对象。在上面的示例中,IPv4Header对象中的所有位字段都将被视为单个对象,因此根据定义,尝试在读取其他字段时修改字段的多线程代码已经是不雅的。

我显然错过了一些东西。这是什么?

非常量引用不能绑定到位字段,原因与指针不能指向位字段的原因相同。

虽然没有指定引用是否占用存储空间,但很明显,在非平凡的情况下,它们是作为伪装的指针实现的,并且引用的这种实现是由语言的作者"打算"的。就像指针一样,引用必须指向可寻址的存储单元。在普通硬件中,最小的可寻址存储单元是每字节(而不是每位(。不可能将非常量引用绑定到不可寻址的存储单元。由于非常量引用需要直接绑定,因此非常量引用不能绑定到位字段。您只能采用 const 引用,因为允许编译器复制该值。

生成可以指向位字段的指针/引用的唯一方法是实现某种"超级指针",除了存储中的实际地址外,它还包含某种位偏移和位宽信息,以便告诉编写代码要修改哪些位。请注意,此附加信息必须存在于所有数据指针类型中,因为C++中没有"指向位字段的指针/引用"之类的类型。这基本上相当于实现更高级别的存储寻址模型,与底层操作系统/硬件平台提供的寻址模型完全分离。C++语言从未打算出于纯粹的效率考虑而要求从底层平台进行这种抽象。

一种可行的方法是引入一类单独的指针/引用,例如"指向位字段的指针/引用",其内部结构比普通数据指针/引用更复杂。此类类型可以从普通数据指针/引用类型转换,但不能从其他方式转换。但这似乎不值得。

在实际情况下,当我必须处理打包成位和位序列的数据时,我通常更喜欢手动实现位字段并避免使用语言级位字段。位字段的名称是一个编译时实体,不可能进行任何类型的运行时选择。当需要运行时选择时,更好的方法是声明一个普通的uint32_t数据字段,并手动管理其中的各个位和位组。这种手动"位域"的运行时选择很容易通过掩码和移位(两者都可以是运行时值(来实现。基本上,这接近于上述"超级指针"的手动实现。

你不能对位域进行非const引用,原因与不能用&获取其地址的原因相同:它的实际地址不一定与char对齐,在定义上是C++抽象机器中最小的可寻址内存单元。您可以对它进行const引用,因为编译器可以自由复制该值,因为它不会被改变。

考虑单独编译的问题。采用const uint32_t&的函数需要使用相同的代码才能在任何const uint32_t&上进行操作。如果普通值和位字段值需要不同的写入行为,则类型不会编码足够的信息,以使函数在两者上正常工作。