在Linux上,在C/ c++中,指针是否有MSB设置?

On Linux, in C/C++, will a pointer ever have the MSB set?

本文关键字:是否 MSB 指针 设置 c++ Linux      更新时间:2023-10-16

我想使用一个长整数,当MSB被设置时将被解释为一个数字,否则它将被解释为一个指针。那么,这是可行的还是我在C或c++中会遇到问题?

这是在64位系统上。

在x86-64上,你将有一个超过47位的指针,地址设置为第63位,因为所有高于"体系结构支持的最大位数"(目前是48)的位都必须具有与值本身的最高有效位相同的值。(也就是说,任何超过0007 FFFF FFFF FFFF的地址都将是FFF8 0000 0000 0000 0000 -介于两者之间的地址作为指针都是"无效的")

这可能是只有内核使用的地址,但我不确定它一定是。

然而,我会尽量避免使用这样的技巧——它可能会在某个时候回来困扰你。

人们以前也试过这样的把戏。

从长远来看,这是行不通的。

别这么做。

编辑:更好的链接-参见参考'bit31',它以前从未作为集合返回。一旦它可以被设置(超过2 gb的内存,呸!),它将破坏顽皮的程序,因此程序需要选择这个选项,一旦这么多的内存成为常态,因为人们已经使用了像这样的欺骗(以及其他事情)。现在我可爱的、简短的、切题的答案变得太长了:-)

所以这是工作还是我会遇到问题在C或c++ ?

你有64位吗?您希望您的代码可移植到32位系统吗?long不一定是64位的。大端序还是小端序?(你知道你的系统是什么吗?)

加上,无望的困惑。请使用一个额外的变量来存储这些信息,否则你会有很多关于这个的错误。

这取决于体系结构。例如,X86_64架构目前使用的是48位寻址。这意味着您可以根据自己的需要使用16位(这种技巧有时被称为"指针打包")。然而,即使是x86_64架构定义也允许在未来的实现中将此限制提高到完整的64位。如果发生这种情况,您可能会遇到需要更改大量代码的情况。所以,如果你真的必须这样做,确保你的指针包装保存在一个地方,很容易在未来改变。对于其他架构,您必须自己检查。

除非您确实需要空间,或者您要保留很多这样的东西,否则我将只使用一个普通的并集,并添加一个标记字段。如果你打算走这条路,确保你的记忆是对齐的,以满足你的需求。

看看boost.lockfree中的boost::lockfree::detail::tagged_ptr

这个类是在最新的1_53 boost中引入的。

别耍花招了。如果您需要在某些容器中区分整数和指针,请考虑使用单独的bit set来指示此类标志。在c++中,std::bitset已经足够好了。

原因:

  • 实际上没有人保证指针是long unsignedlong long unsigned。如果你需要要存储它们,请始终应用sizeof()void *类型(如果需要的话)
  • 即使在一个系统上,地址也高度依赖于架构。
  • 内核模块可能会严重改变进程的映射逻辑,所以你永远不知道你需要什么地址。

请记住,返回给程序的虚拟地址不一定与内存中的实际物理地址一致。事实上,除非你是直接操作非常特殊的内存[例如某些形式的图形内存],否则这是绝对的情况。

在这种情况下,它是MMU的最大值,它定义了程序看到的指针的值。在这种情况下,对于x64,我很确定它(目前)是48位,但是正如Mats上面所指定的,一旦你在48位中设置了顶部位,你就会得到63位。

所以接受他的答案和我的答案-即使有少量的RAM,也完全有可能获得第47位集的指针,一旦你这样做了,你就得到了第63位集。

如果所讨论的"64位系统"是x86_64,那么是的,它将工作。