指针转换到64位环境中的长移植问题

Pointer conversion to long porting issue in 64 bit env

本文关键字:问题 转换 64位 环境 指针      更新时间:2023-10-16

我正在将一个应用程序从32位移植到64位
它是C风格的编码(遗留产品),尽管它是C++。我遇到了一个问题,使用联合和结构的组合来存储值。这里使用了一个名为"Any"的自定义数据类型,它应该包含任何基本数据类型的数据。Any的实现如下:

typedef struct typedvalue
{
long data; // to hold all other types of 4 bytes or less
short id; // this tells what type "data" is holding
short sign; // this differentiates the double value from the rest
}typedvalue;
typedef union Any 
{
double any_any;
double any_double; // to hold double value
typedvalue any_typedvalue;
}Any;

联合的大小为8字节。他们使用了并集,这样在给定的时间只有一个值,并且他们使用了struct来区分类型。您可以在任何给定时间存储double、long、string、char、float和int值。这就是想法。如果是双值,则该值存储在any_double中。如果它是任何其他类型,那么它存储在"data"中,值的类型存储在"id"中。"符号"将判断值"Any"是包含双精度还是其他类型。代码中大量使用anyany来复制地址空间中的值,而不考虑类型。(这是我们最大的问题,因为我们不知道在给定的时间它会保持什么!)

如果它是一个字符串或指针"Any",则它被存储在"data"(类型为long)中。在64位中,这就是问题所在。指针是8个字节。因此,我们需要将"long"更改为等效的8字节(long-long)。但这会将并集的大小增加到16个字节,自由使用"any_any"会带来问题。"any_any"的用法太多了,你永远不确定它能容纳什么。

我已经尝试了这些步骤,但没有成功:
1.将结构体中的"long data"更改为"long long data",这将使并集的大小变为16字节。-这将不允许数据以"any_any"(8字节)的形式传递
2.将结构声明为联合内部的指针。并将struct内部的"long data"更改为"long long数据"。-这里遇到的问题是,由于它是一个指针,我们需要为结构分配内存。随意使用"any_any"使我们很难分配内存。有时我们可能会覆盖内存,从而擦除值
3.创建一个单独的集合,该集合将保存"data"(键值对)的值。-这将不起作用,因为此实现是应用程序的核心,收集的数据将达到数百万。

有人能帮我吗?

"有人能帮帮我吗"这听起来像是绝望的呼喊,我完全理解。

无论是谁编写了这段代码,都完全不尊重的未来证明或可移植性,现在你要为此付出代价。

(这对任何说"但我们的平台是32位的!我们永远不会使用64位!"的人来说都是一个教训)

我知道你会说"但代码库太大了",但你最好重写产品。这次要好好做!

忽略原始设计是疯狂的这一事实,您可以使用<stdint.h>(或很快使用<cstdint>)来获得一点可预测性:

struct typedvalue
{
  uint16_t id;
  uint16_t sign;
  uint32_t data;
};
union any
{
  char any_raw[8];
  double any_double
  typedvalue any_typedvalue;
};

您仍然不能保证typedvalue将被紧密封装,因为对于非char成员没有对齐保证。你可以制作一个struct Foo { char x[8]; };并键入双关语,如果必须的话,比如*(uint32_t*)(&Foo.x[0])*(uint16_t*)(&Foo.x[4]),但这也会非常难看。

如果您在C++0x中,我肯定会在某个地方为sizeof(typedvalue) == sizeof(double)抛出一个静态断言。

如果您需要同时存储一个8字节的指针一个"类型"字段,那么您别无选择,只能使用至少9个字节,在64位系统上,对齐可能会将其增加到16个字节。

您的数据结构应该看起来类似

typedef struct {
    union {
        void   *any_pointer;
        double  any_double;
        long    any_long;
        int     any_int;
    } any;
    char        my_type;
} any;

如果使用C++0x,请考虑对my_type字段使用强类型枚举。在早期版本中,enum所需的存储取决于实现,并且可能超过一个字节。

为了节省内存,您可以使用(编译器特定的)指令来请求数据结构的最佳打包,但由此产生的内存访问错误可能会导致性能问题。