IBM 单精度浮点数据转换为预期值

IBM Single Precision Floating Point data conversion to intended value

本文关键字：转换数据单精度精度 IBM 更新时间：2023-10-16

我需要从二进制文件中读取值。数据格式为 IBM 单精度浮点(4 字节十六进制指数数据(。我有C++代码，可以从文件中读取并取出每个字节并像这样存储它

unsigned char buf[BUF_LEN];
for (long position = 0; position < fileLength; position += BUF_LEN) {
file.read((char* )(&buf[0]), BUF_LEN);
// printf("n%8ld:  ", pos);
for (int byte = 0; byte < BUF_LEN; byte++) {
// printf(" 0x%-2x", buf[byte]);
}
}

这将打印出每个字节的十六进制值。

此图指定 IBM 单精度浮点 IBM 单精度浮点

如何将缓冲区转换为浮点值？

该格式实际上非常简单，与IEEE 754 binary32格式没有特别区别(它实际上更简单，不支持任何"神奇的"NaN/Inf值，并且没有次正规数，因为这里的尾数在左侧有一个隐式0而不是隐式1(。

正如维基百科所说，

该数字表示为以下公式：(−1(^符号× 0.有效× 16^指数−64。

如果我们想象您读取的字节在uint8_t b[4]中，那么结果值应该是这样的：

uint32_t mantissa = (b[1]<<16) | (b[2]<<8) | b[3];
int exponent = (b[0] & 127) - 64;
double ret = mantissa * exp2(-24 + 4*exponent);
if(b[0] & 128) ret *= -1.;

请注意，这里我用double计算结果，因为IEEE 754float的范围不足以表示相同大小的IBM单精度值(也相反(。另外，请记住，由于字节序问题，您可能需要恢复上面代码中的索引。

编辑：@Eric Postpischil正确地指出，如果您有C99或POSIX 2001可用，而不是mantissa * exp2(-24 + 4*exponent)您应该使用ldexp(mantissa, -24 + 4*exponent)，这应该在实现中更精确(并且可能更快(。