IBM 单精度浮点数据转换为预期值

IBM Single Precision Floating Point data conversion to intended value

本文关键字:转换 数据 单精度 精度 IBM      更新时间:2023-10-16

我需要从二进制文件中读取值。数据格式为 IBM 单精度浮点(4 字节十六进制指数数据(。我有C++代码,可以从文件中读取并取出每个字节并像这样存储它

unsigned char buf[BUF_LEN];
for (long position = 0; position < fileLength; position += BUF_LEN) {
file.read((char* )(&buf[0]), BUF_LEN);
// printf("n%8ld:  ", pos);
for (int byte = 0; byte < BUF_LEN; byte++) {
// printf(" 0x%-2x", buf[byte]);
}
}

这将打印出每个字节的十六进制值。

此图指定 IBM 单精度浮点 IBM 单精度浮点

如何将缓冲区转换为浮点值?

该格式实际上非常简单,与IEEE 754 binary32格式没有特别区别(它实际上更简单,不支持任何"神奇的"NaN/Inf值,并且没有次正规数,因为这里的尾数在左侧有一个隐式0而不是隐式1(。

正如维基百科所说,

该数字表示为以下公式:(−1(符号× 0.有效× 16指数−64

如果我们想象您读取的字节在uint8_t b[4]中,那么结果值应该是这样的:

uint32_t mantissa = (b[1]<<16) | (b[2]<<8) | b[3];
int exponent = (b[0] & 127) - 64;
double ret = mantissa * exp2(-24 + 4*exponent);
if(b[0] & 128) ret *= -1.;

请注意,这里我用double计算结果,因为IEEE 754float的范围不足以表示相同大小的IBM单精度值(也相反(。另外,请记住,由于字节序问题,您可能需要恢复上面代码中的索引。


编辑@Eric Postpischil正确地指出,如果您有C99或POSIX 2001可用,而不是mantissa * exp2(-24 + 4*exponent)您应该使用ldexp(mantissa, -24 + 4*exponent),这应该在实现中更精确(并且可能更快(。