以整数形式访问无符号字符数组的元素

Access elements of an unsigned char array as integers

本文关键字:字符 数组 元素 无符号 访问 整数      更新时间:2023-10-16

我必须使用仅接受*unsigned char作为输入的读取函数,

typedef unsigned char byte;
byte * rx_data;
rx_data = new byte [RX_PACKET_LEN*packets];

如何以简单的方式将rx_data读取为整数(4字节)数组?

你可以投射它:

int* pInt = reinterpret_cast<int*>( rx_data);

int* pInt = (int*) rx_data;

或者,如果要保留名称,请在需要读取时将其转换为:

((int*)rx_data)[0];

请注意,只有在您绝对确定自己在做什么时才应该这样做,否则不安全。(嗯,我知道这个 CA 适用于任何地方,但这需要特别注意)。我想到的东西 - RX_PACKET_LEN*packets应该是sizeof(int)的倍数.

由于这是C++,因此应使用 reinterpret_cast 将无符号 char 指针强制转换为 int 指针:

int * data = reinterpret_cast<int*>(rx_data);

但是,这假设数据以特定的字节序格式存储,因此如果字符数组来自具有不同字节序的不同平台,则此代码将不起作用。如果您假设相同的平台,那么您可能会没问题。

在一般设置中唯一安全的方法是制作副本:

std::vector<int32_t> target(RX_PACKET_LET * packets / sizeof(int32_t));
std::copy(rx_data, rx_data + RX_PACKET_LET * packets,
          reinterpret_cast<unsigned char *>(target.data()));

现在你可以阅读target[0]target[1]、...作为整数。

你可以为此使用 memcpy。

byte *rx_data = ...
size_t rx_data_size = ...
std::array<int, rx_data_size/sizeof(int)> data;
std::memcpy(data.get(), rx_data, data.size() * sizeof(int));
// read and modify data
// if you need to write it back out to rx_data then copy data back when you're done
std::memcpy(rx_data, data.get(), data.size() * sizeof(int));

这样做的好处是它不涉及强制转换,处理未对齐的内存,并且不依赖于晦涩难懂的混叠规则。

一个缺点可能是复制数据可能会导致性能降低。但是,这并不能保证。现代编译器通常将 memcpy 实现为编译器内部函数,优化器可以推理其行为。

我刚刚尝试了LLVM,发现这些:

void increment(char *buf) {
    int i;
    memcpy(&i,buf,sizeof(int));
    ++i;
    memcpy(buf,&i,sizeof(int));
}
void increment(int &i) {
    ++i;
}

生成几乎相同的 IR 表示 (clang tmp.cpp -emit-llvm -o - | opt -S -O2) 和完全相同的x86_64程序集。

将指针类型从 byte* 更改为 int* 时,当递增指针 (p++) 时,将自动读取 4 个字节或跳转 4 个字节。只需确保字节数组大小为模块 4,这样就不会出现分段错误。