移动字节数组和跳过位

Shifting arrays of bytes and skipping bits

本文关键字:数组 字节 字节数 移动      更新时间:2023-10-16

我试图使一个函数,将返回给定内存块的N位数,并可选择跳过M位。

的例子:

unsigned char *data = malloc(3);
data[0] = 'A'; data[1] = 'B'; data[2] = 'C';
read(data, 8, 4);

将跳过12位,然后从数据块"ABC"中读取8位。

"跳过"位意味着它实际上会对整个数组进行位移,从右到左进行位移。

本例中ABC

01000001 01000010 01000011

,函数需要返回

    0001 0100

这个问题是我上一个问题的后续问题

最小可编译代码

#include <ios>
#include <cmath>
#include <bitset>
#include <cstdio>
#include <cstring>
#include <cstdlib>
#include <iostream>
using namespace std;
typedef unsigned char byte;
typedef struct bit_data {
    byte *data;
    size_t length;
} bit_data;
/*
   Asume skip_n_bits will be 0 >= skip_n_bits <= 8
*/
bit_data *read(size_t n_bits, size_t skip_n_bits) {
    bit_data *bits = (bit_data *) malloc(sizeof(struct bit_data));
    size_t bytes_to_read = ceil(n_bits / 8.0);
    size_t bytes_to_read_with_skip = ceil(n_bits / 8.0) + ceil(skip_n_bits / 8.0);
    bits->data = (byte *) calloc(1, bytes_to_read);
    bits->length = n_bits;
    /* Hardcoded for the sake of this example*/
    byte *tmp = (byte *) malloc(3);
    tmp[0] = 'A'; tmp[1] = 'B'; tmp[2] = 'C';
    /*not working*/
    if(skip_n_bits > 0){
        unsigned char *tmp2 = (unsigned char *) calloc(1, bytes_to_read_with_skip);
        size_t i;
        for(i = bytes_to_read_with_skip - 1; i > 0; i--) {
            tmp2[i] = tmp[i] << skip_n_bits;
            tmp2[i - 1] = (tmp[i - 1] << skip_n_bits) | (tmp[i] >> (8 - skip_n_bits));
        }
        memcpy(bits->data, tmp2, bytes_to_read);
        free(tmp2);
    }else{
        memcpy(bits->data, tmp, bytes_to_read);
    }
    free(tmp);
    return bits;
}
int main(void) {
    //Reading "ABC"
    //01000001 01000010 01000011
    bit_data *res = read(8, 4);
    cout << bitset<8>(*res->data);
    cout << " -> Should be '00010100'";
    return 0;
}

当前代码返回00000000而不是00010100。我觉得这个错误很小,但是我没有注意到。问题在哪里?

你的代码被标记为c++,事实上你已经在使用像bitset这样的c++结构,但是它非常像C。我认为首先要做的是使用更多的c++。

bitset已经很灵活了。我的方法是创建一个来存储输入数据中的所有位,然后根据您希望跳过的数字抓取该子集,并返回该子集:

template<size_t N, size_t M, typename T = unsigned char>
std::bitset<N> read(size_t skip_n_bits, const std::array<T, M>& data)
{
    const size_t numBits = sizeof(T) * 8;
    std::bitset<N> toReturn; // initially all zeros
    // if we want to skip all bits, return all zeros
    if (M*numBits <= skip_n_bits)
        return toReturn;
    // create a bitset to store all the bits represented in our data array
    std::bitset<M*numBits> tmp;
    // set bits in tmp based on data
    // convert T into bit representations
    size_t pos = M*numBits-1;
    for (const T& element : data)
    {
        for (size_t i=0; i < numBits; ++i)
        {
            tmp.set(pos-i, (1 << (numBits - i-1)) & element);
        }
        pos -= numBits;
    }
    // grab just the bits we need
    size_t startBit = tmp.size()-skip_n_bits-1;
    for (size_t i = 0; i < N; ++i)
    {
        toReturn[N-i-1] = tmp[startBit];
        tmp <<= 1;
    }
    return toReturn;
}

完整的工作演示

现在我们可以这样命名:

// return 8-bit bitset, skip 12 bits
std::array<unsigned char, 3> data{{'A', 'B', 'C'}};
auto&& returned = read<8>(12, data);
std::cout << returned << std::endl;

打印

00100100

就是我们的输入01000001 01000010 01000011跳过前12位(从左到右),只抓取接下来的8位。

我认为这比你看到的更容易阅读,特别是从c++程序员的角度来看。