来自 32 个 8 位比较的 32 位汉明字符串形成

32-bit Hamming String formation from 32 8-bit comparisons

本文关键字:字符串 比较 来自      更新时间:2023-10-16

我正在对图像进行人口普查转换,每像素进行 32 次比较。我可以有效地生成一个 256 位的 0x0100010100010100 向量......其中每个 8 位对应于 0x00 或 0x01。该向量在下面标识为"比较"。我需要折叠这个 256 位向量以生成一个 32 位汉明字符串。数组"census"是我存储 8 位比较的地方。请注意,此时我不关心汉明距离,我只对尽快生成字符串感兴趣。我有可用的 AVX2。我当前的代码:

uint8_t* census = (uint8_t*) _mm_malloc(sizeof(int)*8,32);
...
_mm256_storeu_si256((__m256i*) census, comparisons);
uint32_t hammingString = (uint32_t) (census[0] +
                                    (census[1] << 1)   +
                                    (census[2] << 2)   +
                                    ...
                                    (census[31] << 31));

这几乎正是_mm256_movemask_epi8的用途,除了它采用字节的顶部位而不是最低有效位。因此,只需先向左移动 7。

或者,改变你生成这些字节的方式,因为你可能把它们分别设置为假和真0x00或0xFF,对吧?至少,通常比较会导致这种事情。