理解__m128i标志的位对齐
Understanding bit alignment for an __m128i flag
我试图理解SSE strstr实现,一个特定的函数正在做一些我不太理解的事情,将const unsigned char*
加载到__m128i
中。函数是__m128i_strloadu
函数(取自这里:http://strstrsse.googlecode.com/svn-history/r135/trunk/strmatch/lib/strstrsse42.c):
static inline __m128i __m128i_strloadu (const unsigned char * p) {
int offset = ((size_t) p & (16 - 1));
if (offset && (int) ((size_t) p & 0xfff) > 0xff0) {
__m128i a = _mm_load_si128 ((__m128i *) (p - offset));
__m128i zero = _mm_setzero_si128 ();
// I don't understand what this movemask, in concert
// with the shift right comparison below, are accomplishing
int bmsk = _mm_movemask_epi8 (_mm_cmpeq_epi8 (a, zero));
if ((bmsk >> offset) != 0) {
return __m128i_shift_right(a, offset);
}
}
return _mm_loadu_si128 ((__m128i *) p);
}
我觉得这是一个简单的对齐到16位的操作,但是我很难想象它是如何发生的。movemask比较在这里完成了什么/它在检查什么?
它正在测试字符串的末尾是否在这个块中,如果是,它将移出多余的字节并返回。否则,它继续执行正常的未对齐加载,避免移位并包含"此字符串的更多内容"而不是虚假的零。
掩码是16字节块中字节为零的掩码。bmsk >> offset
是掩码的一部分,表示被请求的字节(从p
开始),额外的字节是由于对齐。
相关文章:
- 如何理解将半精度指针转换为无符号长指针和相关的内存对齐
- 如何创建一个QTableWidgetItem,用长文本右对齐,左边有省略号
- 我可以检测和更改 gcc/g++ 中结构的当前数据对齐设置吗?
- 64位机器上的C++内存对齐
- 为什么我可以将变量存储在不是其最小对齐方式的倍数的地址?
- 使 std::vector 分配对齐内存的现代方法
- C++ cout 将双精度对齐到精度 2 并正确对齐
- 在 64 位边界上对齐C++结构数组?
- 使用 g++7 构建的代码在访问未对齐的内存时崩溃
- 在 capnp FlatArrayMessageReader 的对齐内存缓冲区中接收 zmq 消息
- 是否值得对齐变量?
- 初始化派生结构的基部分/意外打包派生结构字段以对齐基结构的间隙
- 对齐和对齐的实际用例C++关键字
- 如何减少代码的运行时间以对齐文本?
- 指向包含对齐 C 结构C++类的 C 指针的对齐问题
- Linux C++ 中的页面对齐内存分配
- C++ 类层次结构中的"对齐"是什么意思?
- 运行时错误:引用绑定到类型"int"的未对齐地址0xbebebebebebebec6,这需要 4 个字节对齐 (stl_vector.h)
- 具有调整对齐方式的类型定义
- 理解__m128i标志的位对齐