随机存取与SSE对齐的存储器
random access aligned memory with SSE
我试着写在一个int数组中的随机位置。为了确保我可以在随机位置访问内存,我尝试对齐整个内存块。
int * array = memalign(16384*2,16384*sizeof(short));
之后我在向量中这样写:
__m128i * index = (__m128i *) &array[RANDOMNUMBER];
_mm_store_si128(index+, ...)
该指令导致访问错误。如果我用_mm_storeu_si128
指令,我不会得到它。有人能解释一下为什么这行不通吗?
_mm_store_si128
的参数必须为16字节对齐。整数数组中随机选择的元素只会被sizeof(int)对齐(即使数组本身是16字节对齐)。因此,您必须确保数组的索引是(16/sizeof(int))
的倍数,例如:
__m128i * index = (__m128i *) &array[(RANDOMNUMBER / (16/sizeof(int))) * (16/sizeof(int))];
这将保证写操作被正确对齐。这是否是你的代码真正需要做的是另一个问题…
相关文章:
- 如何理解将半精度指针转换为无符号长指针和相关的内存对齐
- 如何创建一个QTableWidgetItem,用长文本右对齐,左边有省略号
- 我可以检测和更改 gcc/g++ 中结构的当前数据对齐设置吗?
- 64位机器上的C++内存对齐
- 为什么我可以将变量存储在不是其最小对齐方式的倍数的地址?
- 使 std::vector 分配对齐内存的现代方法
- C++ cout 将双精度对齐到精度 2 并正确对齐
- 在 64 位边界上对齐C++结构数组?
- 使用 g++7 构建的代码在访问未对齐的内存时崩溃
- 在 capnp FlatArrayMessageReader 的对齐内存缓冲区中接收 zmq 消息
- 是否值得对齐变量?
- 初始化派生结构的基部分/意外打包派生结构字段以对齐基结构的间隙
- 对齐和对齐的实际用例C++关键字
- 如何减少代码的运行时间以对齐文本?
- 指向包含对齐 C 结构C++类的 C 指针的对齐问题
- Linux C++ 中的页面对齐内存分配
- C++ 类层次结构中的"对齐"是什么意思?
- 运行时错误:引用绑定到类型"int"的未对齐地址0xbebebebebebebec6,这需要 4 个字节对齐 (stl_vector.h)
- 具有调整对齐方式的类型定义
- 随机存取与SSE对齐的存储器