如何使用此宏测试是否对齐内存
How to use this macro to test if memory is aligned?
我是Simd初学者,我已经阅读了有关该主题的这篇文章(因为我正在使用AVX2兼容的计算机(。
现在,我已经阅读了这个问题,以检查您的指针是否对齐。
我正在使用此玩具示例main.cpp
进行测试:
#include <iostream>
#include <immintrin.h>
#define is_aligned(POINTER, BYTE_COUNT)
(((uintptr_t)(const void *)(POINTER)) % (BYTE_COUNT) == 0)
int main()
{
float a[8];
for(int i=0; i<8; i++){
a[i]=i;
}
__m256 evens = _mm256_set_ps(2.0, 4.0, 6.0, 8.0, 10.0, 12.0, 14.0, 16.0);
std::cout<<is_aligned(a, 16)<<" "<<is_aligned(&evens, 16)<<std::endl;
std::cout<<is_aligned(a, 32)<<" "<<is_aligned(&evens, 32)<<std::endl;
}
并用icpc -std=c++11 -o main main.cpp
编译。
由此产生的打印是:
1 1
1 1
但是,如果我在4个打印之前添加3行:
for(int i=0; i<8; i++)
std::cout<<a[i]<<" ";
std::cout<<std::endl;
这是结果:
0 1 2 3 4 5 6 7
1 1
0 1
特别是我不明白最后一个0
。为什么它与上一次打印有所不同?我想念什么?
您的 is_aligned
(这是宏,而不是函数(确定对象是否已对齐特定边界。它不能确定对象类型的对齐要求。
编译器将保证浮子阵列,至少与浮点的对齐要求保持一致 - 通常为4。32不是4个因子,因此不能保证将数组对齐与32字节边界。但是,有许多内存地址被4和32分别可以排除,因此4字节边界处的存储地址可能也恰好在32个字节边界处。这是您的第一个测试中发生的情况,但是正如解释的那样,不能保证它会发生。在后一个测试中,您添加了一些本地变量,并且数组最终位于另一个内存位置。碰巧的是,另一个内存位置不在32个字节边界。
请求SIMD指令可能需要的更严格的对齐方式,您可以使用alignas
规格:
alignas(32) float a[8];
相关文章:
- 是否值得对齐变量?
- 对于堆上的页面对齐内存分配是否有任何优化或不同的 API?
- C++11:16 字节原子<>变量是否在 16 字节边界上自动对齐,从而允许CMPXCHG16B指令?
- gcc 是否在 2 条短裤的过度对齐结构的比较中错过了优化机会?
- size_t的大小和对齐方式是否与ptrdiff_t相同?
- 内存地址是否由于未对齐的内存地址而损坏?
- 对象地址是否保证是其类型对齐的倍数
- gcc 中的多个对齐属性是否可以用于保证缓存行分隔?
- 使用字节数组具有单字节对齐方式的结构是否安全
- 是否有符合标准的方法来确定非静态杆件的对齐方式?
- 如何使用此宏测试是否对齐内存
- 在以下情况下,是否可以分配未对齐的对象?
- 是否可以让 std::vector<char> 使用选定的内存对齐方式分配内存
- MMAP是否返回对齐的指针值
- 如何检查指针是否指向正确对齐的内存位置
- 是否可以强制对C中的指针参数进行内存对齐
- 在 C/C++ 中在特定地址边界上对齐内存是否仍能提高 x86 性能?
- 幻影类型是否与原始类型具有相同的对齐方式
- std::可选和提升::可选是否尊重托管对象的对齐限制?
- 在C++中检查结构是否对齐或包含间隙