检查 XMM 寄存器中是否有所有零
Check XMM register for all zeroes
有没有办法检查__m128i
变量中的所有位/字节/字等是否都是0?
在我的应用程序中,我必须检查包含在 __m128i
变量中的所有整数是否都是零。我是否必须提取它们并分别比较它们?
编辑:
我现在正在做的是:
int next = 0;
do{
//some code
next = idata.m128i_i32[0] + idata.m128i_i32[1] + idata.m128i_i32[2] + idata.m128i_i32[3];
}while(next > 0);
我需要的是检查idata
是否全为零而无需访问每个单独的元素,如果它们是......
根据哈罗德的评论,这是解决方案:
__m128i idata = _mm_setr_epi32(i,j,k,l);
do{
//some code
}while( !_mm_testz_si128(idata, idata) );
如果idata
中每个DW的所有低位均为0,这将退出循环...谢谢哈罗德!
_mm_testz_si128是SSE4.1,在某些CPU上不受支持(例如Intel Atom,AMD Phenom)
这是一个与SSE2兼容的变体
inline bool isAllZeros(__m128i xmm) {
return _mm_movemask_epi8(_mm_cmpeq_epi8(xmm, _mm_setzero_si128())) == 0xFFFF;
}
就像Paul R对我最初的帖子评论的那样:
"你不需要为PTEST
的第二个参数初始化一个虚拟参数,即你可以针对自身测试一个值,而不是_mm_testz_si128(idata, _mm_set1_epi32(0xFFFF))
。
ptest
用一条指令完成整个工作。
这很有帮助。
相关文章:
- 在提升multi_index容器中,是否定义了"default index"?
- 在C++STL中是否有Polyval(Matlab函数)等价物?
- 检查输入是否不是整数或数字
- 是否可以初始化不可复制类型的成员变量(或基类)
- 在C++中,是否可以基于给定的标识符创建基类的新实例,反之亦然
- 是否可以通过C++扩展强制多个python进程共享同一内存
- 此代码是否违反一个定义规则
- 是否需要删除包含对象的"pair"?
- 是否可以从int转换为enum类类型
- 无论条件是否为true,if总是在c++中执行
- 如何找到大小'x'数组是否完全填充,在C++?
- 检查值是否在集合p1和p2中,但不在p3中
- 是否可以在编译时初始化数组,以便在运行时不会花费时间?
- 检查 std::shared_ptr<> 的当前底层类型是否为 T
- 在c++中检查长方体是否尽可能快地重叠(无迭代)
- GL_SHADERSTORAGE_BUFFER位置是否与其他着色器位置冲突
- 子目录是否继承属性,例如add_definitions,include_directories和父Cmakelist.t
- 标准是否使用多余的大括号(例如 T{{{10}}})定义列表初始化?
- C/C++预处理器是否可以检测一些编译器选项
- 检查 XMM 寄存器中是否有所有零