SIMD的常量浮动
Constant floats with SIMD
我一直在尝试使用微软的sse内部函数优化一些代码。优化代码时最大的问题之一是每当我想使用常量时就会发生LHS。似乎有一些关于生成某些常量的信息(这里和这里-第13.4节(,但它都是汇编(我宁愿避免(。
问题是,当我试图用intrinsic实现同样的东西时,msvc会抱怨不兼容的类型等。有人知道使用intrinsic有什么等效的技巧吗?
示例-生成{1.0,1.0,1.0,1.0}
//pcmpeqw xmm0,xmm0
__m128 t = _mm_cmpeq_epi16( t, t );
//pslld xmm0,25
_mm_slli_epi32(t, 25);
//psrld xmm0,2
return _mm_srli_epi32(t, 2);
这会生成一组关于不兼容类型(__m128与_m128i(的错误。我对这件事还很陌生,所以我很确定我错过了一些显而易见的东西。有人能帮忙吗?
tldr-如何使用ms内部函数生成用单精度常量浮点填充的__m128向量?
感谢阅读:(
尝试_mm_set_ps
、_mm_set_ps1
或_mm_set1_ps
。
只需使用_mm_castsi128_ps将__m128i强制转换为__m128。另外,第二行应该是
t = _mm_slli_epi32(t, 25)
相关文章:
- #定义c-预处理器常量..我做错了什么
- 用C++中的一个变量定义一个常量
- 什么时候在C++中返回常量引用是个好主意
- 代理对象的常量正确性
- 我想将一个对T类型的非常量左值引用绑定到一个T类型的临时值
- 通过多个头文件使用常量变量
- 在cuda线程之间共享大量常量数据
- 不能在初始值设定项列表中将非常量表达式从类型 'int' 缩小到'unsigned long long'
- 有没有什么方法可以使用一个函数中定义的常量变量,也可以由c++中同一程序中的其他函数使用
- 是默认情况下分配给char数组常量的值
- 私有类型的静态常量成员
- 类似枚举的计算常量
- 递归模板化函数不能分配给具有常量限定类型"const tt &"的变量"state"
- 为什么我可以通过引用修改常量返回
- 如何创建长度由常量参数指定的数组
- 当一个值是非常量但用常量表达式初始化时使用constexpr
- 返回常量对象引用 (getter) 和仅返回字符串有什么区别?
- 隐式常量/非常量运算符布尔
- 非常量变量只读位置的赋值
- SIMD的常量浮动