SIMD的常量浮动

Constant floats with SIMD

本文关键字：常量 SIMD 更新时间：2023-10-16

我一直在尝试使用微软的sse内部函数优化一些代码。优化代码时最大的问题之一是每当我想使用常量时就会发生LHS。似乎有一些关于生成某些常量的信息(这里和这里-第13.4节(，但它都是汇编(我宁愿避免(。

问题是，当我试图用intrinsic实现同样的东西时，msvc会抱怨不兼容的类型等。有人知道使用intrinsic有什么等效的技巧吗？

示例-生成｛1.0,1.0,1.0,1.0｝

//pcmpeqw xmm0,xmm0 
__m128 t = _mm_cmpeq_epi16( t, t );
//pslld xmm0,25 
_mm_slli_epi32(t, 25);
//psrld xmm0,2
return _mm_srli_epi32(t, 2);

这会生成一组关于不兼容类型(__m128与_m128i(的错误。我对这件事还很陌生，所以我很确定我错过了一些显而易见的东西。有人能帮忙吗？

tldr-如何使用ms内部函数生成用单精度常量浮点填充的__m128向量？

感谢阅读：(

尝试_mm_set_ps、_mm_set_ps1或_mm_set1_ps。

只需使用_mm_castsi128_ps将__m128i强制转换为__m128。另外，第二行应该是

t = _mm_slli_epi32(t, 25)