使用 SIMD 的查找表
Look-Up Table using SIMD
我有一个大像素处理函数,我目前正在尝试使用内在函数进行优化。
作为SSE新手,我不确定如何处理涉及查找表的代码部分。
基本上,我正在尝试矢量化以下原版C++代码:
//outside loop
const float LUT_RATIO = 1000.0F;
//in loop
float v = ... //input value
v = myLookupTable[static_cast<int>(v * LUT_RATIO)];
我正在尝试什么:
//outside loop
const __m128 LUT_RATIO = _mm_set1_ps(1000.0F);
//in loop
__m128 v = _mm_set_ps(v1, v2, v3, v4); //input values
__m128i vI = _mm_cvtps_epi32(_mm_mul_ps(v, LUT_RATIO)); //multiply and convert to integers
v = ??? // how to get vI indices of myLookupTable?
编辑:Ildjarn提出了一个需要我澄清的观点。我并不是要实现查找表代码的加速,我只是想避免将寄存器存储回浮点数专门用于查找,因为这部分夹在理论上可以从 SSE 中受益的其他 2 个部分之间。
如果你能等到明年,那么英特尔的Haswell CPU将拥有AVX2,其中包括收集负载的说明。这使您能够在一个指令中执行例如 8 个并行 LUT 查找(例如 VGATHERDPS
)。除此之外,除非你的LUT非常小(例如16个元素),否则你就不走运了,在这种情况下,你可以使用PSHUFB
。
相关文章:
- 正在查找文档以获得PS4平台的C++中的设备信息
- 在C++中查找文件
- 模板元程序查找相似的连续类型名称
- 在UNIX系统中使用DIR查找文件的字节大小
- 查找最接近的大于当前数字的数字的索引
- 有没有一种方法可以创建一个带有哈希表的数据库,该哈希表具有恒定时间查找功能
- 查找后更改类变量
- 使用正则表达式regex_search在字符串中查找字符串
- 使用gcc从静态链接的文件中查找可选符号
- 在C++中查找范围的长度
- 算法问题:查找从堆栈中弹出的所有序列
- 在Windows中查找扬声器输出的当前音量级别
- 如何在C++中使用X509证书模在令牌中查找私钥
- 使用.find函数在c++中查找字符和另一个字符之间的大小
- 在 Windows 上,是否可以让 dll 在不使用 PATH 环境变量的情况下在另一个文件夹中查找依赖项?
- 在 for 循环中查找问题时遇到困难
- 如何在文件中查找字节序列
- 试图创建一个多线程程序来查找0-100000000之间的总素数
- 使用 SIMD 的查找表
- 查找x86 SIMD向量中最大元素的索引