Ivy Bridge上使用SSE/AVX的最大SIMD整数乘法
Maximum SIMD integer multiplications on Ivy Bridge using SSE/AVX?
有人能告诉我如何通过SSE/AVX使用SIMD在Ivy Bridge CPU上同时计算32位无符号整数乘法的最大数量吗?
我知道AVX确实有256位寄存器用于乘法,但这是用于浮点的(AVX2引入了256位整数寄存器)。因此,我不太确定使用浮点寄存器进行整数乘法是否更好(如果可能的话)?
此外,我不确定这是否只取决于寄存器的数量,或者我是否需要查看CPU的端口。看起来端口0和端口5可以处理SSE整数ALU?
每个时钟可以进行一次pmulld
=4次乘法运算。
因此,我不太确定使用浮点寄存器进行整数乘法是否更好(如果可能的话)?
这样的事情是不可能的。当然,您可以在ymm
寄存器中放入8个整数,但随后就会陷入困境。你需要在AVX2中使用它们来做一些有用的事情。
如您所见:
- 长整型例程可以从SSE中获益吗
- 2个64位整数的SSE乘法
目前还没有改进长整数与SSE或AVX相乘的解决方案。
相关文章:
- 如何反转整数参数包
- enum是C++中的宏变量还是整数变量
- 努力将整数转换为链表。不知道我在这里做错了什么
- 整数不会重复超过随机数
- 在C++中手动调整数组大小
- 检查输入是否不是整数或数字
- C++使用整数的压缩数组初始化对象
- 在C++中,将大的无符号浮点数四舍五入为整数的最佳方法是什么
- 将"打开的CV图像"中的"颜色"转换为整数格式
- 通过套接字[TCP]传输数据 如何在C / C ++中打包多个整数并使用send() recv()传输数据
- 如何只允许用户输入正整数
- 如何在c++中从文本文件中逐行读取整数
- C++:如何循环通过向量中的整数元素
- 我可以信任表示整数的浮点或双精度来保持精度吗
- 序列化,没有库的整数,得到奇怪的结果
- 在一定长度后从数组中打印时缺少整数
- 如何将整数数组转换为 SIMD 矢量
- Ivy Bridge上使用SSE/AVX的最大SIMD整数乘法
- 将 4 个整数向右移动不同的值 SIMD
- SIMD:四个打包整数的反转符号