免费/开源的C/ c++矢量数学函数库
Free/open source C/C++ library of vectorized math functions?
我正在寻找一个免费/开源的C/c++(两者都是可以接受的)常见数学函数(如ln或exp)的矢量化版本库,类似于英特尔的Linux矢量数学库。我想要一个库,它可以为我提供这样的能力:
double a[ARRAY_SIZE], b[ARRAY_SIZE];
for (int i = 0; i < ARRAY_SIZE; ++i) {
a[i] = ln(b[i]);
}
:
double a[ARRAY_SIZE], b[ARRAY_SIZE];
vectorized_ln(a, b, ARRAY_SIZE);
,并让它使用英特尔和AMD架构上可用的SIMD指令的全部功能。开发环境由运行在Linux上的GNU工具组成。英特尔的数学内核库包含一个叫做矢量数学库的东西,它宣传"计算密集型核心数学函数的矢量实现",包括基本函数,三角函数等,所以我正在寻找类似的东西,但免费的
我开发了一个开源(BSD)耶!数学库,它提供了一些向量初等函数(log, exp, sin, cos, tan),并且在性能上与MKL竞争。这是一个使用向量对数函数的例子,来自Yeppp!
Felix von Leitner写了一篇关于各种c编译器产生的实际汇编的详细介绍。
他关于简单运算向量化的笔记从幻灯片28开始。
-
用于GCC 4.4和
memset
类型循环- gcc -O2生成一个循环,每次写一个字节
- gcc -O3矢量化,写入32位(x86)或128位(带SSE或x64的x86)时间
- 令人印象深刻:向量化代码首先检查并修复对齐
幻灯片41题为"智取编译器- simd-shift"并得出结论"gcc在所有平台上都比视频编解码器程序员更聪明"
幻灯片42是gcc自动向量化原始代码的另一个例子。
所有这些加在一起,首先检查您正在使用的编译器是否会为您简单地处理它。
您可能会发现AMD的LibM库(但它适用于x64)与SSEPlus结合使用。索尼的Vector Math库也有一个开源的x86版本
除了自己编写这些函数(这不是那么复杂)或使用Ignacio的链接…
可能是英特尔的SPMD编译器适合你:http://ispc.github.com/
这是一个c风格的编译器,你可以在其中以串行/标量的方式编写东西,它会将它们与特定的目标体系结构并行化。生成的函数很容易从常规的CPP项目中调用。
我引用:"ispc编译了一个基于c语言的SPMD编程语言,在cpu的SIMD单元上运行;它通常在具有4宽SSE单元的cpu上提供3倍或更多的加速,而没有编写内在代码的任何困难。"
我还没有自己尝试,但它看起来很好通用的calc并行化
- "error: no matching function for call to"构造函数错误
- 什么时候调用组成单元对象的析构函数
- 继承函数的重载解析
- 为什么随机数生成器不在void函数中随机化数字,而在main函数中随机化
- C++模板来检查友元函数的存在
- 递归函数计算序列中的平方和(并输出过程)
- 对RValue对象调用的LValue ref限定成员函数
- C++17复制构造函数,在std::unordereded_map上进行深度复制
- 将数组作为参数传递给函数安全吗?作为第三方职能部门,可以探索他们想要的之外的其他元素
- 在C++STL中是否有Polyval(Matlab函数)等价物?
- 为什么使用 "this" 指针调用派生成员函数?
- 将对象数组的引用传递给函数
- 函数调用中参数的顺序重要吗
- 函数向量_指针有不同的原型,我可以构建一个吗
- 使用不带参数的函数访问结构元素
- 代码在main()中运行,但在函数中出现错误
- 内置函数可查看CPP中的成员变量
- 如何获取std::result_of函数的返回类型
- 如何在c++中为模板函数实例创建快捷方式
- 如果C++类在类方法中具有动态分配,但没有构造函数/析构函数或任何非静态成员,那么它仍然是POD类型吗