免费/开源的C/ c++矢量数学函数库

Free/open source C/C++ library of vectorized math functions?

本文关键字:函数 c++ 开源 免费      更新时间:2023-10-16

我正在寻找一个免费/开源的C/c++(两者都是可以接受的)常见数学函数(如ln或exp)的矢量化版本库,类似于英特尔的Linux矢量数学库。我想要一个库,它可以为我提供这样的能力:

double a[ARRAY_SIZE], b[ARRAY_SIZE];
for (int i = 0; i < ARRAY_SIZE; ++i) {
    a[i] = ln(b[i]);
}

:

double a[ARRAY_SIZE], b[ARRAY_SIZE];
vectorized_ln(a, b, ARRAY_SIZE);

,并让它使用英特尔和AMD架构上可用的SIMD指令的全部功能。开发环境由运行在Linux上的GNU工具组成。英特尔的数学内核库包含一个叫做矢量数学库的东西,它宣传"计算密集型核心数学函数的矢量实现",包括基本函数,三角函数等,所以我正在寻找类似的东西,但免费的

我开发了一个开源(BSD)耶!数学库,它提供了一些向量初等函数(log, exp, sin, cos, tan),并且在性能上与MKL竞争。这是一个使用向量对数函数的例子,来自Yeppp!

Felix von Leitner写了一篇关于各种c编译器产生的实际汇编的详细介绍。

他关于简单运算向量化的笔记从幻灯片28开始。

  • 用于GCC 4.4和memset类型循环

    • gcc -O2生成一个循环,每次写一个字节
    • gcc -O3矢量化,写入32位(x86)或128位(带SSE或x64的x86)时间
    • 令人印象深刻:向量化代码首先检查并修复对齐

幻灯片41题为"智取编译器- simd-shift"并得出结论"gcc在所有平台上都比视频编解码器程序员更聪明"

幻灯片42是gcc自动向量化原始代码的另一个例子。

所有这些加在一起,首先检查您正在使用的编译器是否会为您简单地处理它。

您可能会发现AMD的LibM库(但它适用于x64)与SSEPlus结合使用。索尼的Vector Math库也有一个开源的x86版本

除了自己编写这些函数(这不是那么复杂)或使用Ignacio的链接…

可能是英特尔的SPMD编译器适合你:http://ispc.github.com/

这是一个c风格的编译器,你可以在其中以串行/标量的方式编写东西,它会将它们与特定的目标体系结构并行化。生成的函数很容易从常规的CPP项目中调用。

我引用:"ispc编译了一个基于c语言的SPMD编程语言,在cpu的SIMD单元上运行;它通常在具有4宽SSE单元的cpu上提供3倍或更多的加速,而没有编写内在代码的任何困难。"

我还没有自己尝试,但它看起来很好通用的calc并行化