C++和Haskell代码在不同机器上的执行时间不同

C++ and Haskell codes differs in execution time on different machines

本文关键字：执行时间机器代码 C++ Haskell 更新时间：2023-10-16

我想问您是什么导致了这种差异。如果我编译以下程序并运行相同的二进制程序——在某些平台上，C++代码产生的二进制程序比Haskell的要快得多，而在另一些平台上，情况正好相反。

此外，最终二进制文件的性能也有很大差异，这取决于它们是在哪个平台上构建的。（每个平台都使用相同的标志和相同版本的LVM和clang）

代码经过了优化，应该可以使用simmilar性能-请参阅：Haskell可以像Clang/GCC那样优化函数调用吗？。

我想问你，这怎么可能

C++代码：

#include <cstdio>
#include <cstdlib>
int b(const int x){
    return x+5;
}
int c(const int x){
    return b(x)+1;
}
int d(const int x){
    return b(x)-1;
}
int a(const int x){
    return c(x) + d(x);
}
int main(int argc, char* argv[]){
    printf("Starting...n");
    long int iternum = atol(argv[1]);
    long long int out = 0;
    for(long int i=1; i<=iternum;i++){
        out += a(iternum-i);
    }
    printf("%lldn",out);
    printf("Done.n");
}

用clang++ -O3 main.cpp 编译

haskell代码：

module Main where
import qualified Data.Vector as V
import System.Environment
b :: Int -> Int
b x = x + 5
c x = b x + 1
d x = b x - 1
a x = c x + d x
main = do
   putStrLn "Starting..."
   args <- getArgs
   let iternum = read (head args) :: Int in do
      putStrLn $ show $ V.foldl' (+) 0 $ V.map (i -> a (iternum-i))
         $ V.enumFromTo 1 iternum
      putStrLn "Done."

用ghc -O3 --make -fforce-recomp -fllvm ghc-test.hs 编译

结果（在不同平台上测试相同的二进制文件）

// binaries compiled on Ubuntu:
Ubuntu x64 @ Intel i7-3610QM CPU @ 2.30GHz : C++:0.775s, GHC:1.01s
Gentoo x64 @ Intel i7-Q720   CPU @ 1.6GHz  : C++:3.6s,   GHC:2.1s
// binaries compiled on Gentoo:
Ubuntu x64 @ Intel i7-3610QM CPU @ 2.30GHz : C++:0.782s, GHC:1.01s
Gentoo x64 @ Intel i7-Q720   CPU @ 1.6GHz  : C++:2.3s,   GHC:1.3s

如果我编译以下程序并运行相同的二进制程序——在某些平台上，C++代码产生的二进制程序比Haskell的要快得多，而在另一些平台上，情况正好相反。

此外，最终二进制文件的性能也有很大差异，这取决于它们是在哪个平台上构建的。（每个平台都使用相同的标志和相同版本的LVM和clang）

你正在看到真实计算机令人讨厌的操作细节的影响：

链接器优化
不同版本的动态加载库
给定微体系结构的汇编代码生成质量
访问专用指令
缓存大小
操作系统调度程序、分配器
内存延迟

这两个平台之间有大量的代码和硬件不同，这意味着你最终会衡量不同的东西。

没有理由期望性能是相同的，甚至是相同的比例。对于微型基准测试，在移动平台时翻转相对顺序并不罕见。