为什么对于一个简单的斐波那契,Haskell比C++快

Why is Haskell faster than C++ for a simple fibonacci

本文关键字:Haskell C++ 于一个 简单 为什么      更新时间:2023-10-16

通常Haskell标签中的问题是为什么Haskell与X相比如此慢ByteStringTextString。不严格的评估或缺少类型签名。

但在这里,我有一个简单的斐波那契计算器,它的性能比C++高出约 2 倍。这可能是缺乏 c++ 知识 - 但我从一个朋友那里得到了代码,他曾经用这种语言编写了不止一点代码。

★ g++ -O3 fib2.cc -o cc-fib -lgmpxx -lgmp 
★ time ./cc-fib > /dev/null
./cc-fib > /dev/null  8,23s user 0,00s system 100% cpu 8,234 total
★ ghc -O3 --make -o hs-fib fib1.hs
[1 of 1] Compiling Main             ( fib1.hs, fib1.o )
Linking hs-fib ...
★ time ./hs-fib > /dev/null
./hs-fib > /dev/null  4,36s user 0,03s system 99% cpu 4,403 total

在 haskell 文件中,我只使用了严格的zipWith'和严格的add'函数(这是使用扩展BangPatterns的地方 - 它只是告诉编译器在执行添加之前评估参数x/y)以及添加显式类型签名。

两个版本都使用 bigint,所以这似乎与我相当,而且 c++ 代码不使用具有指数运行时的"标准"递归,而是一个应该表现良好的记忆版本(或者至少我是这么认为的 - 如果我错了,请纠正我)。

使用的设置是:

  • Linux 64位(Mint)在一台相当新的笔记本电脑上
  • GHC-7.10.3
  • g++ 4.8.4 + libgmp-dev 2:5.1.3+dfsg-1ubuntu1

fib.cc

#include <iostream>
#include <gmpxx.h>
mpz_class fib(int n) {
mpz_class p1 = 0;
mpz_class p2 = 1;
mpz_class result;
if ( n == 0 ) return 0;
if ( n == 1 ) return 1;
for(int i = 2; i <= n ; i ++ ) {
result = p1 + p2;
p1 = p2;
p2 = result;
}
return result;
}
int main () {
std::cout<<fib(1000000)<<std::endl;
return 0;
}

fib.hs

{-# LANGUAGE BangPatterns -#}
module Main where
fib1 :: [Integer]
fib1 = 0:1:zipWith' (add') fib1 (tail fib1)
where zipWith' :: (Integer -> Integer -> Integer) -> [Integer] -> [Integer] -> [Integer]
zipWith' _ [] _ = []
zipWith' _ _ [] = []
zipWith' f (x:xs) (y:ys) = let z = f x y in z:zipWith' f xs ys
add' :: Integer -> Integer -> Integer
add' !x !y = let z = x + y in z `seq` z
fib4 :: [Integer]
fib4 = 0:1:zipWith (+) fib4 (tail fib4)
main :: IO ()
main = print $ fib1 !! 1000000

鉴于您正在打印的数字非常庞大,iostreams 的默认性能不佳可能与此有关。确实,在我的系统上,把

std::ios_base::sync_with_stdio(false);

在开始时,main时间略有改善(从 20 秒增加到 18 秒)。

此外,复制如此庞大的数字势必会减慢速度。相反,如果您在每个步骤中同时更新p1p2,则无需复制它们。您也只需要循环中一半的步骤。喜欢这个:

mpz_class fib(int n) {
mpz_class p1 = 0;
mpz_class p2 = 1;
for(int i = 1; i <= n/2 ; i ++ ) {
p1 += p2;
p2 += p1;
}
return (n % 2) ? p2 : p1;
}

这大大加快了我系统上的速度(从 18 秒到 8 秒)。

当然,要真正了解使用GMP可以完成的速度,您应该使用执行此操作的功能:

mpz_class fib(int n) {
mpz_class result;
mpz_fib_ui(result.get_mpz_t(), n);
return result;
}

这在我的机器上实际上是即时的(是的,它打印的 208,989 位数字与其他两种方法相同)。