C++似乎比两个Python Ruby for Project Euler都慢得多
C++ appears to be significantly slower than both Python Ruby for Project Euler
对于Project Euler的以下问题,我有三个解决方案。
如果p是长度为整数的直角三角形的周长边,{a,b,c},p=120正好有三个解。
{20,48,52},{24,45,51},{30,40,50}
对于p≤1000的哪个值,解决方案的数量最大化了吗?
下面提供了我针对每种语言的三种解决方案。
C++:
boost::chrono::steady_clock::time_point start_time = boost::chrono::steady_clock::now();
map<int, int> square_lookup;
for(int i=0; i<= 1500; i++) {
square_lookup[i*i] = i ;
}
auto end_time = boost::chrono::steady_clock::now();
Python 2:
start = time.time()
res = range(1, 1501)
squares = {}
#square_lookups = dict(zip([x*x for x in res], res))
square_lookups = {}
for x in range(1, 1501):
square_lookups[x*x] = x
end = time.time()
Ruby:
start_time = Time.now
square_lookup = {}
(1 .. 1500).map {|x| x*x}.each_with_index do |square, root|
square_lookup[square] = root+1
end
end_time = Time.now
四核i5:的计时
> lookup gen time: 0.00141787528992
> Python Result: 840 Time:
> 0.282248973846
>
> Lookup gen time 4640960 nanoseconds
> C++: Result: 840 : Time: 695301578 nanoseconds
>
>
> Lookup gen time 0.000729416
> Ruby: Result: 840 Time: 0.149393345
查找生成时间是构建一个包含1500个元素的哈希表所需的时间,其中键是一个完美的正方形,值是它们各自的根。
即使在这方面,C++仍然比Python和Ruby慢。我意识到,对于每种语言,我可能拥有最有效的整体解决方案,但使用相同类型的操作仍然显示C++非常慢。
重要编辑我将map
更改为将unordered_map
用于C++解决方案,但速度仍然较慢!
修改的C++文件:http://pastebin.com/2YyB6Rfm
lookup gen time: 0.00134301185608
Python Result: 840 Time: 0.280808925629
Lookup gen time 2021697 nanoseconds
C++: Result: 840 : Time: 392731891 nanoseconds
Lookup gen time 0.000729313
Ruby: Result: 840 Time: 0.148183345
您的代码还有另一个严重的问题——比map
和unordered_map
严重得多(至少是IMO)。
特别是,你在哪里做:
int result = square_lookup[(i*i) + (j*j)];
if(result) {
int perimeter = i + j + result;
if(perimeter <= 1000) {
occurences[perimeter] += 1;
}
}
此代码不仅仅在现有映射中查找值i*i+j*j
。相反,如果映射中不存在键,它会在映射中插入一个节点,其中i*i+j*j
为键,0
(或者,更具体地说,映射的value_type
的值初始化对象,在本例中为int
)为映射。
在映射中为所有那些你不关心的值插入节点是非常缓慢的。您在这里要做的实际上只是检查该值是否已经在映射中。为此,您可以使用以下代码:
auto result = square_lookup.find(i*i + j*j);
if (result!=square_lookup.end()) {
int perimeter = i + j + result->second;
if (perimeter <= 1000)
++occurences[perimeter];
}
这使用find
来查找键是否在映射中。然后,如果(并且仅当)键在映射中,它会查找当前与该键关联的值。
这在速度上有了实质性的提高——用VC++或g++达到约20-30毫秒。
随着这种变化,map
和unordered_map
之间的差异也缩小了。使用map
的代码仍然可以在20-30毫秒内运行。使用unordered_map
的代码可能平均只快一点点,但我的系统时钟只有10ms的粒度,所以我真的必须用更多的数据来测试。
作为参考,以下是我运行时的代码(注意,我对代码进行了一些其他的一般清理,但其他任何事情都不会对速度产生任何重大影响):
#include <iostream>
#include <unordered_map>
#include <chrono>
#include <iterator>
#include <algorithm>
#include <utility>
#include <map>
using namespace std;
int main() {
auto start_time = chrono::steady_clock::now();
map<int, int> square_lookup;
int ctr = 0;
generate_n(inserter(square_lookup, square_lookup.end()),
1500,
[&]() { ++ctr; return make_pair(ctr*ctr, ctr); });
auto end_time = chrono::steady_clock::now();
cout << "Lookup gen time "
<< chrono::duration_cast<chrono::milliseconds>(end_time - start_time).count() << "n";
map<int, int> occurences;
typedef std::pair<int, int> const &map_t;
for (int i = 0; i <= 1000; i++) {
for (int j = i; j <= 1000; j++) {
auto result = square_lookup.find(i*i + j*j);
if (result != square_lookup.end()) {
int perimeter = i + j + result->second;
if (perimeter <= 1000)
++occurences[perimeter];
}
}
}
auto it = std::max_element(occurences.begin(), occurences.end(),
[](map_t a, map_t b) { return a.second < b.second; });
end_time = chrono::steady_clock::now();
cout << "C++: Result: " << it->first << " : Time: "
<< chrono::duration_cast<chrono::milliseconds>(end_time - start_time).count() << "n";
}
摘要:在C++中,map
上的[]
运算符将插入一个项目(如果它还不存在)。这可能很方便,但并不总是你想要的。如果你只想在值已经存在的情况下检索它,那么就不是适合该作业的工具——.find
可以更快。
一旦你纠正了这个问题,map
和unordered_map
之间的差异(至少大部分)就会消失。
您声称正在计时
查找生成时间是构建一个包含1500个元素的哈希表所需的时间,其中键是一个完美的平方,值是它们各自的根。
Python和Ruby解决方案也是如此,但在C++示例中,您正在构建一个std::map<int, int>
。这不是一个哈希表,而是一个红黑树。插入和查找是O(lg N)
,而不是O(1)
。
为了得到一个公平的比较,您需要使用std::unordered_map<int, int>
作为您的类型。那是一张真正的哈希表。
- "error: no matching function for call to"构造函数错误
- 表示"accepting anything for this template argument" C++概念的通配符
- 如何在C++中从两个单独的for循环中添加两个数组
- Project Euler问题4的错误解决方案
- 在Linux for Windows上编译C++代码时出错
- 调用专用模板时出错"no matching function for call to [...]"
- 为什么我的for循环不能正确获取argv
- 为什么我不能在 FOR LOOP 中使用 i/10,C++?
- Arduino:for/while/if在void setup()或void loop()之前?——错误:之前需要不合格
- 在基于范围的for循环中使用结构化绑定声明
- 通过for循环使用用户输入填充列表
- 使用for循环检查数组中的重复项
- 在for循环中使用auto vs decltype(vec.size())来处理字符串的向量
- 为什么 const std::p air<K,V>& 在 std::map 上基于范围的 for 循环不起作用?
- 正在使用for循环创建QScatterSerie
- Python中的for循环与C++有何不同
- CMake project for Emscripten
- C++似乎比两个Python Ruby for Project Euler都慢得多
- "There's no Qt version assigned to this project for platform Win32" - Qt的Visual Studio插件
- Visual Studio 2015 Build Time for Small Project