np.arange与C++iota的比较,iota更慢

Comparison of np.arange with C++ iota, iota is slower

本文关键字:iota 更慢 比较 arange C++iota np      更新时间:2023-10-16

我写了一小段代码来生成一个整数序列,并将其与np.arange()进行比较,我发现np.arange()更快。任何人都可以给我一些提示,如果有更快的C++实现?

这是代码:

#include <iostream>
#include <chrono>
#include <ctime>
#include <array>
#include <vector>
#include <numeric>
template <typename T>
std::vector<T> range(T start, T end) {
    size_t N = (int)floor(end - start) + 1;
    std::vector<T> vec(N);
    std::iota(vec.begin(), vec.end(), start);
    return vec;
}
int main() {
    auto start = std::chrono::system_clock::now();
    std::vector<int> x_range = range(0, 1024);
    auto end = std::chrono::system_clock::now();
    std::chrono::duration<double> elapsed_seconds = end - start;
    std::time_t end_time = std::chrono::system_clock::to_time_t(end);
    std::cout << "elapsed time: " << elapsed_seconds.count() << "sn";
}

Python 代码很简单:

%timeit x = np.arange(0, 1024)

蟒蛇时间:1.51e-6 sC++时间:1.6e-5 s

Python 比这里的C++实现快 10 倍。

平台:Win10,Visual Studio Community 2017,在O2和Ox优化模式下。两者或多或少得到相同的时间顺序 - 1.x e-5 s .

谢谢大家,虽然这是一个简单的问题,但我仍然学到了很多东西。

这是与问题中的代码不同的新代码,也许同情心会帮助一些新手更好地理解:

#include <iostream>
#include <chrono>
#include <ctime>
#include <array>
#include <vector>
#include <numeric>
#include <iostream>
template <typename T>
std::vector<T> range(T start, T end) {
    size_t N = (int)floor(end - start);
    std::vector<T> vec;
    vec.reserve(N);
    std::iota(vec.begin(), vec.end(), start);
    return vec;
}
int main() {
    auto start = std::chrono::system_clock::now();
    for (int i = 0; i < 100000000; ++i) {
        std::vector<int> x_range = range(0, 1000);
    }
    auto end = std::chrono::system_clock::now();
    std::chrono::duration<double> elapsed_seconds = end - start;
    std::time_t end_time = std::chrono::system_clock::to_time_t(end);
    std::cout << "elapsed time: " << elapsed_seconds.count() << "sn";
    system("pause");
}

现在C++实施时间:7.14136e-8 s。