优化埃拉托色尼筛

Optimizing Sieve of Eratosthenes

本文关键字:埃拉托 优化      更新时间:2023-10-16

我目前正在尝试进一步优化我的筛子。我必须用埃拉托色尼的筛子计算两个数字之间的素数,我知道需要工作的两个数字是 2000000000000 和 2000000100000。由于运行时间过长,我当前的代码出现分段错误。任何优化帮助将不胜感激:

#include <iostream>
#include <cmath>
using namespace std;
double Sieve(long long a, long long b){
    //Create array of type bool
    bool *prime;
    prime = new bool[b];
    //Set all values in array to true
    for (long i = 0; i < b; i++){
        prime[i] = true;
    }

    long count = 0;
    //Runs through main Sieve algorithm
    for (long x = 2*2; x <= (b); x += 2 ){
        prime[x] = false;
    }
    for (long x = 3; x <= sqrt(b); x = 2*x ){
        if (prime[x] == true){
            for (long y = pow(x,2); y <= b; y += x){
                prime[y] = false;
            }
        }
    }
    //Loop to print out and count how many primes are present
    for (long x = a; x <= b; x++){
        if(prime[x] == true){
            count++;
        }
    }
    return count;
}
int main(){
    int a, b;
    cout << "Please enter two numbers separated by one space" << endl;
    cin >> a >> b;
    cout << Sieve(1,20) << endl;
    cout << Sieve(a,b) << endl;
}

您正在尝试分配太多内存,并且new可能失败并引发std::bad_alloc异常。如果您不注意,未捕获的异常可能类似于分段错误。

要解决此问题,您将需要两个数组 - 一个用于输出范围大小为 100001,另一个用于确定高达 sqrt(b) 的素数。

正如另一个答案所指出的,使用 std::vector<bool> 也会将你的内存需求减少 8。不足以消除需要两个数组,但仍然有很大帮助。有时人们会建议不要vector<bool>,因为它有一些奇怪之处,但为此目的它是完美的。

您可能内存不足。使用布尔数组可能会为每个条目分配 1 个字节,如果您允许使用 std::vectorstd::vector<bool>只使用一个位。

2000000000000

这对于数组来说太大了。而是使用位集。您可以以更快的方式生成更大的素数。在全局范围内声明位集,这样它可以容纳 10^7。但是,您可以使用分段筛子算法使其适用于 20000000000000。在这种情况下,sqrt(2000000000000) = 1414213.这就是为什么你必须生成 2 到 1414214 之间的所有质数。然后使用分段筛算法

#include <bits/stdc++.h>
#define bitset_range 1414214
typedef long long int lli;
typedef long int li;
using namespace std;
template <typename T>
void printer(T a) {
    cout << a << endl;
}
vector<li> stock_prime;
bitset<bitset_range + 1> numbers;
int main() {
    lli start, stop;
    //normal seieve
    numbers.set();
    numbers.reset(0);
    numbers.reset(1);
    for (li i = 2; i <= bitset_range; i++) {
        if (numbers.test(i)) {
            for (li j = i * i; j <= bitset_range; j+= i) {
                numbers.reset(j);
            }
            stock_prime.push_back(i);
        }
    }
    //for_each(stock_prime.begin(), stock_prime.end(), printer<int>);
    cout << "Size: " << stock_prime.size() << endl;
    //now use segmented seive algorithm here remember to use bitset rather than bool array

    return 0;
}