容易.快速比较两个 800k 每个元素数组的方法
Easy. Fast way to compare two 800k each elements arrays
使用mt19937_64生成器,我生成了 800 000 个整数,范围从 0 到 30 000 000。每个数字都必须是唯一的,所以我应该将其与每个已经生成的整数进行比较:
unsigned array[800 000];
for (int i = 0; i < 800 000; i++)
{
generate_again:
buffer = uid(rng); // generate in buffer
for (int j = 0; j < i; j++) // *comparing to every already generated integer
{
if (buffer == array[j])
goto generate_again; // if the same integer exist, go togenerate_again flag
}
array[i] = pepper; // is integer is unique - it goes to array.
}
此比较大约需要 16 分钟。如何才能更快地完成?谢谢。
您可以先按顺序生成唯一编号,然后将它们洗牌以获得最终结果(如果需要的话)。
如果已生成值,则使用 std::bitset
将是一种有效的存储方法。或者,如果你在编译时实际上不知道值的数量,你可以使用std::vector<bool>
,这是一种使用位运算的专用化,也会为你节省一些空间。
#include <iostream>
#include <vector>
#include <algorithm>
#include <random>
#include <bitset>
int main()
{
static constexpr int max_value = 30'000'000;
static constexpr int n_values = 800'000;
std::bitset<max_value + 1> have_num;
int cur_n_values = 0;
std::mt19937_64 mt{std::random_device{}()};
std::uniform_int_distribution<int> distribution{0, max_value};
while (cur_n_values != n_values) {
auto newVal = distribution(mt);
if (!have_num[newVal]) {
have_num[newVal] = true;
++cur_n_values;
}
}
std::vector<int> nums;
nums.reserve(n_values);
for (int i = 0; i < have_num.size(); ++i) {
if (have_num[i]) {
nums.push_back(i);
}
}
std::shuffle(nums.begin(), nums.end(), mt);
for (auto i : nums) {
std::cout << i << " ";
}
}
住
首先,通过循环数组来消除检查。如果您只有 30E6 变体,如果您有足够的空间,您可以尝试将它们放在一个布尔标志数组中。这将花费大约30Mb。内存的另一种优化可能是将标志打包到位掩码。这将花费8倍。它将提高速度。因此,拥有 30Mb/8 (~4Mb) 大小的标志数组,您可以在恒定时间内检查是否存在已生成的数字。这种手段大大提高了速度。但还有另一个问题:拥有许多代人,您将陷入反复的碰撞中。
如果您不需要生成数组,请检查唯一性并删除元素 - 仅存储唯一编号。
尝试使用 hashed_unique
boost::multiindex。如果要保持秩序,请使用 ordered_unique
.
另请参阅:此
相关文章:
- Mongodb c++驱动程序:如何查询元素的数组
- 将数组作为参数传递给函数安全吗?作为第三方职能部门,可以探索他们想要的之外的其他元素
- 使用strcpy将char数组的元素复制到另一个数组
- 使用不带参数的函数访问结构元素
- 给定n个元素的m个集合.在C++中找到出现在最大集合数中的元素
- C++如何通过用户输入删除列表元素
- lower_bound()返回最后一个元素
- 基于多个条件处理地图中的所有元素
- 调整大小后指向元素值的指针unordered_map有效?
- 使用std::transform将一个范围的元素添加到另一个范围中
- 使用函数"remove"删除重复元素
- 具有最大子序列大小的序列,每个元素都相同
- 如何将两个不同矢量的同一位置的两个元素组合在一起
- 如何将元素添加到数组的线程安全函数?
- 有没有办法将谓词中的元素偏移量传递给 std 算法?
- 我想访问std::unique_ptr中的一个特定元素
- 如何通过 getter 函数删除矢量的元素?
- 向量元素的引用地址与它所指向的向量元素的地址不同.为什么
- 从控制台中删除最后打印的元素
- 擦除while循环中迭代的元素