常量时间更改数组的前 k 个元素(C++）

Constant time change first k elements of an array in C++?

本文关键字：元素 C++ 时间数组常量更新时间：2023-10-16

假设我有一个数组：

bool eleme[1000000] = {false};

在我的代码中的某个时刻，我将这个数组的第一个n元素中的一些更改为true。之后，我想确保数组的所有元素都false.所以我这样做：

for (int i =0; i < n; ++i)     
eleme[i] = false;

成本Θ(n).

有没有办法在恒定的时间内做到这一点？例如，类似make_false(eleme, n);

一般答案
如果你想修改内存中的N个元素，那最终将是一个O(N)操作，不管你是否可以用memset或std::fill这样的单个命令来表达它。

如果设计算法时尽可能多地缓存数组，则操作将大大加快。使用优化的内置命令(如memset)也有助于加快速度。

建议 1
但是，有一个用于恒定时间数组初始化的旧算法技巧，它也适用于您的情况(恒定时间数组重置)——但代价是大量额外的内存使用。

它如下：除了主数组A1之外，您分配了相同长度的第二个数组A2，以及一个大小为 N 的堆栈S。这些结构都不需要初始化(仅仅分配它们可以说是一个 O(1) 操作)。您还需要一个堆栈指针SP。

最初，堆栈指针为 0(指向堆栈的底部)。

每当你在A1中输入，比如A1[i]=j，你设置A2[i]=SP，S[SP]=i并递增SP。

如果要检查是否已设置某个条目A1[i]，请查找A2[i]。如果A2[i]<SP，即小于堆栈指针的当前值，则您知道相应的堆栈条目SP[A2[i]]之前一定是您设置的。如果该堆栈条目的值为i，则A1[i]是有效的条目。否则，它永远不会初始化。

现在，为了重置A1的所有条目，您只需将堆栈指针设置回 0。这是一个恒定时间操作。

我必须承认，我从来没有遇到过我发现这个技巧实际上有用的情况;通常memset虽然不是恒定时间，但已经足够快了。

Gonzalo Navarro最近发表了一篇笔记，其中他描述了一组进一步的技巧来压缩额外的数组，以便它们在保留O(1)时间限制的同时使用更少的空间。

建议 2
另一种可能性是仅在必要时以惰性方式重置值。这利用了这样一个事实，即在重置时，实际上只会使用前几个元素中的一些，如您所描述的。

这涉及在变量中维护尚未初始化的最左侧元素的索引(或在最近重置期间重置)，以及当要设置元素A[i]时，初始化(或重置)最左侧未初始化的元素和i之间的所有元素。

要访问索引i处的元素，请检查i是否小于最左边未初始化的元素，在这种情况下，您返回A[i];否则它尚未初始化(或重置)，因此返回初始化值(可能是 0)作为文字。

要重置数组，您只需将最左侧未初始化元素的索引设置回 0，这是一个常量时间操作。

当然，这意味着更改条目现在是一个 O(N) 操作，但是如果您通常只设置数组的前几个元素，它永远不会变得非常昂贵。另请注意，两次重置之间的所有操作的总成本仍然是 O(N)，因为每个元素重置的次数不超过一次。

另一个重要的优点是缓存友好性：每次设置元素时，需要初始化的元素范围可能很小，并且比一次重置所有元素时更有可能完全在缓存中。

在C++中，它可能看起来像这样：

template <typename T, std::size_t N, T init_val>
class FastResetArray
{
std::array<T,N> _data;                // the array
unsigned        _min_uninitialised;   // the left-most non-initialised element
public:
FastResetArray()
:_data(),_min_uninitialised(0)
{}
T at(const unsigned index) {
return (index < _min_uninitialised ? _data[index] : init_val);
}
void set(const unsigned index, const T val) {
if (index > _min_uninitialised)
std::fill_n(begin(_data) + _min_uninitialised,
index - _min_uninitialised,
init_val);
_data[index] = val;
_min_uninitialised = index + 1;
}
void reset() {
_min_uninitialised = 0;
}
};

(请注意，在构造函数中，我将_min_uninitialised(最左侧未初始化元素的索引)设置为 0。由于std::array的默认构造函数无论如何都会将整个数组初始化为零，因此如果init_val为零，我也可以设置为N。所以上面的实现无助于避免初始 O(N) 初始化——我们只在reset()中避免 O(N)。

有

没有办法在恒定的时间内做到这一点[并且不访问超过n元素]？

不。您必须设置n元素，这将采取n步骤，因此 O(n)。

您可以通过不手动编写循环来使其运行得更快。我想你会发现：

std::fill(eleme, eleme+n, false);

走得比

for (int i =0; i < n; ++i)     
eleme[i] = false;

即使它们具有相同的大O复杂性。

根据

http://en.wikipedia.org/wiki/Time_complexity#Constant_time

你的代码已经是恒定的时间

如果元素的数量是事先知道的并且没有改变

从宣言中似乎是正确的

布尔饿了连[1000000] = {假};

如果数组中的元素数为 n(不是常量)，则将该数组中的所有值初始化为 false 将始终是线性时间。但是，如果您考虑一下，如果此数组是某个更大算法的一部分，您通常可以找到一种不同的方法来在恒定时间内解决问题(我之所以做出这个假设，是因为如果您将数组中的所有元素初始化为"false"，那么您一定不关心当前存储在那里的数据，那么为什么要在这一点上对它做任何事情呢？