确定非零最小值的最快方法

Fastest way to determine the non-zero minimum

本文关键字：方法最小值更新时间：2023-10-16

有一个由4个整数组成的数组，如何以最快的方式确定它的非零最小值？

除非在元素添加到数组时保持最小值，或者按排序顺序保持数组，否则我看不到其他解决方案，只能迭代每个成员来确定最小值。

没有"快速"的方式来测试每个成员。

一般来说，我建议不要优化某个东西，除非它真的很慢。程序的旧规则将90%的时间花在10%的代码中，这通常是正确的。程序员优化代码的可能性为99.99%，而不是10%。

评测您的代码-评测代码-评测您的编码

这个问题有一个并行的解决方案，但可能不值得付出努力。

首先，我们定义了一个在数组a:上的操作xchg(m, n)

xchg(m, n) => ((a[m] > a[n] && a[n] != 0) || a[m] == 0) ? swap(a[m],a[n])

如果两个元素"m"answers"n"都包含非零值，则此操作将按升序对它们进行排序；如果"m"元素中的值为零，则进行交换。

接下来，我们执行一组五个这样的操作，如下所示：

xchg(0,2) xchg(1,3)
xchg(0,1) xchg(2,3)
xchg(1,2)

成对的xchg操作可以并行执行，与严格的顺序执行相比，时间成本降低了40%。完成后，数组中的任何非零元素都将按升序排序。最小值元素将位于[0]中。如果该值为零，则数组中没有非零值。

该解决方案利用了排序网络（http://en.wikipedia.org/wiki/Sorting_network)，但对4个元素的顺序扫描也使用不超过三次的比较操作，并且至关重要的是，平均需要一半的存储写入：

顺序扫描

int v = a[0]
for (n = 1; n < 4; n++) {
   if ((a[n] < v && a[n] != 0 ) || v == 0) v = a[n]
}

取决于输入。如果数组没有排序，那么您将不得不遍历整个数组。如果数组已经排序，那么您只需要循环，直到找到不为零的东西——它要短得多。

如果我们正在考虑微观优化，那么在现代无序处理器上计算min(min(a,b),min(c,d))而不是min(min(min(a,b),c),d)可能会更快，因为顺序依赖性较小：在前者中，如果有足够的执行单元可用，处理器可以并行独立计算min(a,b)和min(c,d)。这是假设处理器具有条件移动指令，因此计算min不需要分支。

编码它的最快方法是std::min({a,b,c,d})。

更严重的一点是：如果你的应用程序遇到了一些瓶颈，比如取很多值中的最小值，一个更好的解决方案可能是找到一种方法，将最小值查找任务拆分为多个部分，并发送到GPU（或多个线程），然后GPU可以同时操作多个最小值查找计算。

并行性可能比试图在程序集中编写最小函数更有帮助。