Dijkstra 最短路径算法性能 std::p riority_queue VS std::set.

Dijkstra shortest path algorith performance of std::priority_queue Vs std::set

本文关键字：std queue VS set riority 算法性能 Dijkstra 最短路径更新时间：2023-10-16

我想了解这些容器在时间复杂度方面的主要区别。我已经尝试了 3 种 Dijkstra 算法的实现，如下所述：

1-使用简单数组作为队列

2- 带 STL priority_queue

3- 带 STL 设置

我测试过的图非常大，它包含超过 150000 个顶点，定向且边缘的所有权重都是正数。

我得到的结果如下：

1 - 使用数组，算法非常慢 ->这是预期的

2 - 使用 STL priority_queue算法的运行速度比数组快得多 - 这也是预期的>

3 - 使用 STL 设置算法运行速度非常快，我说的是比priority_queue快 100 倍的夫妇 ->我没想到会看到如此巨大的性能......

知道 std：:p riority_queue 和 std：：set 是存储元素的数据容器，并且两者具有基本相同的插入复杂度 O(log n)，我不明白它们之间的这种巨大的性能差异。你对此有什么解释吗？

感谢您的帮助，

编辑：这是我实现的摘要：

使用 std：：set：

unsigned int Graphe::dijkstra(size_t p_source, size_t p_destination) const {
....

set<pair<int, size_t>> set_vertices;

vector<unsigned int> distance(listAdj.size(),
numeric_limits<unsigned int>::max());

vector < size_t
> predecessor(listAdj.size(),
numeric_limits < size_t > ::max());

distance[p_source] = 0;
set_vertices.insert( { 0, p_source });

while (!set_vertices.empty()) {
unsigned int u = set_vertices.begin()->second;

if (u == p_destination) {
break;
}
set_vertices.erase( { distance[u],
u });

for (auto itr = listAdj[u].begin();
itr != listAdj[u].end(); ++itr) {

int v = itr->destination;
int weigth = itr->weigth;

if (distance[v]
> distance[u] + weigth) {

if (distance[v]
!= numeric_limits<unsigned int>::max()) {
set_vertices.erase(
set_vertices.find(
make_pair(distance[v],
v)));
}
distance[v] = distance[u] + weigth;
set_vertices.insert( { distance[v],
v });
predecessor[v] = u;
}
}
}
....
return distance[p_destination];}

并带有priority_queue：

unsigned int Graphe::dijkstra(size_t p_source, size_t p_destination) const {
...
typedef pair<size_t, int> newpair;
priority_queue<newpair, vector<newpair>, greater<newpair> > PQ;
vector<unsigned int> distance(listAdj.size(),
numeric_limits<unsigned int>::max());

vector < size_t
> predecessor(listAdj.size(),
numeric_limits < size_t > ::max());

distance[p_source] = 0;
PQ.push(make_pair(p_source, 0));
while (!PQ.empty()) {

unsigned int u = PQ.top().first;

if (u == p_destination) {
break;
}
PQ.pop();

for (auto itr = listAdj[u].begin();
itr != listAdj[u].end(); ++itr) {

int v = itr->destination;
int weigth = itr->weigth;

if (distance[v]
> distance[u] + weigth) {
distance[v] = distance[u] + weigth;
PQ.push(
make_pair(v, distance[v]));
predecessor[v] = u;
}
}
}
...
return distance[p_destination];}

跳过

您在优先级队列上加倍工作非常糟糕。

您正在重复插入队列，因为您无法修改或删除。这是正常和必要的，因为你不能。

但是，当这些旧值从队列中出来时，您需要"跳过while循环的迭代"。

像这样：

if (PQ.top().second != distance[PQ.top().first]) continue;  // It's stale! SKIP!!

std::priority_queue的底层数据结构是一个最大堆，std::set它的自平衡二叉搜索 - 基本上是一棵红黑树C++。因此，它们都确保了插入，删除和更新操作O(logn)时间复杂性。

但是，正如我所提到的，std::set的平衡二叉搜索树会自动平衡以保持其节点数的高度对数，从而确保对数查询的复杂性，无论插入顺序或任何操作后。std::priority_queue不是自平衡的，根据广告顺序的不同，可能非常平坦。虽然自平衡有自己的成本，所以在删除顶部后堆积，但我认为这就是性能提升的原因。

希望对您有所帮助！