Dijkstra 最短路径算法性能 std::p riority_queue VS std::set.

Dijkstra shortest path algorith performance of std::priority_queue Vs std::set

本文关键字:std queue VS set riority 算法 性能 Dijkstra 最短路径      更新时间:2023-10-16

我想了解这些容器在时间复杂度方面的主要区别。 我已经尝试了 3 种 Dijkstra 算法的实现,如下所述:

1-使用简单数组作为队列

2- 带 STL priority_queue

3- 带 STL 设置

我测试过的图非常大,它包含超过 150000 个顶点,定向且边缘的所有权重都是正数。

我得到的结果如下:

1 - 使用数组,算法非常慢 ->这是预期的

2 - 使用 STL priority_queue算法的运行速度比数组快得多 - 这也是预期的>

3 - 使用 STL 设置算法运行速度非常快,我说的是比priority_queue快 100 倍的夫妇 ->我没想到会看到如此巨大的性能......

知道 std::p riority_queue 和 std::set 是存储元素的数据容器,并且两者具有基本相同的插入复杂度 O(log n),我不明白它们之间的这种巨大的性能差异。 你对此有什么解释吗?

感谢您的帮助,

编辑:这是我实现的摘要:

使用 std::set:

unsigned int Graphe::dijkstra(size_t p_source, size_t p_destination) const {
....

set<pair<int, size_t>> set_vertices;

vector<unsigned int> distance(listAdj.size(),
numeric_limits<unsigned int>::max());

vector < size_t
> predecessor(listAdj.size(),
numeric_limits < size_t > ::max());

distance[p_source] = 0;
set_vertices.insert( { 0, p_source });

while (!set_vertices.empty()) {
unsigned int u = set_vertices.begin()->second;

if (u == p_destination) {
break;
}
set_vertices.erase( { distance[u],
u });

for (auto itr = listAdj[u].begin();
itr != listAdj[u].end(); ++itr) {

int v = itr->destination;
int weigth = itr->weigth;

if (distance[v]
> distance[u] + weigth) {

if (distance[v]
!= numeric_limits<unsigned int>::max()) {
set_vertices.erase(
set_vertices.find(
make_pair(distance[v],
v)));
}
distance[v] = distance[u] + weigth;
set_vertices.insert( { distance[v],
v });
predecessor[v] = u;
}
}
}
....
return distance[p_destination];}

并带有priority_queue:

unsigned int Graphe::dijkstra(size_t p_source, size_t p_destination) const {
...
typedef pair<size_t, int> newpair;
priority_queue<newpair, vector<newpair>, greater<newpair> > PQ;
vector<unsigned int> distance(listAdj.size(),
numeric_limits<unsigned int>::max());

vector < size_t
> predecessor(listAdj.size(),
numeric_limits < size_t > ::max());

distance[p_source] = 0;
PQ.push(make_pair(p_source, 0));
while (!PQ.empty()) {

unsigned int u = PQ.top().first;

if (u == p_destination) {
break;
}
PQ.pop();

for (auto itr = listAdj[u].begin();
itr != listAdj[u].end(); ++itr) {

int v = itr->destination;
int weigth = itr->weigth;

if (distance[v]
> distance[u] + weigth) {
distance[v] = distance[u] + weigth;
PQ.push(
make_pair(v, distance[v]));
predecessor[v] = u;
}
}
}
...
return distance[p_destination];}

跳过

您在优先级队列上加倍工作非常糟糕。

您正在重复插入队列,因为您无法修改或删除。这是正常和必要的,因为你不能。

但是,当这些旧值从队列中出来时,您需要"跳过while循环的迭代"。

像这样:

if (PQ.top().second != distance[PQ.top().first]) continue;  // It's stale! SKIP!!

std::priority_queue的底层数据结构是一个最大堆,std::set它的自平衡二叉搜索 - 基本上是一棵红黑树C++。因此,它们都确保了插入,删除和更新操作O(logn)时间复杂性。

但是,正如我所提到的,std::set的平衡二叉搜索树会自动平衡以保持其节点数的高度对数,从而确保对数查询的复杂性,无论插入顺序或任何操作后。std::priority_queue不是自平衡的,根据广告顺序的不同,可能非常平坦。虽然自平衡有自己的成本,所以在删除顶部后堆积,但我认为这就是性能提升的原因。

希望对您有所帮助!