Multithreading unordered_map

Multithreading unordered_map

本文关键字:map unordered Multithreading      更新时间:2023-10-16

我在多线程环境中工作。基本上,我有一个可以同时由多个线程访问的unordered_map。现在,我的算法是:

function foo(key) {
scoped_lock()
if key exists {
return Map[key]
}
value = get_value()
Map[key] = value
}

显然,这种实现的性能并不好。我可以使用任何算法/方法来提高性能吗?

编辑:

我做了一些测试,我想到了双重检查锁定。因此,我修改了代码:

function foo(key) {
if key exists {
return Map[key]
}
scoped_lock()
if key exists {
return Map[key]
}
value = get_value()
Map[key] = value
}

实际上我只在 scoped_lock() 之前添加另一个检查。在这种情况下,假设函数被调用N次。如果前m次调用foo,其中m < N填充了地图,而接下来的N - m次调用仅从地图中获取值,则我不需要独占访问权限。此外,scoped_lock后还有另一项检查,可确保线程安全。我说的对吗?无论如何,对于第一个代码,执行需要~208s,而第二个代码需要~200s。

下面是一个实用程序类:

template<class T, class M=std::mutex, template<class...>class S=std::unique_lock, template<class...>class U=std::unique_lock>
struct mutex_protected {
template<class F>
auto read( F&& f ) const
-> typename std::result_of<F&&(T const&)>::type
{
auto l = lock();
return std::forward<F>(f)(data);
}
template<class F>
auto write( F&& f ) 
-> typename std::result_of<F&&(T&)>::type
{
auto l = lock();
return std::forward<F>(f)(data);
}
mutex_protected(mutex_protected&&)=delete;
mutex_protected& operator=(mutex_protected&&)=delete;
template<class...Args>
mutex_protected( Args&&...args ):
data( std::forward<Args>(args)... )
{}
private:
mutable M m;
T data;
U<M> lock() { return U<M>(m); }
S<M> lock() const { return S<M>(m); }
};

它,特别是在 C++14 中,允许您以易于编写的方式与受互斥锁保护的数据实例进行交互。

在 c++14 中,您可以使用std::shared_timed_mutex,在 c++17 中,您可以使用如下所示std::shared_mutex

template<class T>
using rw_guarded = mutex_guarded< T, std::shared_mutex, std::shared_lock >;

这样就可以同时拥有多个阅读器。 但是您应该首先确定简单的互斥锁是否足够快。

struct cache {
using Key=std::string;
using Value=int;
using Map=std::unordered_map< Key, Value >;
Value get( Key const& k ) {
Value* r = table.read([&](Map const& m)->Value*{
auto it = m.find(k);
if (it == m.end()) return nullptr;
return std::addressof( it->second );
});
if (r) return *r;
return table.write([&](Map& m)->Value{
auto it = m.find(k);
if (it != m.end()) return it->second;
auto r = m.insert( std::make_pair(k, 42) ); // construct data here
return r.first->second;
});
}
private:
mutex_guarded< std::unordered_map< Key, Value > > table;
};

mutex_guarded升级到rw_guarded,它将切换到读写器锁。


这是一个更复杂的版本:

有两张地图;一张是价值地图,一张是共享价值的未来。

使用读取器写入器锁(也称为共享互斥锁)。

要获取,请获取共享锁。 检查它是否存在。 如果是,请返回。

解锁第一张地图。 锁定第二个地图进行写入。 如果密钥下还没有共同的未来,请添加一个。 解锁地图 2,并等待共享未来,无论您是否添加了它。

完成后,锁定第一个地图进行读取;检查结果是否已经存在。 如果是,请将其退回。 如果没有,请解锁,重新锁定写入,将数据移动到映射 1 中(如果尚未存在),在第一个映射中返回数据。

这旨在最大限度地减少周期映射 1 被单独锁定,从而允许在那里实现最大并发性。

其他设计将优化其他考虑因素。

不要使用operator[]不要在没有激活某种锁的情况下与任何地图进行交互。 知道哪些锁对应于哪个地图。 请注意,在某些情况下,可以在没有锁定的情况下读取元素(不查找)。 有时需要阅读共享内容的副本,而不是共享内容。 查找每种类型的文档以确定哪些操作需要哪些锁。