std::bitset 哈希函数算法

std::bitset hash function algorithm

本文关键字：算法函数 bitset std 哈希更新时间：2023-10-16

有谁知道位集的哈希函数正在使用什么算法，

这是来自网站： http://en.cppreference.com/w/cpp/utility/bitset/hash

#include <iostream>
#include <bitset>
#include <functional>
int main()
{
std::bitset<4> b1(1);
std::bitset<4> b2(2);
std::bitset<4> b3(b2);
std::bitset<4> b4(8);
std::cout<<b4<<'n';
std::hash<std::bitset<4>> hash_fn;
size_t h1 = hash_fn(b1);
size_t h2 = hash_fn(b2);
size_t h3 = hash_fn(b4);
std::cout << h1 << 'n';
std::cout << h2 << 'n';
std::cout << h3 << 'n';
}

输出为

1000
4334672815104069193
16667047557902998627
2258353126044249582

http://en.cppreference.com/w/cpp/utility/bitset/hash

另外，为什么它不将位转换为取消长篇并生成哈希值？

正如Igor所指出的，C++标准没有指定算法，它只要求哈希值仅取决于对象，并且在程序期间相同：http://eel.is/c++draft/hash.requirements

20.5.3.4 哈希要求 [哈希要求] 1 在以下情况下，H 类型满足哈希要求：

(1.1)它是一个函数对象类型，

(1.2)满足可复制和可破坏的要求，并且

(1.3) 表 29 中所示的表达式是有效的，并且具有指示的语义。

2 给定键是 H 类型的函数对象的参数类型，在表 29 中，h 是类型(可能是 const)H 的值，u 是 Key 类型的左值，k 是可转换为(可能是 const)Key 的类型值。

表 29 — 哈希要求

表达式返回类型要求

h(k) size_t 返回的值应仅取决于程序持续时间内的参数 k。[ 注：因此所有评估表达式 h(k) 具有相同的 k 值，对于给定程序的执行。— 尾注 ] [ 注：对于两个不同的值 t1 和 t2，h(t1) 和 h(t2) 比较相等的概率应该很小，接近1.0/numeric_limits：：max().— 尾注 ]

h(u) size_t 不得修改 u。

GCC 的 libstdc++ 位集实现使用 std：：hash： https://github.com/gcc-mirror/gcc/blob/master/libstdc%2B%2B-v3/include/debug/bitset

#if __cplusplus >= 201103L
// DR 1182.
/// std::hash specialization for bitset.
template<size_t _Nb>
struct hash<__debug::bitset<_Nb>>
: public __hash_base<size_t, __debug::bitset<_Nb>>
{
size_t
operator()(const __debug::bitset<_Nb>& __b) const noexcept
{ return std::hash<_GLIBCXX_STD_C::bitset<_Nb>>()(__b._M_base()); }
};
#endif

https://github.com/gcc-mirror/gcc/blob/1cb6c2eb3b8361d850be8e8270c597270a1a7967/libstdc%2B%2B-v3/include/std/bitset#L1561

// DR 1182.
/// std::hash specialization for bitset.
template<size_t _Nb>
struct hash<_GLIBCXX_STD_C::bitset<_Nb>>
: public __hash_base<size_t, _GLIBCXX_STD_C::bitset<_Nb>>
{
size_t
operator()(const _GLIBCXX_STD_C::bitset<_Nb>& __b) const noexcept
{
const size_t __clength = (_Nb + __CHAR_BIT__ - 1) / __CHAR_BIT__;
return std::_Hash_impl::hash(__b._M_getdata(), __clength);
}
};

LLVM的libcxx使用自己的bitset实现，将所有单词：https://github.com/llvm-mirror/libcxx/blob/2c4b8af9aada61d83610330416eb8a39a8aa5494/include/bitset#L417

template <size_t _Size>
struct _LIBCPP_TEMPLATE_VIS hash<bitset<_Size> >
: public unary_function<bitset<_Size>, size_t>
{
_LIBCPP_INLINE_VISIBILITY
size_t operator()(const bitset<_Size>& __bs) const _NOEXCEPT
{return __bs.__hash_code();}
};
template <size_t _N_words, size_t _Size>
inline
size_t
__bitset<_N_words, _Size>::__hash_code() const _NOEXCEPT
{
size_t __h = 0;
for (size_type __i = 0; __i < _N_words; ++__i)
__h ^= __first_[__i];
return __h;
}

和更简单的 1 字位集变体：

inline
size_t
__bitset<1, _Size>::__hash_code() const _NOEXCEPT
{
return __first_;
}