最快的方法是什么

What is the quickest way to rehash?

本文关键字:是什么 方法      更新时间:2023-10-16

从Mark Weiss的C++数据结构和算法分析:

/**
* Rehashing for quadratic probing hash table.
*/
void rehash( )
{
    vector<HashEntry> oldArray = array;
    // Create new double-sized, empty table
    array.resize( nextPrime( 2 * oldArray.size( ) ) );
    for( auto & entry : array )
        entry.info = EMPTY;
    // Copy table over
    currentSize = 0;
    for( auto & entry : oldArray )
        if( entry.info == ACTIVE )
            insert( std::move( entry.element ) );
}

这似乎是一个非常痛苦的操作,必须遍历表中的每个元素,并检查该元素是否处于活动状态。特别是,是否有一种实现只意味着遍历插入的元素数量(而不是整个表)?

参见Per-Ake-Larson,动态哈希,CACM 1988年4月,第446-457页。他描述了一个散列系统,其中可以分割bucket,并且只有splt bucket的散列代码需要重新计算。

您可以在1998年7月的Usenet comp.sources.misc档案中找到一个编码为hsearch(3)替代品的"C"版本,由ejp@ausmelb.oz(我)。该代码随后进入了Berkeley DB和包括OpenLDAP在内的其他各种地方。很抱歉,我还没有原始的源代码,但我有一个Java实现。