特殊排序算法和通用签名

special sorting algorithm and generic signature

本文关键字:排序 算法      更新时间:2023-10-16

我有一个强大的用例来定义我自己的排序算法,它比stl中最快的算法更快,并且通过利用底层数据的一些良好特性,我基本上可以在O(n)中排序。

到目前为止还不错,现在的问题是,我想提供一个通用接口,它将适合任何类型的容器,例如T*std::vector<T>等,只要应用几个关键概念,例如

  • 有一个有效的运算符[]可用于访问集合的元素
  • 该系列的元素支持"小于"的可比概念

为了获得想法,我去了头文件<std_algo.h>,发现下面的函数接口与我想要的完全匹配,除了一个细节,我不知道编译器忽略容器类型会如何自动向量化在底层_RandomAccessIterator中循环,这是我的问题。。。有没有办法让我拥有这一切?自动向量化+忽略基础集合类型的通用接口?

我认为由于"非规范"循环模式while (__last - __first > int(_S_threshold))和类似if (__depth_limit == 0)的条件,下面的代码不会自动向量化,但这最后一个我在算法中不需要。因此,我认为非规范类型的循环会阻止自动向量化。

template<typename _RandomAccessIterator, typename _Compare> 
inline void sort(_RandomAccessIterator __first, _RandomAccessIterator __last, _Compare __comp)
{
    typedef typename iterator_traits<_RandomAccessIterator>::value_type
    _ValueType;
    // concept requirements
    __glibcxx_function_requires(_Mutable_RandomAccessIteratorConcept<
    _RandomAccessIterator>)
    __glibcxx_function_requires(_BinaryPredicateConcept<_Compare, _ValueType,
    _ValueType>)
    __glibcxx_requires_valid_range(__first, __last);
    if (__first != __last)
    {
        std::__introsort_loop(__first, __last,
        std::__lg(__last - __first) * 2, __comp);
        std::__final_insertion_sort(__first, __last, __comp);
    }
}

有问题的循环看起来像这样:

// This is a helper function for the sort routine.
template<typename _RandomAccessIterator, typename _Size, typename _Compare> 
void __introsort_loop(_RandomAccessIterator __first, _RandomAccessIterator __last, _Size __depth_limit, _Compare __comp)
{
    while (__last - __first > int(_S_threshold))
    {
        if (__depth_limit == 0)
        {
            _GLIBCXX_STD_A::partial_sort(__first, __last, __last, __comp);
            return;
        }
        --__depth_limit;
        _RandomAccessIterator __cut =
        std::__unguarded_partition_pivot(__first, __last, __comp);
        std::__introsort_loop(__cut, __last, __depth_limit, __comp);
        __last = __cut;
    }
}

标准C++库在标准算法中使用迭代器,如sort()。这允许算法实现忽略底层容器的确切细节。此外,这种方法不允许使用operator[]()进行索引。

考虑到这一点,我有两个建议供您考虑:

1) 修改您的专用排序以使用迭代器,而不是operator[]()来访问容器中的元素。如果可以保持所需的O(n)速度,那么这可能是最理想的灵活性方法。

2) 使用模板化的容器类实现排序。类似的东西

template <class Container, class Compare>
void sort(Container cont, Compare comp);

应该做到这一点。

模板的美妙之处在于,在填充模板类型之前,它们不会被完全编译,因此编译器可以根据最终代码应用优化。T*指针满足随机访问迭代器的所有必需属性,并且可以在任何需要它们的模板代码中轻松使用。

vector<float> v;
// load v
sort(&v[0], &v[v.size()]); // same as sort(v.begin(), v.end()) but possibly optimized better