二进制搜索,用于查找排序数组中比给定值最小和最大的元素

Binary search for finding the lowest and largest element in a sorted array than a given value?

本文关键字:元素 用于 搜索 查找 排序 数组 二进制      更新时间:2023-10-16

所以,我试图实现二进制搜索算法(尽可能通用,可以适应不同的情况)。我在网上搜索了这个,有些用法,while (low != high)和有些用法,while (low <= high)和其他一些不同的条件,这很令人困惑。

因此,我开始编写代码来查找第一个大于给定元素的元素。我想知道是否还有比这更优雅的解决方案?

主要代码:

#include <iostream>
#include <map>
#include <vector>
#include <string>
#include <utility>
#include <algorithm>
#include <stack>
#include <queue>
#include <climits>
#include <set>
#include <cstring>
using namespace std;
int arr1[2000];
int n;
int main (void)
{
    int val1,val2;
    cin>>n;
    for (int i = 0; i < n; i++)
        cin>>arr1[i];
    sort(arr1,arr1+n); 
    cout<<"Enter the value for which next greater element than this value is to be found";   
    cin>>val1;
    cout<<"Enter the value for which the first element smaller than this value is to be found";
    cin>>val2;
    int ans1 = binarysearch1(val1);
    int ans2 = binarysearch2(val2);
    cout<<ans1<<"n"<<ans2<<"n";
    return 0;
}
int binarysearch1(int val)
{
    while (start <= end)
    {
        int mid = start + (end-start)/2;
        if (arr[mid] <= val && arr[mid+1] > val)
            return mid+1;
        else if (arr[mid] > val)
            end = mid-1;
        else
            start = mid+1;
    }
}

类似地,为了找到比给定元素小的第一个元素,

int binarysearch2(int val)
{
    while (start <= end)
    {
        int mid = start + (end-start)/2;
        if (arr[mid] >= val && arr[mid] < val)
            return mid+1;
        else if (arr[mid] > val)
            end = mid-1;
        else
            start = mid+1;
    }
}

当我不得不为这种抽象修改二进制搜索时,我经常感到非常困惑。请告诉我是否有更简单的方法?谢谢

正如您所说,有不同的方式来表示二进制搜索的结束条件,这完全取决于您的两个极限的含义。让我来解释一下我的,我认为这很容易理解,它可以让你在不想太多的情况下为其他情况修改它。

让我把这两个极限称为第一个最后。我们想要找到大于某个x的第一个元素。以下不变量将一直保持:

超过last的每个元素都大于x,并且之前的每个元素第一个小于或等于(相反的情况)。

注意,不变量没有说明区间[firstlast]。在没有进一步了解向量的情况下,极限的唯一有效初始化是向量的第一个=0和最后一个=最后一个位置。这满足条件,因为在最后之后什么都没有,在first之前什么都没有。所以一切都是对的。

由于区间[第一个最后一个]未知,我们将不得不继续进行,直到它为空,从而更新限制。

int get_first_greater(const std::vector<int>& v, int x)
{
  int first = 0, last = int(v.size()) - 1;
  while (first <= last)
  {
    int mid = (first + last) / 2;
    if (v[mid] > x)
      last = mid - 1;
    else
      first = mid + 1;
  }
  return last + 1 == v.size() ? -1 : last + 1;
}

正如您所看到的,我们只需要两个案例,所以代码非常简单。在每次检查时,我们都会更新极限,使其始终保持不变。

当循环结束时,使用不变量,我们知道last+1大于x(如果存在),所以我们只需要检查我们是否仍在向量内。

考虑到这一点,您可以根据需要修改二进制搜索。让我们更改它以查找最后一个小于x的值。我们更改不变量:

第一个之前的每个元素都小于x,并且每个元素在之后最后大于或等于x

这样,修改代码就非常容易:

int get_last_smaller(const std::vector<int>& v, int x)
{
  int first = 0, last = int(v.size()) - 1;
  while (first <= last)
  {
    int mid = (first + last) / 2;
    if (v[mid] >= x)
      last = mid - 1;
    else
      first = mid + 1;
  }
  return first - 1 < 0 ? -1 : first - 1;
}

检查我们是否只更改了运算符(>=而不是>)和返回,使用了与以前相同的参数。

很难写出正确的程序。一旦一个程序被验证是正确的,它就应该很少被修改,更多地被重用。在这一行中,考虑到您使用的是C++而不是C,我建议您尽可能充分地使用std C++库。您正在寻找的两个功能都是在算法中提供给您的。

http://en.cppreference.com/w/cpp/algorithm/lower_boundhttp://en.cppreference.com/w/cpp/algorithm/upper_bound这对你来说很神奇,而且考虑到模板的强大功能,你应该能够通过添加其他实现排序的方法来使用这些方法。

HTH。

要部分回答这个问题,可以考虑实际比较(使用回调函数或类似函数),这取决于要搜索的是比元素大的第一个元素还是更小的第一个元件。然而,在第一个代码块中,您使用

arr[mid] <= val && arr[mid+1] > val

而在第二块中,在第二条件中的索引移位

if (arr[mid] >= val && arr[mid] < val)

省略了,这似乎不一致。

您的搜索例程有一些错误[其中一个完全坏了]。我已经清理了一些,但我是从你的代码开始的。注意:不能保证——现在已经晚了,但这应该给你一个起点。请注意,"lo/hi"是标准命名法(例如,lo是你的开始,hi是你的结束)。此外,请注意,hi/lo设置为mid,而不是mid+1或mid-1

有一些边缘案例需要处理。while循环必须为"<"或"mid+1",它将运行到数组的末尾。

int
binarysearch_larger(const int *arr,int cnt,int val)
// arr -- array to search
// cnt -- number of elements in array
// val -- desired value to be searched for
{
    int mid;
    int lo;
    int hi;
    int match;
    lo = 0;
    hi = cnt - 1;
    match = -1;
    while (lo < hi) {
        mid = (hi + lo) / 2;
        if (arr[mid] <= val) && (arr[mid+1] > val)) {
            if ((mid + 1) < cnt)
                match = mid + 1;
            break;
        }
        if (arr[mid] > val)
            hi = mid;
        else
            lo = mid;
    }
    return match;
}
int
binarysearch_smaller(const int *arr,int cnt,int val)
// arr -- array to search
// cnt -- number of elements in array
// val -- desired value to be searched for
{
    int mid;
    int lo;
    int hi;
    int match;
    lo = 0;
    hi = cnt - 1;
    match = -1;
    while (lo < hi) {
        mid = (hi + lo) / 2;
        if (arr[mid] <= val) && (arr[mid+1] > val)) {
            match = mid;
            break;
        }
        if (arr[mid] > val)
            hi = mid;
        else
            lo = mid;
    }
    // the condition here could be "<=" or "<" as you prefer
    if ((match < 0) && (arr[cnt - 1] <= val))
        match = cnt - 1;
    return match;
}

下面是一个通用算法,它给出了一个排序的元素范围和一个值,它返回一对迭代器,其中第一个迭代器的值是排序范围中第一个比输入值小的元素,第二个迭代机的值是该范围中比输入值大的第一个元素。

若返回的迭代器对指向范围的末尾,则表示输入的范围为空。

我已经尽可能地使它通用,它还处理边缘案例和重复案例。

template<typename BidirectionalIterator>
std::pair<BidirectionalIterator, BidirectionalIterator>
lowhigh(BidirectionalIterator first, BidirectionalIterator last,
        typename std::iterator_traits<BidirectionalIterator>::value_type const &val) {
  if(first != last) {
    auto low = std::lower_bound(first, last, val);
    if(low == last) {
      --last;
      return std::make_pair(last, last);
    } else if(low == first) {
     if(first != last - 1) {
        return std::make_pair(first, std::upper_bound(low, last - 1, val) + 1);   
      } else {
        return std::make_pair(first, first);  
      }
    } else {
      auto up = std::upper_bound(low, last, val);
      return (up == last)? std::make_pair(low - 1, up - 1) : std::make_pair(low - 1, up);
    }
  }
  return std::make_pair(last, last);
}

现场演示