在log(n)时间中查找频繁出现的字母

Find frequent occuring letter in log(n) time?

本文关键字:查找 log 时间      更新时间:2023-10-16

如果给定一个字符串,如"aaabbccc",您将如何输出"a",因为它与"c"一样频繁,但首先出现。

我使用O(n)时间完成了这项工作,但我不知道如何使用log(n)来完成,无论是在java还是c++中。

编辑:这是一个面试问题。

#include <iostream>
#include <string>
using std::string;
using std::cout;
using std::cin;
using std::endl;
char findFreqChar(string str) {
    int count;
    int maxOccur = 0;
    char maxChar;
    for (char i = 'A'; i < 'z'; i++) {
        count = 0;
        for (int j = 0; j < str.length(); j++) {
            if (i == str[j])
                count++;
        }
        if (count > maxOccur) {
            maxOccur = count;
            maxChar = i;
        }
    }
    return maxChar;
}
int main() {
    std::cout << "Enter String: ";
    std::string str;
    std::getline(std::cin, str);
    cout << findFreqChar(str);
    cin.get();
}

没有办法在少于O(n)的时间内找到最频繁的字母,因为如果不检查字符串中的每个字符,就无法确定该信息!

如果您可以像您的示例中那样保证对字母进行排序,那么您可以使用二进制搜索来识别每个连续字母范围的末尾。每个二进制搜索将是log(n);在最坏的情况下,你需要做其中的25个来找到所有的边界,但我想"25 x常数x log(n)"仍然是O(log(n))。

如果你采用二进制搜索的方法,那么就有足够的空间来巧妙地做到这一点——发现同一二进制搜索中的连续测试何时返回相同的字母,因此假设这是最小范围大小,然后放弃任何可能的短于此的范围——但你最好使用单独的搜索来编码。或者最好只采用O(n)扫描解决方案:你真的需要做这个O(log(n))吗?

如果您需要在O(log(n))时间内完成这一任务,那么这表明您需要开发某种类型的分治算法。我假设(基于你给我们的例子),一个字母的所有出现都是连续的。因此,我们可以做以下几点:

1) 将数组一分为二,然后递归调用算法。子算法必须返回4个值:-阵列中出现频率最高的值及其频率-以最右边字符结尾的连续字符数-以最左边字符结尾的连续字符数

因此,当对"aabbbbcc"调用时,递归调用将返回:(b,4,2,2)

2) 组合两个子数组并返回(现在较大的数组)的结果。首先,我们需要计算组合数组中最频繁的字符。这很容易被计算为右边最长的序列、左边最长的顺序,或者跨越分割点的顺序(这就是为什么我们需要递归调用的最后2个值)。这一切都可以在恒定的时间内完成。我们还从两个递归调用中返回以最右边和最左边字符结尾的连续字符长度的适当值。

该递归最终为T(n)=T(n/2)+O(1),或O(lg n)

有相当多的边界情况需要处理,您需要弄清楚如何处理递归"见底"的情况,但这应该足以让您编写代码。