在log(n)时间中查找频繁出现的字母
Find frequent occuring letter in log(n) time?
如果给定一个字符串,如"aaabbccc",您将如何输出"a",因为它与"c"一样频繁,但首先出现。
我使用O(n)时间完成了这项工作,但我不知道如何使用log(n)来完成,无论是在java还是c++中。
编辑:这是一个面试问题。
#include <iostream>
#include <string>
using std::string;
using std::cout;
using std::cin;
using std::endl;
char findFreqChar(string str) {
int count;
int maxOccur = 0;
char maxChar;
for (char i = 'A'; i < 'z'; i++) {
count = 0;
for (int j = 0; j < str.length(); j++) {
if (i == str[j])
count++;
}
if (count > maxOccur) {
maxOccur = count;
maxChar = i;
}
}
return maxChar;
}
int main() {
std::cout << "Enter String: ";
std::string str;
std::getline(std::cin, str);
cout << findFreqChar(str);
cin.get();
}
没有办法在少于O(n)
的时间内找到最频繁的字母,因为如果不检查字符串中的每个字符,就无法确定该信息!
如果您可以像您的示例中那样保证对字母进行排序,那么您可以使用二进制搜索来识别每个连续字母范围的末尾。每个二进制搜索将是log(n);在最坏的情况下,你需要做其中的25个来找到所有的边界,但我想"25 x常数x log(n)"仍然是O(log(n))。
如果你采用二进制搜索的方法,那么就有足够的空间来巧妙地做到这一点——发现同一二进制搜索中的连续测试何时返回相同的字母,因此假设这是最小范围大小,然后放弃任何可能的短于此的范围——但你最好使用单独的搜索来编码。或者最好只采用O(n)扫描解决方案:你真的需要做这个O(log(n))吗?
如果您需要在O(log(n))时间内完成这一任务,那么这表明您需要开发某种类型的分治算法。我假设(基于你给我们的例子),一个字母的所有出现都是连续的。因此,我们可以做以下几点:
1) 将数组一分为二,然后递归调用算法。子算法必须返回4个值:-阵列中出现频率最高的值及其频率-以最右边字符结尾的连续字符数-以最左边字符结尾的连续字符数
因此,当对"aabbbbcc"调用时,递归调用将返回:(b,4,2,2)
2) 组合两个子数组并返回(现在较大的数组)的结果。首先,我们需要计算组合数组中最频繁的字符。这很容易被计算为右边最长的序列、左边最长的顺序,或者跨越分割点的顺序(这就是为什么我们需要递归调用的最后2个值)。这一切都可以在恒定的时间内完成。我们还从两个递归调用中返回以最右边和最左边字符结尾的连续字符长度的适当值。
该递归最终为T(n)=T(n/2)+O(1),或O(lg n)
有相当多的边界情况需要处理,您需要弄清楚如何处理递归"见底"的情况,但这应该足以让您编写代码。
- 正在查找文档以获得PS4平台的C++中的设备信息
- 在C++中查找文件
- 模板元程序查找相似的连续类型名称
- 在UNIX系统中使用DIR查找文件的字节大小
- 如何用数字处理log(0)
- 查找最接近的大于当前数字的数字的索引
- 有没有一种方法可以创建一个带有哈希表的数据库,该哈希表具有恒定时间查找功能
- 查找后更改类变量
- 使用正则表达式regex_search在字符串中查找字符串
- 使用gcc从静态链接的文件中查找可选符号
- 在C++中查找范围的长度
- 算法问题:查找从堆栈中弹出的所有序列
- 在Windows中查找扬声器输出的当前音量级别
- 如何在C++中使用X509证书模在令牌中查找私钥
- 使用.find函数在c++中查找字符和另一个字符之间的大小
- 在 Windows 上,是否可以让 dll 在不使用 PATH 环境变量的情况下在另一个文件夹中查找依赖项?
- 在 for 循环中查找问题时遇到困难
- 保持排序的数据结构,允许log N插入时间,并且可以返回我在log N中查找的元素的索引
- 在log(n)时间中查找频繁出现的字母
- O(N) 查找,但在排序列表上使用 upper_bound 时进行 O(log(N)) 比较