大文件中出现最多的元素

Most recurring element in a large file

本文关键字:元素 文件      更新时间:2023-10-16

给定一个大文件,无法加载到内存中,有 2 个字段,ItemId 及其描述。条目包含所有已售商品的列表。随时跟踪最畅销的商品。我们可以为此使用最小堆/最大堆还是有其他有效的方法?

听起来你需要一个map<string,int>来计算每个项目的出现次数。

然后按计数排序。

我认为这个问题与 LRU 缓存实施有关,其中大多数购买的产品应该保留在缓存中,并且您可以随时从缓存中提取所有产品。

我的经历,这些问题在亚马逊的采访中被问到。

相同的另一个变体是,

在浏览器历史记录中,获取 100 个大部分打开的页面。

当用户打开任何页面时,更新历史记录/获取历史记录...。

检查 http://www.geeksforgeeks.org/implement-lru-cache/