谷歌面试问题

Google Interview Question

本文关键字：问题面试谷歌更新时间：2023-10-16

这是谷歌面试中的一个问题。

如果哈希表增长超过30gb，可能会出现什么问题(忽略坏哈希函数等问题)

我不知道。什么才是令人满意的答案?

谢谢

答案部分取决于他们谈论的是经典的哈希表实现(如Java中的hashtable/HashMap)还是更复杂的东西。最后，按照今天的标准，30 GB的内存对于一台机器/虚拟机来说仍然是相当大的。

想想下面是什么:

这会导致以下问题:

目前还不清楚，即使是今天的操作系统也能很好地分配几十gb的内存块
为简单起见，假设表本身实际使用了表的一半(不包括键和值对象)。所以里面有一个15gb的数组。因此，每当表增长时，您需要至少分配另一个 15gb
即使分配了几十GB的数组，操作系统也会对其中的一些内存进行分页。因为我们假设一个很好的哈希函数，如果我们使用数组中的大部分数据，我们将中断页面缓存。会有很多页面错误。

不

我同意其他海报，谷歌正在寻找分布式作为一个解决方案。但我认为，从本质上讲，一个简单的哈希表会在超出某一点时停止扩展。在上面，

我认为面试官期待的是分布式哈希表之类的东西，因为30GB的哈希表不能存储在一台机器上(至少在当前的64位世界中);从我个人的经验来看，相当多的google问答都是围绕着分布式计算、map-reduce等展开的，

一些问题: