BTree 实现 - 我需要先知道树的顺序吗?

BTree Implementation - Do I need to know the order of the tree first?

本文关键字:顺序 先知 实现 BTree      更新时间:2023-10-16

所以我有一个数据结构类的项目,我必须实现一个非常简单的信息数据库。记录必须存储在文件中,当程序打开时 - 它们必须从文件中读取并放入BTree中。我的问题是我们还没有讨论BTrees,课本中的讲座也不是太清楚(它没有任何代码,只有解释和一些例子)。

我的问题是:我可以在不知道其顺序的情况下创建 BTree 吗?或者我应该为订单设置一个非常高的数字,以便我可以确定它能够容纳很多记录?有什么建议吗?

你当然可以 - BTrees旨在对他们的输入进行排序。 所需要的只是能够比较任何两个对象,并能够确定哪个"更大"或应该稍后。 BTrees 会随着您向其添加更多项目而动态增长,从而为它们增加更多级别。 我希望你的教授能很好地涵盖BTrees,因为它们是一个迷人的结构:-)。

如果你希望实现 BTree 作为作业的一部分,你需要去找 TA 并让他们详细解释它——一般的想法是,每个节点要么是包含值、排序的节点,要么是一个基于值范围指向其他节点的节点。 每次向此树添加节点时,您都会向下走到节点应该在的位置,如果可能,请添加节点。 如果没有,请重新组织树,直到可能为止,然后添加节点。

魔鬼在细节中,在这种情况下的细节需要一些时间和很好的解释才能完全理解。 人们忍受所有复杂性引起的头痛的原因是,BTrees不需要事先知道它们最终会有多大,或者元素将覆盖什么范围,或者其他任何东西。 作为奖励,它们非常适合在磁盘上使用,在那里您甚至无法将所有元素存储在内存中。

如果你正在实现自己的BTree,那么你应该确保它可以支持不同的顺序,特别是因为你要使用的顺序将取决于媒介。 BTree 的目的是最大限度地减少执行随机访问所需的时间,因此内存中的 BTree(如果您要以这种方式使用它)希望单个节点适合缓存行,并且如果您要将 BTree 存储在磁盘上(在这种情况下您将这样做),您将希望您的节点适合磁盘扇区。