优化文件夹中文件重新分区的良好做法
Good practice on optimal repartition of files in folders
我有一些文件的名字是数字,我想以优化的方式放在文件夹中,比如每个文件夹大约有相同数量的文件等等。
在数字的模数之后选择文件夹是一个好的做法吗?模数和除法一样贵吗?需要多少指令?
更准确地说,我想使用文件的平方根估计数的模数。
Number of files > 5'000'000
您可以使用任何您喜欢的哈希解决方案,但要遵守通常的约束,其中最重要的是所有哈希值的可能性都相等。如果文件按顺序编号,模量可能完全可以。
即使要使用加密哈希(不推荐使用),与文件系统创建文件所需的操作相比,成本也微不足道。模量良好。
但你可能还想考虑一下人类用户。他们(你)将如何找到文件?按范围划分要容易得多。然后,您可以按范围的开头命名每个目录,查找正确的目录是一项简单的任务。
当你使用数字作为文件名时,你会希望在某个时候用零填充它们,使它们的长度相同,这样字母顺序和数字顺序就相同了。我强烈建议你从一开始就做好这件事。注意到该问题的最常见时刻是需要大容量检索备份的时候。
相关文章:
- GetShortPathName在网络驱动器上使用中文文件夹时失败
- 是否有类似std::lower_bound的函数,而不需要排序/分区输入
- 按字母顺序对C++问题中的子字符串索引进行分区
- 如何查找集合的所有分区 (C++)
- librdkafka:rd_kafka_assignment 返回分配分区的偏移量 -1001
- 使用指针在分区函数中实现随机分区点
- Coursera DSA 算法工具箱第 4 周第 2 个问题 - 分区纪念品
- 迭代器范围的平衡分区,没有LegacyRandomAccessIterator
- 对多个(可能)重叠范围进行分区的最简单算法
- 如何在MacOS(sierra-catalina)上获取分区的可用空间
- 如何在 DevC++ 上显示带有中文字母的行?
- 并行快速排序分区中的隔离错误
- C++年分区综述
- 实现 3 路分区以实现快速排序
- 访问映射中的分区向量
- VSCode C++调试文件名中包含中文字符的文件时插件损坏
- 3路随机快速排序分区功能
- 如何确定2个URI(路径)是否属于同一分区或卷
- 根据 C++ 中的属性对对象类进行分区的优化方法
- 迭代快速排序方法的分区算法问题