K的意思是有一个巨大的阵列
Kmeans with an huge array
我试图找到一个巨大数据集的5000个中心点。我的输入数组是5000000][512],意思是很多512维的向量。C++对数组大小有限制,我似乎无法克服这一点。我想使用opencv-keans函数。知道吗???
同意上述观点。真正的问题是,你真的有这么大内存的笔记本电脑/台式机吗。如果答案是肯定的,你可以简单地编写C程序来完成这项工作。否则,您可能需要找到一个分布式解决方案,例如Hadoop上的Mahout。另一种选择是,如果您的需求可以接受,您可能希望以某种方式从所有数据中提取样本,并对样本进行聚类。
我最终使用了迷你批处理kmean,它将数据采样到批中。此外,矩阵非常稀疏,所以添加稀疏矩阵表示就可以了。
相关文章:
- OpenMP阵列性能较差
- 如何将三维尺寸不固定的三维阵列展平为一维阵列
- 在linux上调试巨大的C++项目
- 当我的阵列太大时出现分段错误
- 位阵列上的快速AND运算
- 阵列必须使用大括号封闭的初始器进行初始化
- 没有从阵列<float>到阵列<int>的可行转换
- GCC 和 Clang 代码性能的巨大差异
- C++动态安全 2D 交错阵列
- 将平面阵列重塑为复杂的特征类型
- 如何使用英特尔 PIN 捕获阵列的所有负载?
- 为什么我能够为阵列分配比计算机实际拥有的内存更多的内存
- 库特<<恩德尔;不适用于打印 2D 阵列
- 数组类 阵列的打印输出
- 找到一种有效的方法,在 2 个巨大的缓冲区上执行 MAX,每字节字节
- 从较小的阵列到较大的阵列的元素级转换
- 仅在大型阵列上出现合并排序分段错误
- 从阵列C++中删除重复项
- 特征和巨大的密集 2D 阵列
- K的意思是有一个巨大的阵列