使用 k 近邻在一个类中有多少样本是最佳的
How many samples are optimal in one class using k-nearest neighbor?
我已经在我的系统中实现了k-near算法。它由 26 个类组成,每个类有 100 个样本。就我而言,K=7,完全是反复试验才能获得最佳分类结果。
我知道应该明智地选择 K 以减少分类上的噪音。但是样本数量呢?是否有任何一般规则,例如"样本越多,结果越好"?它取决于什么吗?
感谢您的所有回复。
您可以尝试考虑生成数据的任何潜在机制,或者您对该问题的任何背景知识,这可能会让您了解噪声的相对大小和真正的潜在变化。 例如,从位置预测最喜欢的运动队 我期望比预测最喜欢的运动有更多的变化,所以会使用较小的k。但是,除了使用交叉验证之外,我不知道太多的一般指导。
相关文章:
- 复制列表初始化的隐式转换的等级是多少
- while循环中while循环的时间复杂度是多少
- 如何检查一个c++字符串中有多少相同的字符/数字
- C++有多少类型的循环
- 求出有多少个数字是完美平方,而sqrt()是L,R范围内的素数
- 在条件变量中触发错误信号的频率是多少
- 函数的时间复杂度是多少?
- 必须为 C++20 协程帧保留多少内存?
- 对于四轴飞行器,PID中I控制器的理想值应该是多少
- C++,数组有多少个地址?
- 在C++中使用并行化的预期速度是多少(不是 OpenMp,而是 <thread>)
- 在 Linux 中存储区域设置名称的缓冲区大小应该是多少?
- 在内存不足之前,我可以声明多少个 const 变量?
- 可以读入进程内存的最大块大小是多少?
- 如何在不知道C++中有多少可选参数的情况下在循环中使用va_arg?
- 在二维向量或数组中可以存储的最大元素数是多少?
- 如何创建一个所有行大小不同的 2D 数组,并且用户将指定每行将有多少个元素?
- 计算出有多少客户端可以连接到我正在使用的一些tcp服务器代码
- 如果我不知道每个列表中有多少个数字,我如何将给定数量的数字列表作为输入?
- 使用 k 近邻在一个类中有多少样本是最佳的