发新帖

关于KNN算法的最佳K值选取问题

[复制链接]
388 4

快来加入 TensorFlowers 大家庭!

您需要 登录 才可以下载或查看,没有帐号?加入社区

x
最近接触了一点点KNN算法的知识,大概总结了一下近邻算法主要过程:1. 计算训练样本和测试样本中每个样本点的距离
2. 对上面所有的距离值进行排序
3. 选前k个最小距离的样本
4. 根据这k个样本的标签进行投票,得到最后的分类类别
k值选取合适与否对最终的分类结果会产生影响,请教一下大家如何才能选取较为合适(或最佳)的K值呢?有哪些算法或数学思想作参考呢?
我知道答案 回答被采纳将会获得10 金币 + 5 金币 已有4人回答
本楼点评(0) 收起

精彩评论4

M丶Sulayman  TF豆豆  发表于 2018-5-13 18:20:07 | 显示全部楼层
K值是经验值,不同样本构建的模型K值几乎都不同,遇的较多的好像是设置成5。这其实也是参数优化,你可以用寻优算法迭代找寻最优K值。细菌觅食,蚁群啊什么的群智算法都行。
本楼点评(0) 收起
北海  TF荚荚  发表于 2018-5-15 14:25:27 来自手机  | 显示全部楼层
可以使用超参数搜索,自动识别出最佳参数
本楼点评(0) 收起
M丶Sulayman  TF豆豆  发表于 2018-5-16 09:33:17 | 显示全部楼层
北海 发表于 2018-5-15 14:25
可以使用超参数搜索,自动识别出最佳参数

同意~
本楼点评(0) 收起
neverchange  TF豆豆  发表于 2018-7-4 13:17:11 | 显示全部楼层
一般都是分成train set和test set然后利用建立在训练样本集上的预测模型,对测试样本集做预测并计算其预测误差
本楼点评(0) 收起
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

主题

帖子

69

积分
快速回复 返回顶部 返回列表