Python知识分享网 - 专业的Python学习网站 学Python,上Python222
深入浅出Python机器学习 PDF 下载
匿名网友发布于:2025-05-18 11:19:12
(侵权举报)
(假如点击没反应,多刷新两次就OK!)

深入浅出Python机器学习  PDF 下载 图1

 

 

资料内容:

 

我们的数据集里面有一半是“朱”(图中浅色的点〉,另一半是“ 墨”(图中深色的点)。
现在有了一个新的数据点,颜色未知,我们怎么判断它属于哪一个分类呢?
 
对于K 最近邻算法来说,这个问题就很简单:新数据点离谁最近,就和谁属于同一类,从图
3-1 中我们可以看出,新数据点距离它8 点钟方向的浅色数据点最近,那么理所应当地,这个
新数据点应该属于浅色分类了,如图3 -2 所示。
 
看起来, K 最近邻算法真是够简单的,这么轻松就完成了分类的工作。别急,我们还没说完。
刚才只是举的最简单的例子,选的最近邻数等于1 。但如果我们在模型训练过程中让最近邻数
等于1 的话, 那么非常可能会犯了“ 一叶障目,不见泰山 "的错误,试想一下,万一和新数
据点最近的数据恰好是一个测定错误的点呢?
所以需要我们增加最近邻的数量,例如把最近邻数增加到3 ,然后让新数据点的分类和3 个当