您的位置：首页 > 其它

统计学习方法读书笔记--3.K近邻法

2017-05-14 16:09 141 查看

定义

求与向量x距离最近的k个向量,将多数向量的类别作为x的类别;

分类,回归;

距离度量

k值的选择

分类决策规则

Lp距离

Minkowski距离

欧氏距离;

Lp(xi,xj)=(∑l=1n∣∣x(l)i−x(l)j∣∣p)1p

p=2时为欧氏距离,平面距离;

p=1时为曼哈顿距离,差的绝对值;

p=∞ ,它是各个坐标距离的最大值,即:

L∞(xi,xj)=maxl∣∣x(l)i−x(l)j∣∣

k值较小,近似误差小,估计误差大,容易发生过拟合;

k值较大,近似误差大,估计误差小,不相似的实例也会对预测起到作用,是预测发生错误;模型变得简单;

实际应用:k取比较小的值,通过交叉验证来选择最优的k

多数表决规则;

通过KD树,快速找到与用户最近的k个商家;

查到用户指定距离中的POI;

R树,

BallTree;

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 机器学习 knn分类器

相关文章推荐

新的分享

章节导航