统计学习方法读书笔记--3.K近邻法
2017-05-14 16:09
141 查看
定义
求与向量x距离最近的k个向量,将多数向量的类别作为x的类别;分类,回归;
三要素
距离度量k值的选择
分类决策规则
距离度量
Lp距离Minkowski距离
欧氏距离;
Lp定义
Lp(xi,xj)=(∑l=1n∣∣x(l)i−x(l)j∣∣p)1pp=2时为欧氏距离,平面距离;
p=1时为曼哈顿距离,差的绝对值;
p=∞ ,它是各个坐标距离的最大值,即:
L∞(xi,xj)=maxl∣∣x(l)i−x(l)j∣∣
K值的选择
k值较小,近似误差小,估计误差大,容易发生过拟合;k值较大,近似误差大,估计误差小,不相似的实例也会对预测起到作用,是预测发生错误;模型变得简单;
实际应用:k取比较小的值,通过交叉验证来选择最优的k
分类决策规划
多数表决规则;实现-kd树
多维空间分割树,KD树KD树在POI中的应用
通过KD树,快速找到与用户最近的k个商家;查到用户指定距离中的POI;
其他
R树,BallTree;
相关文章推荐
- 统计学习方法—3.K近邻法
- K近邻分类算法与kdTree实现的伪代码(构造kdTree 和 kdTree上搜索最近邻)
- 【机器学习实战之一】:C++实现K-近邻算法KNN
- 【机器学习实战】:C++实现K-近邻算法KNN
- K-近邻算法(KNN)
- 初学者对K近邻分类算法的理解与matlab平台上的实现
- j简单的分类实现-K近邻
- Python实现k-近邻算法
- Python语言实现机器学习的K-近邻算法
- 《机器学习实战》学习笔记:k-近邻算法的两个应用场景
- 机器学习实战笔记之二(k-近邻算法)
- 机器学习算法与Python实践之(一)k近邻(KNN)
- K-近邻算法
- 机器学习 - K-近邻算法(KNN)
- 欧氏距离的矩阵实现(k近邻分类器)
- 大数据学习笔记3-近邻搜索
- K-近邻算法总结
- 机器学习算法( 二、K - 近邻算法)
- python 实现 AP近邻传播聚类算法(Affinity Propagation)
- K近邻相关概念及其Python实现