白话机器学习算法(二)KNN
2014-03-25 19:57
197 查看
KNN是一种分类算法,在现实生活中,我们看一个人怎么样,可以看他的朋友怎么样,至少说这样推断的可信度比较高;KNN就是这种思想。
1:)初始化输入为有标签样本;
2:)当我们得到一个新样本的时候,我们就看这个新样本的半径为R的周围,各种有标签样本的比例,哪种标签占的比例最高,我们就给这个新样本打上这个标签,就是从这个样本的“朋友”中来判断这个样本是哪一类!
上面说的思想,具体实现knn以及如何选择k又是一个问题,因为要找到最近的n个向量,当数据量特别大时,线性搜索是个很耗时间的事情,也不现实,这里就要涉及到kd树的问题,这里不详细说,等以后有时间了再回来补充这里的所有关于算法的博客,详细探讨;
1:)初始化输入为有标签样本;
2:)当我们得到一个新样本的时候,我们就看这个新样本的半径为R的周围,各种有标签样本的比例,哪种标签占的比例最高,我们就给这个新样本打上这个标签,就是从这个样本的“朋友”中来判断这个样本是哪一类!
上面说的思想,具体实现knn以及如何选择k又是一个问题,因为要找到最近的n个向量,当数据量特别大时,线性搜索是个很耗时间的事情,也不现实,这里就要涉及到kd树的问题,这里不详细说,等以后有时间了再回来补充这里的所有关于算法的博客,详细探讨;
相关文章推荐
- C#开发编码规范
- asp.net中计算文件夹的大小
- [Unity3D]Script 脚本所有编译器属性详解
- 常见Android屏幕分辨率以及对应机型
- C#字符串处理类
- c#.net常用函数和方法集
- 将Byte数组转化为String
- C#中string与byte[]的转换帮助类
- Valera and X
- North America - East Central NA 2012
- python网络爬虫(一)
- 浏览器探究——Framework层基本架构
- 【M25】将构造方法和非成员方法虚化
- UVA11324 - The Largest Clique(强连通最大团)
- Android4.4之Keyguard--KeyguardMessageArea
- 转义符"\""
- Hive.GROUP BY子句的“陷阱”
- 剔除冗余空格字符
- C# 和 Win32API
- C#中使用Win32和其他库