k-近邻算法
2017-06-28 22:51
190 查看
#!/usr/bin/python #coding:utf-8 import numpy as np import operator ''' KNN算法 1. 计算已知类别数据集中的每个点依次执行与当前点的距离。 2. 按照距离递增排序。 3. 选取与当前点距离最小的k个点 4. 确定前k个点所在类别的出现频率 5. 返回前k个点出现频率最高的类别作为当前点的预测分类 ''' def createDateSet():#创建数据集和标签 group = np.array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels = ['A','A','B','B'] print group print labels return group , labels ''' inX为要分类的向量 dataSet为训练样本 labels为标签向量 k为最近邻的个数 ''' def classify0(inX , dataSet , labels , k): dataSetSize = dataSet.shape[0]#dataSetSize为训练样本的个数 diffMat = np.tile(inX , (dataSetSize , 1)) - dataSet#将inX扩展为dataSetSize行,1列 sqDiffMat = diffMat**2 sqDistances = sqDiffMat.sum(axis=1) distances = sqDistances**0.5 sortedDistIndicies = distances.argsort()#返回的是元素从小到大排序后,该元素原来的索引值的序列 classCount = {} for i in range(k): voteIlabel = labels[sortedDistIndicies[i]]#voteIlabel为类别 classCount[voteIlabel] = classCount.get(voteIlabel,0)+1#如果之前这个voteIlabel是有的,那么就返回字典里这个voteIlabel里的值,如果没有就返回0 sortedClassCount = sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)#key=operator.itemgetter(1)的意思是按照字典里的第一个排序,{A:1,B:2},要按照第1个(AB是第0个),即‘1’‘2’排序。reverse=True是降序排序 print sortedClassCount return sortedClassCount[0][0] group , labels = createDateSet() print classify0([0,0],group,labels,3)
相关文章推荐
- k-近邻算法(二)
- 机器学习经典算法详解及Python实现–K近邻(KNN)算法
- 【机器学习实战一:K-近邻算法】
- 机器学习实战(第二篇)-k-近邻算法改进约会网站配对结果
- [置顶] 机器学习 (三) k-近邻算法应用-约会网站匹配系统
- 机器学习实战——使用K-近邻算法识别手写数字
- K-近邻算法python实现
- 机器学习入门读书笔记三(k-近邻算法 kNN) 中
- 机器学习实战笔记 k 近邻算法 函数解析
- k-近邻算法实现分类器
- k-近邻算法(KNN)--1简单原理介绍与实践---by香蕉麦乐迪
- K近邻k-Nearest Neighbor(KNN)算法
- ML--K-近邻算法
- k-近邻算法
- K近邻分类算法实现 in Python
- 机器学习实战-第2章(k-近邻算法)
- Python学习之k-近邻算法
- k-近邻算法
- 深度学习之k-近邻算法案例
- k-近邻算法