您的位置:首页 > 其它

机器学习 基本算法 (4(K-means(较短

2017-03-31 20:32 197 查看

k-means

一种解决聚类问题的非监督式学习算法 就是k-均值 ,对全部的n个点 用求平均值的方法 找到k个聚类点

转化成最优化问题



就是 M个聚类点 每个x都属于这M个其中的一个点中 ,求这所以点加起来的总平方距离最短

对方程求导



看出来了 点的位置就是属于该点的 x的平均 (这就是 k-均值 中均值的来源)

这个算法很容易理解

1、随机找到 K个聚点

2、把所有的 N个点 都分到最近的 聚点上去

3、在用上面的式子 用平均求出新点

4、重复 上述环节 ,直到2个变化的差小于设定的值

代码

from sklearn.cluster import KMeans

#X training data set and x_test dataset
# 建模型
k_means = KMeans(n_clusters=3, random_state=0)

# Train the model using the training sets and check score
model.fit(X)

#Predict Output
predicted= model.predict(x_test)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: