您的位置：首页 > 其它

机器学习基本算法（4（K-means(较短

2017-03-31 20:32 197 查看

k-means

一种解决聚类问题的非监督式学习算法就是k-均值，对全部的n个点用求平均值的方法找到k个聚类点

转化成最优化问题

就是 M个聚类点每个x都属于这M个其中的一个点中，求这所以点加起来的总平方距离最短

对方程求导

看出来了点的位置就是属于该点的 x的平均（这就是 k-均值中均值的来源）

这个算法很容易理解

1、随机找到 K个聚点

2、把所有的 N个点都分到最近的聚点上去

3、在用上面的式子用平均求出新点

4、重复上述环节，直到2个变化的差小于设定的值

代码

from sklearn.cluster import KMeans

#X training data set and x_test dataset
# 建模型
k_means = KMeans(n_clusters=3, random_state=0)

# Train the model using the training sets and check score
model.fit(X)

#Predict Output
predicted= model.predict(x_test)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

机器学习 基本算法 （4（K-means(较短

k-means

机器学习基本算法（4（K-means(较短