您的位置:首页 > 其它

【机器学习算法】之Apriori

2016-01-18 16:18 176 查看

一.算法介绍

Apriori算法不同于以前接触过的机器学习算法,这种算法用于在数据集中寻找有趣的关系。这些关系可以有两种形式:频繁项集或者关联规则。

关于算法的详细介绍参见:

/article/1547284.html

/content/964693.html

二.python实现

def apriori(dataSet, minSupport = 0.5):
C1 = createC1(dataSet)
D = map(set, dataSet)
L1, supportData = scanD(D, C1, minSupport)
L = [L1]
k = 2
while (len(L[k-2]) > 0):
Ck = aprioriGen(L[k-2], k)
Lk, supK = scanD(D, Ck, minSupport)#scan DB to get Lk
supportData.update(supK)
L.append(Lk)
k += 1
return L, supportData


apriori是一种无监督的学习算法,可以用于从数据中发现一些规律。个人感觉这种算法也可以用于数据挖掘的特征选择和预处理阶段。这种算法的问题在于模型比较简单,基于规则的算法上限可能不太高。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: