您的位置:首页 > 其它

关联规则算法1------关联规则Apriori原理和R实现

2017-03-14 21:29 253 查看

1 关联规则产生

关联规则反应的是一个事物与其他事物之间的关联关系,被称为购物篮模型,最初产生为啤酒喝尿布的故事,

2 关联规则指标

1)支持度为事物在数据集中发生的概率,支持度的意义在于度量项集在整个事务集中出现的频次,我们希望关注频次高的项集。

Support(A)=A/U

2)置信度,在A发生的条件下B发生的概率

Confidence(A-->B)=P(AB)/P(A)

3)提升度

Lift(A→B) = P(B|A) / P(B)=P(AB)/P(A)P(B)、

4)频繁项集:经常一起出现的项集

3  关联规则 ----Apriori算法原理

假设交易记录

item1ABCD
item2BCD 
item3CD  
item4BFGH
item5ACD 

3.1 生成关联规则



4关联规则R语言实现

4.1读数据变换成交易记录集

#format有两种格式single原始记录和basket购物篮记录

rp<-read.transactions('D:\\R\\Apriori_id_50.csv',

                      format = 'single',

                      sep=',',

                      cols=c(1,2))

4.2 生成关联规则

#关联模型

asso_rules <- apriori(rp, parameter = list(supp = 0.001,  #支持度

                                      conf = 0.5,   #置信度

                                      minlen = 2  #规则长度最小数

))

4.3规则结果展示



4.4查看和保存规则

查看规则:inspect(asso_rules)

保存规则:write.csv(asso_rules,file='D:\\R\\asso_rules.csv')
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息