关联规则算法1------关联规则Apriori原理和R实现
2017-03-14 21:29
253 查看
1 关联规则产生
关联规则反应的是一个事物与其他事物之间的关联关系,被称为购物篮模型,最初产生为啤酒喝尿布的故事,2 关联规则指标
1)支持度为事物在数据集中发生的概率,支持度的意义在于度量项集在整个事务集中出现的频次,我们希望关注频次高的项集。Support(A)=A/U
2)置信度,在A发生的条件下B发生的概率
Confidence(A-->B)=P(AB)/P(A)
3)提升度
Lift(A→B) = P(B|A) / P(B)=P(AB)/P(A)P(B)、
4)频繁项集:经常一起出现的项集
3 关联规则 ----Apriori算法原理
假设交易记录item1 | A | B | C | D |
item2 | B | C | D | |
item3 | C | D | ||
item4 | B | F | G | H |
item5 | A | C | D |
3.1 生成关联规则
4关联规则R语言实现
4.1读数据变换成交易记录集
#format有两种格式single原始记录和basket购物篮记录rp<-read.transactions('D:\\R\\Apriori_id_50.csv',
format = 'single',
sep=',',
cols=c(1,2))
4.2 生成关联规则
#关联模型asso_rules <- apriori(rp, parameter = list(supp = 0.001, #支持度
conf = 0.5, #置信度
minlen = 2 #规则长度最小数
))
4.3规则结果展示
4.4查看和保存规则
查看规则:inspect(asso_rules)保存规则:write.csv(asso_rules,file='D:\\R\\asso_rules.csv')
相关文章推荐
- 热部署机制的原理和编写简单demo实现类的替换
- retrofit的实现原理(三)
- 布隆过滤器(Bloom Filter)的原理和实现
- Remoting原理及实现
- HashMap实现原理分析
- VDSM块存储Block Domain实现原理和thin provision的实现
- session功能实现原理
- MySQL主从复制原理及配置详细过程以及主从复制集群自动化部署的实现
- 代理原理及实现
- java proxy 动态代理实现原理与用法
- CGLib动态代理原理及实现
- Bezier曲线原理及实现代码(c++)
- 储水池抽样算法原理与实现
- 数据库连接池原理详解与自定义连接池实现
- C++ 多态的实现及原理
- Leveldb 实现原理
- JDK 动态代理实现及原理解析
- 线程池的实现原理
- Android视频播放器屏幕左侧边随手指上下滑动亮度调节变暗变亮原理实现(2):后续改进
- CA认证原理以及实现(上)