Weka学习之关联规则分析
2013-12-16 11:24
148 查看
步骤:
(一) 选择数据源
(二)选择要分析的字段
(三)选择需要的关联规则算法
(四)点击start运行
(五) 分析结果
算法选择:
Apriori算法参数含义
1.car:如果设为真,则会挖掘类关联规则而不是全局关联规则。
2.classindex: 类属性索引。如果设置为-1,最后的属性被当做类属性。
3.delta: 以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。
4.lowerBoundMinSupport: 最小支持度下界。
5.metricType: 度量类型,设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(leverage),确信度(conviction)。
在 Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度,它们分别是:
a)Lift : P(A,B)/(P(A)P(B)) Lift=1时表示A和B独立。这个数越大(>1),越表明A和B存在于一个购物篮中不是偶然现象,有较强的关联度.
b)Leverage :P(A,B)-P(A)P(B)
Leverage=0时A和B独立,Leverage越大A和B的关系越密切
c) Conviction:P(A)P(!B)/P(A,!B) (!B表示B没有发生) Conviction也是用来衡量A和B的独立性。从它和lift的关系(对B取反,代入Lift公式后求倒数)可以看出,这个值越大, A、B越关联。
6.minMtric :度量的最小值。
7.numRules: 要发现的规则数。
8.outputItemSets: 如果设置为真,会在结果中输出项集。
9.removeAllMissingCols: 移除全部为缺省值的列。
10.significanceLevel :重要程度。重要性测试(仅用于置信度)。
11.upperBoundMinSupport: 最小支持度上界。 从这个值开始迭代减小最小支持度。
12.verbose: 如果设置为真,则算法会以冗余模式运行。
FPgrowph决策树算法
FP的全称是Frequent Pattern,在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快整个挖掘过程。
下一篇:
/article/5280813.html
(一) 选择数据源
(二)选择要分析的字段
(三)选择需要的关联规则算法
(四)点击start运行
(五) 分析结果
算法选择:
Apriori算法参数含义
1.car:如果设为真,则会挖掘类关联规则而不是全局关联规则。
2.classindex: 类属性索引。如果设置为-1,最后的属性被当做类属性。
3.delta: 以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。
4.lowerBoundMinSupport: 最小支持度下界。
5.metricType: 度量类型,设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(leverage),确信度(conviction)。
在 Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度,它们分别是:
a)Lift : P(A,B)/(P(A)P(B)) Lift=1时表示A和B独立。这个数越大(>1),越表明A和B存在于一个购物篮中不是偶然现象,有较强的关联度.
b)Leverage :P(A,B)-P(A)P(B)
Leverage=0时A和B独立,Leverage越大A和B的关系越密切
c) Conviction:P(A)P(!B)/P(A,!B) (!B表示B没有发生) Conviction也是用来衡量A和B的独立性。从它和lift的关系(对B取反,代入Lift公式后求倒数)可以看出,这个值越大, A、B越关联。
6.minMtric :度量的最小值。
7.numRules: 要发现的规则数。
8.outputItemSets: 如果设置为真,会在结果中输出项集。
9.removeAllMissingCols: 移除全部为缺省值的列。
10.significanceLevel :重要程度。重要性测试(仅用于置信度)。
11.upperBoundMinSupport: 最小支持度上界。 从这个值开始迭代减小最小支持度。
12.verbose: 如果设置为真,则算法会以冗余模式运行。
FPgrowph决策树算法
FP的全称是Frequent Pattern,在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快整个挖掘过程。
下一篇:
/article/5280813.html
相关文章推荐
- WEKA——关联规则(购物篮分析)
- Weka关联规则分析
- 数据挖掘:关联规则的apriori算法在weka的源码分析
- Weka 3.7.12源码学习、阅读、分析(1)
- Weka 3.7.12源码学习、阅读、分析(3)
- WEKA学习——CSVLoader 实例训练 和 源码分析
- Weka 3.7.12源码学习、阅读、分析(2)
- 数据挖掘学习02 - 使用weka的kmeans聚类分析
- Weka算法Classifier-meta-AdaBoostM1源码分析(二)
- 【学习笔记】Hibernate中多对多不用List而用Set的原因分析
- Netty学习之旅------源码分析Netty解码编码器实现原理
- 3.1 梯度下降法学习——梯度下降法的原理及分析
- 【数论学习】数论分析证明
- 一致性哈希算法学习及JAVA代码实现分析
- 学习CBAP业务分析是每个BA从业者的必经阶段——SITC上海信息化培训中心
- Cocos2d-x学习笔记(八)场景切换原理分析
- Openwrt 学习记录:Makefile 框架分析(二)
- 资金流学习-逐笔交易的分析
- jquery源码分析学习地址
- SAP ABAP/4学习--TABLEVIEW 的代码分析