数据挖掘有哪些算法
2015-09-04 15:10
246 查看
1、分类(预测离散值输出):首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。——判断肿瘤良性/恶性
分类算法:决策树、逻辑回归、贝叶斯分类
2、聚类(Clustering)将数据分组成为多个集群(Cluster),在同一个集群内的对象之间具有较高的相似度,不同类之间的对象差别较大。聚类分析要解决的问题是将数据分成内部高内聚,外部低耦合的集合,这样对相似的事物进行分析就会更有针对性。——市场划分;社交网络分析;天文数据分析;
聚类算法:
l 划分法(K-means算法、K-methods算法、CLARANS算法);
l 层次法(BIRCH算法、CURE算法、CHAMELEON算法等)
3、预测:将已有数据和模型用于对未知变量的预言,目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道语言准确性是多少。
预测算法:
l 回归分析(预测连续值输出:简单线性回归、多元线性回归、非线性回归)——房价预测;
l 时间序列分析
4、关联:关联规则(Association Rules)反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物能够通过其他事物预测到。关联分析要解决的问题是通过算法找出隐含在数据中的关联,比如买尿布的人大部分也买啤酒,买啤酒的人大部分也买花生米,有了关联就可以做针对性的广告或者商业分析(医生对患者病情分析)
定义:支持度;关联规则;置信度
!!分类与聚类区别:分类属于监督学习,即基于训练集对数据进行预测,训练集中的每个数据都有正确答案。而聚类属于非监督学习,即只给出数据集,没有其他特征信息,需要我们从数据中找到某种结构或特征。
分类算法:决策树、逻辑回归、贝叶斯分类
2、聚类(Clustering)将数据分组成为多个集群(Cluster),在同一个集群内的对象之间具有较高的相似度,不同类之间的对象差别较大。聚类分析要解决的问题是将数据分成内部高内聚,外部低耦合的集合,这样对相似的事物进行分析就会更有针对性。——市场划分;社交网络分析;天文数据分析;
聚类算法:
l 划分法(K-means算法、K-methods算法、CLARANS算法);
l 层次法(BIRCH算法、CURE算法、CHAMELEON算法等)
3、预测:将已有数据和模型用于对未知变量的预言,目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道语言准确性是多少。
预测算法:
l 回归分析(预测连续值输出:简单线性回归、多元线性回归、非线性回归)——房价预测;
l 时间序列分析
4、关联:关联规则(Association Rules)反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物能够通过其他事物预测到。关联分析要解决的问题是通过算法找出隐含在数据中的关联,比如买尿布的人大部分也买啤酒,买啤酒的人大部分也买花生米,有了关联就可以做针对性的广告或者商业分析(医生对患者病情分析)
定义:支持度;关联规则;置信度
!!分类与聚类区别:分类属于监督学习,即基于训练集对数据进行预测,训练集中的每个数据都有正确答案。而聚类属于非监督学习,即只给出数据集,没有其他特征信息,需要我们从数据中找到某种结构或特征。
相关文章推荐
- TCP/IP(1)基本概念
- Algorithms - Week 2-0 Stacks and Queues
- 我很喜欢电影背后这个看上去很精神分裂的故事,跟影片中那个盘根错节的故事相得益彰。好的艺术作品永远都不可能被简化成纬度单一的说教。
- 拷贝构造函数应用场景
- 项目如何脱离TFS 2010的管理
- 18.策略模式
- PHP循环遍历倒金字塔
- Algorithms - Week 1-1 Analysis of Algorithms
- HDU 5240 Exam (好水的题)
- 数据结构必须掌握 栈---压栈和出栈
- 百分比布局支持库 RelativeLayout和FrameLayout的尺寸用%来表示
- Ajax、json
- 自定义按钮~自适应布局~常见bug
- 使用Spark SQL 探索“全国失信人数据”
- iOS 文本与图片表情混排的实现
- SharePoint 2013 IT Professional —— Permissions
- Java Web 国际化
- HDU——2104 hide handkerchief
- 详解Oracle DELETE和TRUNCATE 的区别(摘)
- 关于Java中基于名字重用的几种形式的区别(覆写、隐藏、重载、遮蔽、遮掩)