数据挖掘学习笔记一:绪论
2016-11-06 18:03
211 查看
数据收集以及数据存储技术的提高,方便了人们收集到大量的数据,而传统的数据分析方法不能对海量的数据提取处有用的信息。再次背景下,新的数据挖掘技术诞生。数据挖掘作为一种技术,是将传统的数据分析方法与处理大量数据的复杂算法相结合。
数据挖掘在商业以及医学、科学及工程中有很重要的运用。
一、什么是数据挖掘
数据是在大型的数据存储库中,自动发现有用信息的过程。数据挖掘技术可以识别数据中有用的位置模式,可以用来预测未来结果。
并不是所有的信息发现任务都是数据挖掘,在数据库中检索信息是属于数据检索。
数据挖掘是数据库中知识发现中不可缺少的一部分。从数据预处理到数据处理再到数据的后处理。
数据预处理的目的是将未加工的数据转换程适合分析的数据形式。
结束数据循环通常需要将数据挖掘中的结果集成到决策支持系统中。
二、数据挖掘需要解决什么问题
可伸缩性
高维性
异种数据和复杂数据
数据的所有权与分布
非传统的分析
三、数据挖掘任务
预测任务:根据其他属性值,预测特定属性值
描述任务:到处概括数据中潜在的联系的模式
预测建模
聚类分析
关联分析
异常检测
数据挖掘在商业以及医学、科学及工程中有很重要的运用。
一、什么是数据挖掘
数据是在大型的数据存储库中,自动发现有用信息的过程。数据挖掘技术可以识别数据中有用的位置模式,可以用来预测未来结果。
并不是所有的信息发现任务都是数据挖掘,在数据库中检索信息是属于数据检索。
数据挖掘是数据库中知识发现中不可缺少的一部分。从数据预处理到数据处理再到数据的后处理。
数据预处理的目的是将未加工的数据转换程适合分析的数据形式。
结束数据循环通常需要将数据挖掘中的结果集成到决策支持系统中。
二、数据挖掘需要解决什么问题
可伸缩性
高维性
异种数据和复杂数据
数据的所有权与分布
非传统的分析
三、数据挖掘任务
预测任务:根据其他属性值,预测特定属性值
描述任务:到处概括数据中潜在的联系的模式
预测建模
聚类分析
关联分析
异常检测
相关文章推荐
- 数据挖掘原理学习笔记【1】 绪论
- 数据挖掘学习笔记:分类、统计学习
- <学习笔记4>数据挖掘原理与运用-sql server2008 数据库
- 《python数据分析和数据挖掘》——ID3决策树学习笔记
- python数据分析与挖掘学习笔记(3)_小说文本数据挖掘part2
- 数据挖掘学习笔记(三)
- 数据挖掘学习笔记:关联规则3
- SQL SERVER 2005 数据挖掘与商业智能完全解决方案---学习笔记(三)
- 数据挖掘学习笔记二
- 数据挖掘学习笔记:数据特征化和数据区分
- python数据挖掘学习笔记】十四.Scipy调用curve_fit实现曲线拟合
- R语言与数据挖掘学习笔记(常用的包)
- 数据挖掘之Adaboost学习笔记
- [数据挖掘课程笔记]无监督学习——聚类(clustering)
- SQL SERVER 2005 数据挖掘与商业智能完全解决方案---学习笔记(二)
- 数据挖掘学习笔记--决策树C4.5
- R语言与数据挖掘学习笔记(1):数据挖掘相关包的介绍
- 学习笔记——数据挖掘过程与方法 Data Mining
- 大数据学习笔记之四十 数据挖掘算法之预测建模关于决策树模型的介绍
- R语言与数据挖掘学习笔记(常用的包)