数据挖掘入门笔记
2018-02-20 00:00
197 查看
最近想学习一下数据挖掘的相关知识,从网上找了本《数据挖掘:概念与技术》来看看。打算写一些笔记,记录一下比较基础又重要的知识点。希望自己能把基础打牢一点,也希望能帮到一些跟我一样打算入门的小白。
1、数据挖掘可以看做信息技术自然进化的结果,它是基于数据库和数据管理产业不断发展的产物。
2、什么是数据挖掘?
通俗来说数据挖掘就是从大量数据中挖掘有趣模式和知识的过程。它是我们从大型数据集中提炼知识的一项基本步骤,全部步骤为:数据清洗(消除噪声和删除不一致数据)、数据集成(多种数据源可以组合在一起)、数据选择(从数据库中提取与分析任务相关的数据)、数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式)、数据挖掘(使用智能方式提取数据模式)、模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式)、知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。
3、数据库和数据仓库的区别
关系数据库是表的汇集,每个表中的数据都是高度结构化的结果,每条数据都由多个相同类型属性构成,因此使用起来可以十分方便的抓住数据的主要特征(是数据挖掘研究的一种主要数据形式)。数据仓库是一个从多个数据源收集的信息存储库,存放在一致的模式下,并且通常驻留在单个站点上。数据仓库通过数据清洗、变换、继承、装入和定期数据刷新来构造。
4、数据挖掘功能有哪些
存在大量数据挖掘功能,包括特征化与区分、频繁模式、关联和相关性挖掘、分类与回归、聚类分析、离群点分析等。数据挖掘功能用于指定数据挖掘任务发现的模式。一般而言,这些任务可以分为两类:描述性和预测性。描述性挖掘任务刻画目标数据中数据的一般性质。预测性挖掘任务在当前数据上进行归纳,以便做出预测。
------------------困了 明天继续---------------------
1、数据挖掘可以看做信息技术自然进化的结果,它是基于数据库和数据管理产业不断发展的产物。
2、什么是数据挖掘?
通俗来说数据挖掘就是从大量数据中挖掘有趣模式和知识的过程。它是我们从大型数据集中提炼知识的一项基本步骤,全部步骤为:数据清洗(消除噪声和删除不一致数据)、数据集成(多种数据源可以组合在一起)、数据选择(从数据库中提取与分析任务相关的数据)、数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式)、数据挖掘(使用智能方式提取数据模式)、模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式)、知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。
3、数据库和数据仓库的区别
关系数据库是表的汇集,每个表中的数据都是高度结构化的结果,每条数据都由多个相同类型属性构成,因此使用起来可以十分方便的抓住数据的主要特征(是数据挖掘研究的一种主要数据形式)。数据仓库是一个从多个数据源收集的信息存储库,存放在一致的模式下,并且通常驻留在单个站点上。数据仓库通过数据清洗、变换、继承、装入和定期数据刷新来构造。
4、数据挖掘功能有哪些
存在大量数据挖掘功能,包括特征化与区分、频繁模式、关联和相关性挖掘、分类与回归、聚类分析、离群点分析等。数据挖掘功能用于指定数据挖掘任务发现的模式。一般而言,这些任务可以分为两类:描述性和预测性。描述性挖掘任务刻画目标数据中数据的一般性质。预测性挖掘任务在当前数据上进行归纳,以便做出预测。
------------------困了 明天继续---------------------
相关文章推荐
- 《python数据挖掘入门与实践》笔记2
- 数据挖掘入门笔记(一)--认识数据
- 《python数据挖掘入门与实践》笔记1
- R语言入门视频笔记--10--数据挖掘
- 《python数据挖掘入门与实践》“电影推荐” 笔记3
- 程序员的机器学习入门笔记(三):数据挖掘中矩阵的那些事
- 数据挖掘学习笔记-入门基础篇
- 数据挖掘-推荐算法入门
- 数据挖掘比赛入门_以去年阿里天猫推荐比赛为例
- 数据挖掘笔记1
- 零基础入门-javaScript学习笔记之从基本数据类型学起
- 机器学习与数据挖掘入门指导
- (数据挖掘-入门-8)基于朴素贝叶斯的文本分类器
- torch入门笔记12:数据的预处理
- 《数据挖掘——概念和技术》笔记之数据预处理
- [数据挖掘]关联规则学习笔记
- 数据挖掘笔记一(Intro)
- 数据挖掘 pandas基础入门之查看数据
- iPhone开发入门笔记(三)—关于数据类型介绍 (NSObject)
- 机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)