《数据挖掘-概念与技术》之数据预处理
2015-05-06 16:30
218 查看
一.概述
1.数据质量三要素: 准确性,完整性,一致性
二.数据预处理的几种方法
1.数据清理
缺失值:1.使用属性的中心度量(如均值或中位数)填充缺失值。
2.使用与给定元组属于同一类的所有样本对应属性的均值或中位数。
3.使用最可能的值填充缺失值(最流行的策略)。使用回归,贝叶斯形式化方法的基于推理的工具或决策树归纳确定。
噪声数据:
2.数据集成
3.数据规约
4.数据变换
1.数据质量三要素: 准确性,完整性,一致性
二.数据预处理的几种方法
1.数据清理
缺失值:1.使用属性的中心度量(如均值或中位数)填充缺失值。
2.使用与给定元组属于同一类的所有样本对应属性的均值或中位数。
3.使用最可能的值填充缺失值(最流行的策略)。使用回归,贝叶斯形式化方法的基于推理的工具或决策树归纳确定。
噪声数据:
2.数据集成
3.数据规约
4.数据变换
相关文章推荐
- 《数据挖掘——概念和技术》笔记之数据预处理
- 数据挖掘概念与技术 第3章 数据预处理
- 《数据挖掘:概念与技术》-第3章:数据预处理
- 数据挖掘-概念与技术-第10章聚类作业题
- 数据挖掘概念和技术读书笔记
- 数据挖掘概念与技术(韩家伟)阅读笔记2
- 数据挖掘概念与技术(韩家伟)阅读笔记6--数据规约
- 数据挖掘概念与技术14--Star-Cubing
- 数据挖掘概念与技术作业(留复习用)
- 数据挖掘概念和技术读书笔记2
- 数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第二章课后习题答案
- 《数据挖掘——概念和技术》笔记之概论
- 数据挖掘概念与技术读书笔记(1)
- 数据挖掘概念与技术(韩家伟)阅读笔记3--数据清理
- 数据挖掘概念与技术10--数据仓库的系统结构
- 地震数据挖掘分析系统(云计算处理、智能挖掘技术)
- 数据挖掘概念与技术9--多维数据模型
- 【读书笔记-数据挖掘概念与技术】数据预处理
- 5.数据挖掘概念笔记——数据立方体技术
- 地震数据挖掘分析系统(云计算处理、智能挖掘技术)