您的位置:首页 > 其它

《数据挖掘-概念与技术》之数据预处理

2015-05-06 16:30 218 查看
一.概述

1.数据质量三要素: 准确性,完整性,一致性



二.数据预处理的几种方法

1.数据清理

缺失值:1.使用属性的中心度量(如均值或中位数)填充缺失值。

2.使用与给定元组属于同一类的所有样本对应属性的均值或中位数。

3.使用最可能的值填充缺失值(最流行的策略)。使用回归,贝叶斯形式化方法的基于推理的工具或决策树归纳确定。

噪声数据:

2.数据集成

3.数据规约

4.数据变换
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: