数据挖掘流程
2018-09-26 22:44
211 查看
数据挖掘流程:
(一)数据读取:
- 读取数据,并进行展示
- 统计数据各项指标
- 明确数据规模与要完成任务
(二)特征理解分析
- 单特征分析,逐个变量分析其对结果的影响
- 多变量统计分析,综合考虑多种情况影响
- 统计绘图得出结论
(三)数据清洗与预处理
- 对缺失值进行填充
- 特征标准化/归一化
- 筛选有价值的特征
- 分析特征之间的相关性
注意:数据挖掘80%的时间用于数据清洗。
(四)建立模型
- 特征数据与标签准备
- 数据集切分
- 多种建模算法对比
- 集成策略等方案改进
数据挖掘案例流程github地址:
相关文章推荐
- CRISP-DM (cross-industry standard process for data mining) 跨行业数据挖掘标准流程
- CRISP-DM(跨行业数据挖掘标准流程…
- sklearn做数据挖掘流程
- 数据挖掘的流程
- CRISP-DM数据挖掘标准化流程简析[一] project understanding部分(guide to Intelligent data analysis学习笔记)
- 数据挖掘标准流程CRISP-DM
- 数据挖掘的标准流程
- 数据挖掘流程
- 数据挖掘的流程
- 一分钟了解互联网数据挖掘流程
- 数据挖掘标准流程——CRISP-DM
- 数据挖掘步骤(流程)
- [DataAnalysis]数据挖掘——流程与思路
- 数据挖掘流程
- 数据挖掘在商业应用上的一个完整的流程
- 数据挖掘流程
- sklearn 的优雅数据挖掘流程
- 以虎嗅网4W+文章的文本挖掘为例,展现数据分析的一整套流程
- 笔试记录——OLAP是什么,数据仓库的四层结构,数据挖掘的流程
- Kaggle(1):数据挖掘的基本流程