数据挖掘回顾九:回归算法之 模型树
2015-04-11 18:19
316 查看
1,模型树是一个混合算法。它首先是一个决策树算法,类似CART算法,而又不同于ID3算法或CART算法。传统的决策树算法,它们生成树的叶子节点上代表对一条数据的预测类别或预测目标值,而模型树上的叶子节点代表一个线性回归模型(最小二乘法)。对于一条测试数据,用这个线性回归模型计算出其预测类别或预测目标值。
2,也就是说,模型树在分裂的时候,选定切分特征和切分特征值的时候,其参考标准不再是CART算法中的总差异最优,而是线性回归模型作用于此子数据集模块产生的总误差最优。
3,模型树和回归树的处理数据的效果,一般来说比单独的线性回归模型要好。评价这几个算法优劣的标准是计算它们处理同一个数据集之后产生的各自的相关系数(即预测值和真实值之间的相关系数)的大小,相关系数(在0~1之间)越大,说明效果越好。
2,也就是说,模型树在分裂的时候,选定切分特征和切分特征值的时候,其参考标准不再是CART算法中的总差异最优,而是线性回归模型作用于此子数据集模块产生的总误差最优。
3,模型树和回归树的处理数据的效果,一般来说比单独的线性回归模型要好。评价这几个算法优劣的标准是计算它们处理同一个数据集之后产生的各自的相关系数(即预测值和真实值之间的相关系数)的大小,相关系数(在0~1之间)越大,说明效果越好。
相关文章推荐
- 大数据学习笔记之四十一 数据挖掘算法之预测建模的回归模型
- 数据挖掘回顾八:回归算法之 CART 算法 (回归树)
- 数据挖掘回顾七:回归算法之 线性回归
- 数据挖掘十大经典算法(10) CART: 分类与回归树
- 数据挖掘笔记(5)——数据处理、模型评估、可视化、十大经典算法
- 数据挖掘回顾五:分类算法之 支撑向量机(SVM) 算法
- 数据挖掘10大算法(8)--CART: 分类与回归树
- 数据挖掘回顾十:聚类算法之 K均值 (K-Means) 算法
- SQL Server 2005数据挖掘模型算法
- 数据挖掘十大经典算法(10) CART: 分类与回归树
- 数据挖掘回顾六:分类算法之 AdaBoost 集成算法
- 数据挖掘回顾二:分类算法之 决策树 算法 (ID3算法)
- 数据挖掘十大经典算法--CART: 分类与回归树
- 流挖掘算法介绍00:序——背景,流数据模型,近似算法评估,2-Universal 哈希
- 数据挖掘算法:线性回归深度剖析
- 数据挖掘——概念、模型和算法读书笔记
- 数据挖掘十大经典算法(10) CART: 分类与回归树
- [Matlab][数据挖掘算法][线性回归]
- 数据挖掘笔记-分类-回归算法-最小二乘法
- 数据挖掘回顾十一:关联规则挖掘之 Apirori 算法