回归和分类
2016-04-25 16:27
218 查看
在数据分析或者数据挖掘的时候,经常碰到回归和分类的问题,下面详细说下我对我这两概念的理解。
回归,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。通常Y1,Y2,…,Yi是因变量,X1、X2,…,Xk是自变量。
一直想不懂为什么叫回归,查了一下,大概可能是原因。
左图是一个房间大小和房价的数据图,右图是一个拟合图(图片来自http://blog.csdn.net/ppn029012/article/details/8775597)
之所以叫回归,是因为对于一个好的拟合曲线(如上图中的蓝线),所有的数据点都在想着拟合曲线靠拢的过程,可以想象成这些数据点向拟合曲线回归的过程。
从回归的定义也可以看出,回归倾向于一个X值对于一个Y值,这是和分类不同的地方。
这显然 是一个分类问题,但我们找到一个函数可以拟合这个分布,也就是可以用回归的方法的做分类
最后总结一下回归和分类的联系和区别:
给定一个样本特征 x, 我们希望预测其对应的属性值 y, 如果 y 是离散的, 那么这就是一个分类问题,反之,如果 y是连续的实数, 这就是一个回归问题。
也就是说,回归和分类不是绝对的分离,只是他们的目标不一样;在能找到合适的拟合曲线的情况下,分类问题可以转化为回归问题;
这也是为什么很多回归算法可以应用到分类的原因之一。
回归
一直对为什么叫回归很好奇,百度百科对回归的定义如下:回归,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。通常Y1,Y2,…,Yi是因变量,X1、X2,…,Xk是自变量。
一直想不懂为什么叫回归,查了一下,大概可能是原因。
左图是一个房间大小和房价的数据图,右图是一个拟合图(图片来自http://blog.csdn.net/ppn029012/article/details/8775597)
之所以叫回归,是因为对于一个好的拟合曲线(如上图中的蓝线),所有的数据点都在想着拟合曲线靠拢的过程,可以想象成这些数据点向拟合曲线回归的过程。
从回归的定义也可以看出,回归倾向于一个X值对于一个Y值,这是和分类不同的地方。
分类
如果能找到合适的拟合曲线或者拟合函数的话,分类问题也可以转成回归问题,比如下面的问题:这显然 是一个分类问题,但我们找到一个函数可以拟合这个分布,也就是可以用回归的方法的做分类
最后总结一下回归和分类的联系和区别:
给定一个样本特征 x, 我们希望预测其对应的属性值 y, 如果 y 是离散的, 那么这就是一个分类问题,反之,如果 y是连续的实数, 这就是一个回归问题。
也就是说,回归和分类不是绝对的分离,只是他们的目标不一样;在能找到合适的拟合曲线的情况下,分类问题可以转化为回归问题;
这也是为什么很多回归算法可以应用到分类的原因之一。
相关文章推荐
- YJAutoLayout
- HDU 1848 Fibonacci again and again Nim博弈变形
- Oracle-BPM(五)
- 导入Excel表格数据
- Android Https相关完全解析 当OkHttp遇到Https
- 用户态软件读写root文件方法
- Android应用分类和安全Domain
- CSS
- 面向对象的基础和设计模式
- 法线的变换的一些概念
- 手机设计尺寸 - iPhone界面尺寸
- 程序员的核心竞争力
- linux vim order
- Java对象初始化详解
- php获取下个月的今天
- Android开发改变状态栏的颜色
- memcached缓存数据库
- "php"正则表达式使用总结
- Android自动化测试之Monkey Test(一)
- Oracle与SQL Server数据库的异同