偏差与方差(Bias and Variance)
2017-05-19 14:31
323 查看
1我们将从三个方面阐述偏差与方差。(Bias and Variance)
1.1概念性的定义
基于偏差的误差:所谓基于偏差的误差是我们模型预期的预测与我们将要预测的真实值之间的差值。偏差是用来衡量我们的模型的预测同真实值的差异。
基于方差的误差:基于方差的误差描述了一个模型对给定的数据进行预测的可变性。比如,当你多次重复构建完整模型的进程时,方差是在预测在模型的不同关系间变化的多少。
1.2图形上的定义
假设靶心是最适合给定数据的模型,离靶心越远,我们的预测就越糟糕。有时,我们对训练数据的预测结果更接近靶心,有时我们的结果相互分散。如下图:
![](https://img-blog.csdn.net/20141027201040080?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMzgwMjE4OA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
1.3数学上的定义
我们定义我们要预测的变量为Y,协变量为X,我们假设有Y=f(X)+ϵ,其中误差项服从均值为0的正态分布
![](https://img-blog.csdn.net/20141027201059361?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMzgwMjE4OA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
.
我们用线性回归或者别的模型来估计f(X) 为
![](https://img-blog.csdn.net/20141027201115648?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMzgwMjE4OA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
.其中,对x来说,误差为:
![](https://img-blog.csdn.net/20141027201130280?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMzgwMjE4OA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
用偏差和方差表述:
![](https://img-blog.csdn.net/20141027201140467?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMzgwMjE4OA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
最后一项为噪声,是无法通过模型降低的。
最后,关于过拟合和欠拟合(Over- and Under-Fitting)
我们用一个参数少的,简单的模型进行预测,会得到低方差,高偏差,通常会出现欠拟合,而我们用一个参数多的,复杂的模型进行预测,会得到高方差,低偏差,通常出现过拟合。下图描述了偏差与方差跟模型复杂度的关系:
![](https://img-blog.csdn.net/20141027201204772?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMzgwMjE4OA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
其中:
1.1概念性的定义
基于偏差的误差:所谓基于偏差的误差是我们模型预期的预测与我们将要预测的真实值之间的差值。偏差是用来衡量我们的模型的预测同真实值的差异。
基于方差的误差:基于方差的误差描述了一个模型对给定的数据进行预测的可变性。比如,当你多次重复构建完整模型的进程时,方差是在预测在模型的不同关系间变化的多少。
1.2图形上的定义
假设靶心是最适合给定数据的模型,离靶心越远,我们的预测就越糟糕。有时,我们对训练数据的预测结果更接近靶心,有时我们的结果相互分散。如下图:
1.3数学上的定义
我们定义我们要预测的变量为Y,协变量为X,我们假设有Y=f(X)+ϵ,其中误差项服从均值为0的正态分布
.
我们用线性回归或者别的模型来估计f(X) 为
.其中,对x来说,误差为:
用偏差和方差表述:
最后一项为噪声,是无法通过模型降低的。
最后,关于过拟合和欠拟合(Over- and Under-Fitting)
我们用一个参数少的,简单的模型进行预测,会得到低方差,高偏差,通常会出现欠拟合,而我们用一个参数多的,复杂的模型进行预测,会得到高方差,低偏差,通常出现过拟合。下图描述了偏差与方差跟模型复杂度的关系:
其中:
相关文章推荐
- 偏差与方差(Bias and Variance)
- 机器学习理论知识部分--偏差方差平衡(bias-variance tradeoff)
- 总结:Bias(偏差),Error(误差),Variance(方差)及CV(交叉验证)
- 偏差(Bias)-方差(Variance)权衡(tradeoff)
- 机器学习——偏差(bias),方差(variance),噪声(noise)
- 偏差(Bias)与方差(Variance)
- 机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系?
- 偏差-方差权衡(Bias-Variance Tradeoff)
- 模型的偏差bias以及方差variance
- 机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系?
- 机器学习中的偏差(Bias)与方差(Variance)
- Bias-Variance Tradeoff(权衡偏差与方差)
- 机器学习入门系列03,Error的来源:偏差和方差(bias 和 variance)
- 机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系?
- 机器学习:Bias(偏差),Error(误差),和Variance(方差)
- Bias and Variance 偏置和方差
- 机器学习方差和偏差权衡(Understanding the Bias-Variance Tradeoff)
- 机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系?(转)
- 机器学习入门系列03,Error的来源:偏差和方差(bias和variance)
- 机器学习中的偏差(bias)和方差(variance)