机器学习的偏差-方差分解
2018-02-26 12:08
351 查看
假设样本变量为 XX ,它的标签 YY 为 XX 的函数 Y=f(X)+ϵY=f(X)+ϵ 。其中为 ϵϵ 机器学习模型学习不到的噪音。
对于机器学习模型 M,M, 假设训练后,对 XX 的预测值为 XX 的函数 f^(X)f^(X) 。
对于一个测试集中的样本点 xx ,它的标签 y=f(x)+ϵy=f(x)+ϵ
记 f=f(x),f=f(x),
假设 Eϵ=0,Varϵ=σ2Eϵ=0,Varϵ=σ2
使用不同的训练集对 MM 进行多次训练,每次训练后都记录在点 xx 的预测值 f^(x)f^(x) 。
记 f^=f^(x),f^=f^(x), 则可把 f^f^ 视为随机变量。
于是均方误差 (f^−y)2(f^−y)2 是随机变量 f^,ϵf^,ϵ 的函数,它期望值为:
E(f^−y)2=(Bias)2+Varf^+σ2E(f^−y)2=(Bias)2+Varf^+σ2
其中 Bias=Ef^−fBias=Ef^−f
Varf^=E(f^−Ef^)2Varf^=E(f^−Ef^)2
Eϵ2=(Eϵ)2+Varϵ=Varϵ=σ2Eϵ2=(Eϵ)2+Varϵ=Varϵ=σ2
E(f^−f)2=E(f^−Ef^+Ef^−f)2E(f^−f)2=E(f^−Ef^+Ef^−f)2
=E(f^−Ef^)2+(Ef^−f)2+2E(f^−Ef^)⋅(Ef^−f)=E(f^−Ef^)2+(Ef^−f)2+2E(f^−Ef^)⋅(Ef^−f)
=E(Ef^−f)2+E(f^−Ef^)2=E(Ef^−f)2+E(f^−Ef^)2
=(Bias)2+Varf^=(Bias)2+Varf^
因此 E(f^−y)2=E(f^−f−ϵ)2E(f^−y)2=E(f^−f−ϵ)2
=E(f^−f)2+Eϵ2−2E(f^−f)Eϵ=E(f^−f)2+Eϵ2−2E(f^−f)Eϵ
=Eϵ2+E(f^−f)2=Eϵ2+E(f^−f)2
=σ2+(Bias)2+Varf^=σ2+(Bias)2+Varf^
Bias–variance tradeoff
对于机器学习模型 M,M, 假设训练后,对 XX 的预测值为 XX 的函数 f^(X)f^(X) 。
对于一个测试集中的样本点 xx ,它的标签 y=f(x)+ϵy=f(x)+ϵ
记 f=f(x),f=f(x),
假设 Eϵ=0,Varϵ=σ2Eϵ=0,Varϵ=σ2
使用不同的训练集对 MM 进行多次训练,每次训练后都记录在点 xx 的预测值 f^(x)f^(x) 。
记 f^=f^(x),f^=f^(x), 则可把 f^f^ 视为随机变量。
于是均方误差 (f^−y)2(f^−y)2 是随机变量 f^,ϵf^,ϵ 的函数,它期望值为:
E(f^−y)2=(Bias)2+Varf^+σ2E(f^−y)2=(Bias)2+Varf^+σ2
其中 Bias=Ef^−fBias=Ef^−f
Varf^=E(f^−Ef^)2Varf^=E(f^−Ef^)2
证明
Ey=E(f+ϵ)=fEy=E(f+ϵ)=fEϵ2=(Eϵ)2+Varϵ=Varϵ=σ2Eϵ2=(Eϵ)2+Varϵ=Varϵ=σ2
E(f^−f)2=E(f^−Ef^+Ef^−f)2E(f^−f)2=E(f^−Ef^+Ef^−f)2
=E(f^−Ef^)2+(Ef^−f)2+2E(f^−Ef^)⋅(Ef^−f)=E(f^−Ef^)2+(Ef^−f)2+2E(f^−Ef^)⋅(Ef^−f)
=E(Ef^−f)2+E(f^−Ef^)2=E(Ef^−f)2+E(f^−Ef^)2
=(Bias)2+Varf^=(Bias)2+Varf^
因此 E(f^−y)2=E(f^−f−ϵ)2E(f^−y)2=E(f^−f−ϵ)2
=E(f^−f)2+Eϵ2−2E(f^−f)Eϵ=E(f^−f)2+Eϵ2−2E(f^−f)Eϵ
=Eϵ2+E(f^−f)2=Eϵ2+E(f^−f)2
=σ2+(Bias)2+Varf^=σ2+(Bias)2+Varf^
References
Understanding the Bias-Variance TradeoffBias–variance tradeoff
相关文章推荐
- 【机器学习-西瓜书】二、偏差-方差分解;泛化误差
- 机器学习中的误差(Error)、偏差(Bias)与方差(Variance)
- 机器学习中的数学(2)-线性回归,偏差、方差权衡
- 机器学习中的数学(2)-线性回归,偏差、方差权衡
- 机器学习中的偏差(Bias)与方差(Variance)
- 机器学习中的数学(2)-线性回归,偏差、方差权衡
- 机器学习中的数学(2)-线性回归,偏差、方差权衡
- 偏差-方差分解 Bias-Variance Decomposition
- 【机器学习】评价指标 - 偏差与方差
- 加州理工学院公开课:机器学习与数据挖掘_偏差与方差权衡(第八课)
- 【机器学习】【基本理论】偏差、方差、这规则化、交叉检验
- 机器学习:方差Variance与偏差Bias
- 机器学习中的偏差(bias)和方差(variance)
- 偏差方差分解
- 机器学习中的偏差和方差
- 机器学习中的数学(2)-线性回归,偏差、方差权衡
- 机器学习:Bias(偏差),Error(误差),和Variance(方差)
- 机器学习中偏差和方差有什么区别?
- 机器学习中的数学(2)-线性回归,偏差、方差权衡
- 机器学习中的偏差和方差