您的位置:首页 > 其它

线性回归的损失函数为什么使用最小化均方误差

2017-11-21 16:45 211 查看
最小二乘问题的定义:

没有约束条件,目标函数是若干二次项的和,每一项的形式如aTix−biaiTx−bi,具体形式如下:

minimizef(x)=∑i=1k(aTix−bi)2minimizef(x)=∑i=1k(aiTx−bi)2

其中,A∈ℜk∗n,aTiA∈ℜk∗n,aiT是A的行向量,向量x∈ℜnx∈ℜn是优化变量

最优解是x=(ATA)−1ATBx=(ATA)−1ATB (求解过程见上一篇博文)

线性回归的损失函数costfunction

在线性回归问题中,假设模型为h(θ)=xTθ+bh(θ)=xTθ+b,其中xx为输入,b为偏置项;

损失函数的由来

假设模型h(θ)h(θ)与实际值yy误差ϵϵ服从正态分布(根据中心极限定理,多种未考虑到的其他因素的和符合正太分布),即:

h(θ)−y=ϵ∈N(0,σ2)h(θ)−y=ϵ∈N(0,σ2)

则根据输入样本xixi可以计算出误差ϵiϵi的概率为:

p(ϵi)=12π‾‾‾√σexp−ϵ2i2σ2p(ϵi)=12πσexp−ϵi22σ2

则可以得出似然公式:

l(θ)=∏i=1mp(ϵi)l(θ)=∏i=1mp(ϵi)

其中m为样本总数。则有以上公式可以写出log最大似然,即对l(θ)l(θ)整体取log,则:

L(θ)=logl(θ)=log(∏i=1mp(ϵi))=mlog12π‾‾‾√σ+∑im(−ϵ2i2σ2)L(θ)=logl(θ)=log(∏i=1mp(ϵi))=mlog12πσ+∑im(−ϵi22σ2)

则最大化似然公式L(θ)L(θ)相当于最小化f(θ)=12∑miϵ2i=12∑mi(xTiθ−yi)2f(θ)=12∑imϵi2=12∑im(xiTθ−yi)2,则变换为最小二乘问题。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: