最小二乘法
2016-07-06 20:28
429 查看
1. 最小二乘思想
在现实生活中存在着大量的数量之间的相关关系,比如人的身高和体重,钻石的价格和体积、克拉数,房价和房屋位置、面积、朝向等等。我们可以借助统计学中的回归模型,通过一些可以观测到的值(观测变量、自变量)来预测另外一些不容易观测到的值(响应变量、自变量)。如一元线性模型y=ax+b、二次函数模型y=ax2+bx+c等等。假设所建立的回归模型的一般形式为:y=f(x∣θ)+ε,其中Y称为响应变量、因变量,x称为解释变量或自变量。
f(x∣θ)+ε是一个由参数θ决定的回归函数,ε是一个不可观测的随机误差,而最小二乘法是目前最常用的,使误差达到最小的一种数学优化技术。
最小二乘的思想就是要使得观测点和估计点的距离的平方和达到最小。这里的“二乘”指的是用平方来度量观测点与估计点的远近(在古汉语中“平方”称为“二乘”),“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小。
2. 一元线性模型
对于最简单的一元线性模型:y=f(x∣θ)+ε,若(x1,y1),(x2,y2),...,(xn,yn)为收集到的观测数据,则应该用xi^估计xi,用yi^=f(xi^∣θ)+ε估计yi,这样点(xi^,yi^)就是点(xi,yi)的估计,它们之间距离的平方就是:(xi−xi^)2+(yi−yi^)2进而最小二乘估计量就是
Q(θ)=∑i=1n(xi−xi^)2+∑i=1n(yi−f(xi^∣θ))2(1)
达到最小值的参数。
特别当各个xi和相应的估计值相等,即xi^=xi时,最小二乘估计量就是使得
Q(θ)=∑i=1n(yi−f(xi^∣θ))2(2)
达到最小值的参数。
在实际应用中,人们常忽略“各个xi和相应的估计值相等”的条件,而把(2)式的最小值点称为参数θ的最小二乘估计量,其原因有二:其一是不知道最小二乘方法的原理;或是找不到估计量xi^的合理数学表达式,也就无法通过(1)式求最小二乘估计量,只好用(2)式的最小值点作为参数的估计。
由于我们这是一元线性模型,则f(xi^∣θ)=axi+b,此时目标函数变成了
Q(θ)=∑i=1n(yi−axi−b)2
我们通过使Q(θ)最小得到这条直线,这样一个求极值问题我们可以通过求Q(θ)对两个待估参数a^、b^的偏导得到:
⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪∂Q∂a^=2∑i=1n(yi−a^xi−b^)(−xi)=0∂Q∂b^=2∑i=1n(y−a^x−b^)(−1)=0
最后解得:
⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪a^=n∑ni=1xiyi−∑ni=1xi∑ni=1yin∑ni=1x2i−(∑ni=1xi)2b^=∑ni=1yi∑ni=1x2i−∑ni=1xi∑ni=1xiyin∑ni=1x2i−(∑ni=1xi)2
3. 拟合多项式曲线
设待拟合的曲线是:y=a0+a1x+a2x2+...+akxk
假设有n个观测点,由上面的理论可知各点到这条曲线的距离和为:
Q(θ)=∑i=1n[yi−(a0+a1xi+a2x2i+...+akxki)]2
求使得Q(θ)最小的a0、a1、...、ak值,对每一个a值求偏导:
∂Q(θ)∂a0=−2∑ni=1[yi−(a0+a1xi+a2x2i+…+akxki)]
∂Q(θ)∂a1=−2xi∑ni=1[yi−(a0+a1xi+a2x2i+…+akxki)]
∂Q(θ)∂a2=−2x2i∑ni=1[yi−(a0+a1xi+a2x2i+…+akxki)]
...
∂Q(θ)∂ak=−2xki∑ni=1[yi−(a0+a1xi+a2x2i+…+akxki)]
令上面的偏导值都为0,化简得:
na0+∑ni=1xia1+∑ni=1x2ia2+…+∑ni=1xkiak=∑ni=1yi
∑ni=1xia0+∑ni=1x2ia1+∑ni=1x3ia2+…+∑ni=1xk+1iak=∑ni=1xiyi
...
∑ni=1xkia0+∑ni=1xk+1ia1+∑ni=1xk+2ia2+…+∑ni=1x2k+1iak=∑ni=1xkiyi
将这组等式表示成矩阵形式:
⎛⎝⎜⎜⎜⎜⎜⎜⎜n∑ni=1xi∑ni=1x2i...∑ni=1xki∑ni=1xi∑ni=1x2i∑ni=1x3i...∑ni=1xk+1i............∑ni=1xki∑ni=1xk+1i∑ni=1xk+2i...∑ni=1x2ki⎞⎠⎟⎟⎟⎟⎟⎟⎟(a0 a1 a2 … ak)=(∑ni=1yi ∑ni=1xiyi ∑ni=1x2iyi … ∑ni=1xkiyi)
也就是XA=Y,解此矩阵方程求出A,即可得到最佳的拟合曲线。
公式格式出问题时请参考这里:文章备份
相关文章推荐
- 曲线拟合的开源组件 Math.NET Numerics
- 最小二乘法拟合多项式曲线原理
- 最小二乘法多项式曲线拟合
- 机器学习经典算法之-----最小二乘法
- 深入浅出了解最小二乘法及其应用
- 广义线性模型1
- 自动阈值分割-场景中直线个数的检测
- 逻辑回归详谈
- 线性模型(1) —— 多元线性回归
- 最小二乘法的一阶、二阶辨识系统
- 回归分析中的参数估计为何是最小二乘法(least squares),不是最小一乘法(least absolute deviations)
- 2 Linear Regression, Gradient descent
- 最小二乘法least square
- 最小二乘法的几何意义 – 巧妙记忆公式的方法
- 如何使用MATLAB绘制平滑曲线
- 最小二乘法以及最小二乘法和梯度下降法的区别
- 无约束最优化方法学习笔记
- 数据挖掘笔记-分类-回归算法-最小二乘法
- 最小二乘法拟合直线
- 线性回归之——最小二乘法 推荐