正规方程求解特征参数的推导过程
2017-10-12 21:48
381 查看
多变量线性回归代价函数为:
![](http://latex.codecogs.com/gif.latex?J(\theta&space;_{0},\theta&space;_{1},\cdots&space;,\theta&space;n)=\frac{1}{2m}\sum_{m}^{i=1}\left&space;(&space;h_{\theta}&space;\left&space;(&space;x^{i}&space;\right&space;)-y^{\left&space;(&space;i&space;\right&space;)}&space;\right&space;)^{2})
其中:
![](http://latex.codecogs.com/gif.latex?h_{\theta&space;}\left&space;(&space;x&space;\right&space;)=\theta&space;^{T}X=\theta&space;_{0}x_{0}+\theta&space;_{1}x_{1}+\cdots&space;+\theta&space;_{n}x_{n})
正规方程是通过求解下面的方程来找出使得代价函数最小的参数:
![](http://latex.codecogs.com/gif.latex?\frac{\partial&space;}{\partial&space;\theta&space;_{j}}J(\theta&space;_{j})=0)
设有m个训练实例,每个实例有n个特征,则训练实例集为:
![](https://img-blog.csdn.net/20171012215707830?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
其中
![](https://img-blog.csdn.net/20171012225259810?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
表示第i个实例第j个特征。
特征参数为:
![](https://img-blog.csdn.net/20171012214934634?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
输出变量为:
https://img-blog.csdn.net/20171012215016730?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" border="0" >
故代价函数为:
![](https://img-blog.csdn.net/20171012215052634?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
进行求导,等价于如下的形式:
![](https://img-blog.csdn.net/20171012215436517?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
其中第一项:
![](https://img-blog.csdn.net/20171012215948154?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
第二项:
![](https://img-blog.csdn.net/20171012220652858?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
该矩阵求导为分母布局下的标量/向量形式:
故有,
![](https://img-blog.csdn.net/20171012221234607?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
第三项:
![](https://img-blog.csdn.net/20171012222103070?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
该矩阵求导为分母布局下的标量/向量形式:
故有:
![](https://img-blog.csdn.net/20171012222353123?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
第四项:
![](https://img-blog.csdn.net/20171012222928070?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
其中
![](https://img-blog.csdn.net/20171012223026692?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
为标量,可看成一个常数。
该矩阵求导为分母布局下的标量/向量形式:
故有:
![](https://img-blog.csdn.net/20171012223156749?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
综上,正规方程为:
![](https://img-blog.csdn.net/20171012223451575?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hlbmxpbjQxMjA0MDUw/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
最终可得特征参数的表示:
其中:
正规方程是通过求解下面的方程来找出使得代价函数最小的参数:
设有m个训练实例,每个实例有n个特征,则训练实例集为:
其中
表示第i个实例第j个特征。
特征参数为:
输出变量为:
故代价函数为:
进行求导,等价于如下的形式:
其中第一项:
第二项:
该矩阵求导为分母布局下的标量/向量形式:
故有,
第三项:
该矩阵求导为分母布局下的标量/向量形式:
故有:
第四项:
其中
为标量,可看成一个常数。
该矩阵求导为分母布局下的标量/向量形式:
故有:
综上,正规方程为:
最终可得特征参数的表示:
相关文章推荐
- 正规方程推导过程
- SVM关于Platt文章中SMO求解参数的具体推导过程
- 支持向量机SVM推导及求解过程
- 机器学习:用正规方程法求解线性回归
- tensorflow 实现 正规方程求解线性回归
- 从零开始-Machine Learning学习笔记(3)-线性回归中的特征缩放与正规方程
- 语音特征参数MFCC计算的详细过程
- 语音特征参数MFCC提取过程详解
- Stanford机器学习---第二周.特征缩放、正规方程
- 语音特征参数MFCC计算的详细过程
- 语音特征MFCC的求解过程
- 语音特征参数MFCC计算的详细过程
- BP神经网络算法中各参数的推导过程
- 语音特征参数MFCC提取过程详解
- 正规方程推导
- 语音特征参数MFCC提取过程详解
- 机器学习(四)正规方程求解线性回归问题、正规方法与梯度法的优劣
- MFCC特征参数提取过程详解
- 滚动轴承特征频率计算推导过程
- RNN求解过程推导与实现