您的位置：首页 > 其它

机器学习---局部加权回归

2015-09-21 11:16 555 查看

Locally weighted regression(英)

非参数学习算法

non-parametric learning algorithum

1过拟合和欠拟合

y=θ 0 +θ 1 x y = θ_0 + θ_1x

y=θ 0 +θ 1 x+θ 2 x 2 y = θ_0 +θ_1x +θ_2x^2

y=θ 0 +θ 1 x+θ 2 x 2 +θ 3 x 3 +θ 4 x 4 +θ 5 x 5 y = θ_0 +θ_1x +θ_2x^2+θ_3x^3+θ_4x^4+θ_5x^5

y=∑ 5 j=0 θ j x j y = \sum_{j=0}^5{θ_jx^j}

图片1为欠拟合—underfitting

图片3为过拟合—overfitting

2.局部加权回归

1.original linear regression algorithm

Fit θ to minimize ∑ i (y (i) −θ T x （i） ) 2 \sum_i(y^{(i)}-θ^Tx^{（i）})^2

Output θ T θ^T x.

2.locally weighted linear regression algorithm

Fit θ to minimize ∑ i w (i) (y (i) −θ T x （i） ) 2 \sum_iw^{(i)}(y^{(i)}-θ^Tx^{（i）})^2

Output θ T θ^T x

A fairly standard choice for the weight

w (i) =exp(−(x (i) −x) 2 2τ 2 ) w^{(i)}=exp({-{{(x^{(i)}-x)^2}\over2τ^2}})

τ—波长函数（bandwidth parameter）,非正式而言，它控制了权值随距离下降的速率

If |x (i) −x x^{(i)}-x | small ,then w (i) ≈1 w^{(i)}\approx 1

If |x (i) −x x^{(i)}-x | large ,then w (i) ≈0 w^{(i)}\approx 0

3.Probabilistric interpretation

y (i) =θ T x （i） +ε (i) y^{(i)}=θ^Tx^{（i）}+ε^{(i)}

ε (i) ε^{(i)}—error term(误差项)

ε (i) ε^{(i)}~N（0，σ 2 σ^2）

4.似然函数

likelihood

5.最大似然函数

maximum likelihood

取对数

log likelihood

想要取得最大值，减号的右侧需要取得最小值

右侧为cost function

3.Classification and logistic regression

垃圾邮件分类器

二分类问题（binary classification )

label

1 为positive class

0 为negative class

输入x (i) x^{(i)}可以是邮件部分分离出的某些特性（features）

当忽略掉y是离散值，由传统的线性回归算法预测y值。

h θ (x) h_θ(x)不应该比1大，或者比0小

选择了如下函数表达