您的位置：首页 > 其它

[ML] AdaBoost算法

2016-05-21 19:26 225 查看

华电北风吹

日期：2016-05-21

AdaBoost算法通过提高被前一轮弱分类器错误分类样本的权值，降低那些被正确分类的样本的权重，然后构建一系列的分类器，通过分类器的加权投票做出最终决策。

一、AdaBoost算法

AdaBoost算法流程

——————————————————————————————————

对于输入样本(x(i),y(i)),i=1,2,...,m，设置弱分类器的个数N

step 1. 初始化训练样本权重w1,i=1m,i=1,2,...,m

step 2. 依次前向构建每个弱分类器k=1,2,...,N

　　　a. 根据当前每个样本的权重wk,i,i=1,2,...,m训练分类器Gk(x)使得分类器在样本权重集w上加权分类准确率最低。

　　　b. 计算分类器Gk(x)的分类准确率

　　　ek=∑mi=1wk,iI(Gk(x(i))≠y(i)))(1-1)

　　　c. 计算Gk(x)的系数αm

　　　αk=121−ekek(1-2)

　　　d. 更新样本权重

　　　wk+1,i=wk,iZkexp(−αky(i)Gk(x(i))),i=1,2,...,m(1-3)

　　　其中,Zk为归一化因子，保证所有样本加权和一直为1.

　　　Zk=∑mi=1wk,iexp(−αky(i)Gk(x(i)))(1-4)

step 3. 设分类器的线性组合为

f(x)=∑Nk=1αkGk(x)(1-5)

最终的判别函数为

G(x)=sign(f(x))=sign(∑Nk=1αkGk(x))(1-6)

——————————————————————————————————

关于上面AdaBoost算法里面涉及到的参数做一点简单说明。

1、由于这是训练数据集，所以对于任何一个分类器都应该有em≤12。

2、所有的αk,k=1,2,...,N的和不一定1.

3、对于权重更新方式(公式1-3)，意义在于分类正确的就以指数形式降低权重，分类错误就指数形式增加权重。

二、AdaBoost收敛性分析

AdaBoost算法通俗易懂，但是这样加权投票方式，不同于Bagging少数服从多数，深入理解的话肯定有疑问这样的加权能够提高分类准确率吗？现在我们来解决这个问题，随着弱分类器的个数增多，分类错误率单调递减。

1、AdaBoost的误差界满足如下不等式

1m∑mi=1I(G(x(i)))≠y(i)≤1m∑mi=1exp(−y(i)f(x(i)))=∏Nk=1Zk(2-1)

证明：

对于前半部分不等式部分的证明，exp(−y(i)f(x(i)))肯定大于等于0，并且当G(x(i)))≠y(i)时，有exp(−y(i)f(x(i)))≥1，所以前半部分证明完毕。

对于后半部分等式部分证明如下，

1m∑mi=1exp(−y(i)f(x(i)))

　　=1m∑mi=1exp(−∑Nk=1αky(i)Gk(x))

　　=1m∑mi=1∏Nk=1exp(−αky(i)Gk(x))

　　=∑mi=11m∏Nk=1exp(−αky(i)Gk(x))

　　=∑mi=1w1,i∏Nk=1exp(−αky(i)Gk(x))

(2-2)

由公式(1-3)可得

Zkwk+1,i=wk,iexp(−αky(i)Gk(x(i))),i=1,2,...,m(2-3)

将公式(2-3)递归带入公式(2-2)最后一项，便可得到公式(2-1)等式部分。至此，公式(2-1)证毕。

2、对于二分类问题的训练误差界有如下不等式

∏nk=1=∏nk=12ek(1−ek)−−−−−−−−√=∏nk=11−4γ2k−−−−−−√≤exp(−2∑nk=1γ2k)(2-4)

这里，γm=12−em

对于每一个的权重归一化因子Zk有，

Zk=∑mi=1wk,iexp(−αky(i))Gk(x(i))

　　=∑y(i)≠Gk(x(i))wk,ie−αk+∑y(i)=Gk(x(i))wk,ieαk

　　=(1−ek)e−αk+ekeαk

(2-5)

根据公式(2-1)知 Zk越小，错误率减小的越快，对上式求偏导，即可得到AdaBoost中的等式(1-2)，将等式(1-2)带入上式得，

Zk=∏nk=12ek(1−ek)−−−−−−−−√=∏nk=11−4γ2k−−−−−−√(2-6)

有

1−4γ2k−−−−−−√≤exp(−2γ2k)(2-7)

综上的可得到公式(2-4)。

并且，对于所有的γk若有γk≥γ，则有

1m∑mi=1I(G(x(i)))≠y(i)≤exp(−2Nγ2)(2-8)

公式(2-8)说明了，AdaBoost的误差以指数速率下降。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航