您的位置:首页 > 运维架构

CS231n作业笔记2.3:优化算法Momentum, RMSProp, Adam

2016-12-29 21:13 489 查看

CS231n简介

详见 CS231n课程笔记1:Introduction

本文都是作者自己的思考,正确性未经过验证,欢迎指教。

作业笔记

本部分实现的是Momentum,RMSProb, Adam三种优化算法,优化算法是用于从随机点出发,逐渐找到局部最优点的算法。关于各种优化算法的详细介绍,请参考CS231n课程笔记6.1:优化迭代算法之SGD,Momentum,Netsterov Momentum,AdaGrad,RMSprop,Adam

1. Momentum

方程:

v = mu*v - learning_rate*dx
x += v


代码:

v = v*config['momentum']-config['learning_rate']*dw
next_w = w + v


2. RMSProp

方程:

cache = cache*decay_rate + (1-decay_rate)*dx*dx
x -= learning_rate * dx/(sqrt(cache)+1e-7)


代码:

config['cache'] = config['cache']*config['decay_rate'] + (1-config['decay_rate'])*dx*dx
next_x = x - config['learning_rate']*dx/np.sqrt(config['cache']+config['epsilon'])


3. Adam

此算法需要注意的是ppt中的方程是错误的,正确方法如下图,主要区别在于bias correction的部分,不更新m和v,详见Adam: A Method for Stochastic Optimization

还要注意t的更新,此部分也没有显示的写在ppt里。



代码:

m = config['m']*config['beta1']+(1-config['beta1'])*dx
v = config['v']*config['beta2']+(1-config['beta2'])*dx*dx
config['t'] += 1
mb = m / (1 - config['beta1']**config['t'])
vb = v / (1 - config['beta2']**config['t'])
next_x = x - config['learning_rate']*mb/(np.sqrt(vb)+config['epsilon'])
config['m'] = m
config['v'] = v
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  cs231n momentum RMSProp Adam
相关文章推荐