您的位置：首页 > 其它

Theano学习笔记（二）——逻辑回归函数解析

2015-12-02 22:56 169 查看

有了前面的准备，可以用Theano实现一个逻辑回归程序，逻辑回归是典型的有监督学习。

为了形象，这里我们假设分类任务是区分人与狗的照片。

首先是生成随机数对象

[python] view plain copy

importnumpy

importtheano

importtheano.tensor as T

rng= numpy.random

数据初始化

有400张照片，这些照片不是人的就是狗的。

每张照片是28*28=784的维度。

D[0]是训练集，是个400*784的矩阵，每一行都是一张照片。

D[1]是每张照片对应的标签，用来记录这张照片是人还是狗。

training_steps是迭代上限。

[python] view plain copy

N= 400

feats= 784

D= (rng.randn(N, feats), rng.randint(size=N, low=0, high=2))

training_steps= 10000

[python] view plain copy

#Declare Theano symbolic variables

x= T.matrix("x")

y= T.vector("y")

w= theano.shared(rng.randn(feats), name="w")

b= theano.shared(0., name="b")

print"Initial model:"

printw.get_value(), b.get_value()

x是输入的训练集，是个矩阵，把D[0]赋值给它。

y是标签，是个列向量，400个样本所以有400维。把D[1]赋给它。

w是权重列向量，维数为图像的尺寸784维。

b是偏倚项向量，初始值都是0，这里没写成向量是因为之后要广播形式。

[python] view plain copy

#Construct Theano expression graph

p_1= 1 / (1 + T.exp(-T.dot(x, w) - b)) #Probability that target = 1

prediction= p_1 > 0.5 # Theprediction thresholded

xent= -y * T.log(p_1) - (1-y) * T.log(1-p_1) # Cross-entropy loss function

cost= xent.mean() + 0.01 * (w ** 2).sum()# The cost to minimize

gw,gb = T.grad(cost, [w, b]) #Compute the gradient of the cost

# (we shall return to this in a

#following section of this tutorial)

这里是函数的主干部分，涉及到3个公式

1.判定函数

${h_\theta }\left( x \right) = \frac{1}{{I + {e^{ - {\theta ^T}X}}}}$

2.代价函数

$Cost\left( {{h_\theta }\left( x \right),y} \right) = \left\{ \begin{array}{r}\begin{array}{*{20}{c}}{ - \log \left( {{h_\theta }\left( x \right)} \right)}&{\begin{array}{*{20}{c}}{if}&{y = 1}\end{array}}\end{array}\\\begin{array}{*{20}{c}}{ - \log \left( {1 - {h_\theta }\left( x \right)} \right)}&{\begin{array}{*{20}{c}}{if}&{y = 0}\end{array}}\end{array}\end{array} \right.$

3.总目标函数

$J\left( \theta \right) = - \frac{1}{m}\left[ {\sum\limits_{i = 1}^m {\left( {{y^{\left( i \right)}}\log {h_\theta }\left( {{x^{\left( i \right)}}} \right) + \left( {1 - {y^{\left( i \right)}}} \right)\log \left( {1 - {h_\theta }\left( {{x^{\left( i \right)}}} \right)} \right)} \right)} } \right] + \frac{\lambda }{2}\sum\limits_{i = 1}^m {W_i^2}$

第二项是权重衰减项，减小权重的幅度，用来防止过拟合的。

[python] view plain copy

#Compile

train= theano.function(

inputs=[x,y],

outputs=[prediction, xent],

updates=((w, w - 0.1 * gw), (b, b -0.1 * gb)))

predict= theano.function(inputs=[x], outputs=prediction)

构造预测和训练函数。

[python] view plain copy

#Train

fori in range(training_steps):

pred,err = train(D[0], D[1])

print"Final model:"

printw.get_value(), b.get_value()

print"target values for D:", D[1]

print"prediction on D:", predict(D[0])

这里算过之后发现，经过10000次训练，预测结果与标签已经完全相同了。

Theano学习笔记（二）——逻辑回归函数解析

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航