完整神经网络样例程序(TensorFlow,加入偏置项和relu激活函数)(源码)
2018-03-14 17:30
453 查看
# coding=utf-8
"""完整的神经网络解决二分类问题(加入偏置项和relu激活函数)"""
import tensorflow as tf
from numpy.random import RandomState
# 定义训练数据batch大小
batch_size = 8
# 定义神经网络的参数
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
biases1 = tf.Variable(tf.constant(0.1,shape=[3]))
biases2 = tf.Variable(tf.constant(0.1,shape=[1]))
# 在shape的一个维度上使用None可以方便使用不大的batch大小,在训练时需要把数据分
# 成比较小的batch,但是在测试时,可以一次性使用全部的数据。当数据集比较小时这样比较
# 方便测试,但数据集比价大时,将大量数据放入一个batch可能会导致内存溢出。
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')
# 定义神经网络前向传播的过程
a = tf.nn.relu(tf.matmul(x, w1)+biases1)
y = tf.nn.relu(tf.matmul(a, w2)+biases2)
# 定义损失函数和反向传播算法
cross_entropy = -tf.reduce_mean(
y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
# 通过随机数生成一个模型数据集(128行,两列)
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
# 定义规则来给出样本的标签。在这里所有x1+x2<1的样例都被认为是正样本(比如零件合格),
# 而其他为负样本(比如零件不合格)。和Tensorflow游乐场中的表示法不大一样的地方是,
# 这里使用0来表示负样本,1来表示正样本。大部分解决分类问题的神经网络都会采用0和1的表示方法。
Y = [[int(x1+x2 < 1)] for (x1, x2) in X ]
# 创建一个会话来运行Tensorflow程序
with tf.Session() as sess:
init_op = tf.global_variables_initializer()
# 初始化变量
sess.run(init_op)
print sess.run(w1)
print sess.run(w2)
print sess.run(biases1)
print sess.run(biases2)
'''在训练之前神经网络参数的值为:
'''
# 设定训练的轮数
STEPS = 5000
for i in range(STEPS):
# 每次选取batch_size个样本进行训练。
start = (i * batch_size) % dataset_size
end = min(start+batch_size, dataset_size)
# 通过选取的样本训练神经网络并更新参数。
sess.run(train_step,
feed_dict={x: X[start:end], y_: Y[start:end]})
if i == 0:#输出第一次取数据时x,a,y,y_的值
print sess.run(x,feed_dict={x: X[start:end]})
print sess.run(a,feed_dict={x: X[start:end]})
print sess.run(y,feed_dict={x: X[start:end]})
print sess.run(y_,feed_dict={y_: Y[start:end]})
if i % 1000 == 0:
#每隔一段时间计算在所有数据上的交叉熵并输出。
total_cross_entropy = sess.run(
cross_entropy, feed_dict={x: X, y_: Y})
print ("After %d training step(s), cross entropy on all data is % g" % (i, total_cross_entropy))
'''
输出结果:
'''
print sess.run(w1)
print sess.run(w2)
print sess.run(biases1)
print sess.run(biases2)
'''
在训练之后神经网络参数的值:
'''
#输出训练结束时各个量的值
print sess.run(x,feed_dict={x: X[start:end]})
print sess.run(a,feed_dict={x: X[start:end]})
print sess.run(y,feed_dict={x: X[start:end]})
print sess.run(y_,feed_dict={y_: Y[start:end]})
'''
上面的程序实现了训练神经网络的全部过程。从中可以总结出训练神经网络的过程可以分为以下3步:
1、定义神经网络的结构和前向传播的过程。
2、定义损失函数以及选择反向传播优化的算法。
3、生成会话(tf.Session)并且在训练数据上反复运行反向传播优化算法。
无论神经网络的结构如何变化,这3个步骤是不变的。
'''
"""完整的神经网络解决二分类问题(加入偏置项和relu激活函数)"""
import tensorflow as tf
from numpy.random import RandomState
# 定义训练数据batch大小
batch_size = 8
# 定义神经网络的参数
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
biases1 = tf.Variable(tf.constant(0.1,shape=[3]))
biases2 = tf.Variable(tf.constant(0.1,shape=[1]))
# 在shape的一个维度上使用None可以方便使用不大的batch大小,在训练时需要把数据分
# 成比较小的batch,但是在测试时,可以一次性使用全部的数据。当数据集比较小时这样比较
# 方便测试,但数据集比价大时,将大量数据放入一个batch可能会导致内存溢出。
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')
# 定义神经网络前向传播的过程
a = tf.nn.relu(tf.matmul(x, w1)+biases1)
y = tf.nn.relu(tf.matmul(a, w2)+biases2)
# 定义损失函数和反向传播算法
cross_entropy = -tf.reduce_mean(
y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
# 通过随机数生成一个模型数据集(128行,两列)
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
# 定义规则来给出样本的标签。在这里所有x1+x2<1的样例都被认为是正样本(比如零件合格),
# 而其他为负样本(比如零件不合格)。和Tensorflow游乐场中的表示法不大一样的地方是,
# 这里使用0来表示负样本,1来表示正样本。大部分解决分类问题的神经网络都会采用0和1的表示方法。
Y = [[int(x1+x2 < 1)] for (x1, x2) in X ]
# 创建一个会话来运行Tensorflow程序
with tf.Session() as sess:
init_op = tf.global_variables_initializer()
# 初始化变量
sess.run(init_op)
print sess.run(w1)
print sess.run(w2)
print sess.run(biases1)
print sess.run(biases2)
'''在训练之前神经网络参数的值为:
'''
# 设定训练的轮数
STEPS = 5000
for i in range(STEPS):
# 每次选取batch_size个样本进行训练。
start = (i * batch_size) % dataset_size
end = min(start+batch_size, dataset_size)
# 通过选取的样本训练神经网络并更新参数。
sess.run(train_step,
feed_dict={x: X[start:end], y_: Y[start:end]})
if i == 0:#输出第一次取数据时x,a,y,y_的值
print sess.run(x,feed_dict={x: X[start:end]})
print sess.run(a,feed_dict={x: X[start:end]})
print sess.run(y,feed_dict={x: X[start:end]})
print sess.run(y_,feed_dict={y_: Y[start:end]})
if i % 1000 == 0:
#每隔一段时间计算在所有数据上的交叉熵并输出。
total_cross_entropy = sess.run(
cross_entropy, feed_dict={x: X, y_: Y})
print ("After %d training step(s), cross entropy on all data is % g" % (i, total_cross_entropy))
'''
输出结果:
'''
print sess.run(w1)
print sess.run(w2)
print sess.run(biases1)
print sess.run(biases2)
'''
在训练之后神经网络参数的值:
'''
#输出训练结束时各个量的值
print sess.run(x,feed_dict={x: X[start:end]})
print sess.run(a,feed_dict={x: X[start:end]})
print sess.run(y,feed_dict={x: X[start:end]})
print sess.run(y_,feed_dict={y_: Y[start:end]})
'''
上面的程序实现了训练神经网络的全部过程。从中可以总结出训练神经网络的过程可以分为以下3步:
1、定义神经网络的结构和前向传播的过程。
2、定义损失函数以及选择反向传播优化的算法。
3、生成会话(tf.Session)并且在训练数据上反复运行反向传播优化算法。
无论神经网络的结构如何变化,这3个步骤是不变的。
'''
相关文章推荐
- 完整神经网络样例程序(TensorFlow)(源码)
- 第一个完整的神经网络样例程序
- tensorflow代码梳理2——完整的深层全连接神经网络样例
- 完整神经网络样例程序
- TensorFlow完整神经网络样例
- Tensorflow的入门级程序(神经网络mnist)
- 79、tensorflow计算一个五层神经网络的正则化损失系数、防止网络过拟合、正则化的思想就是在损失函数中加入刻画模型复杂程度的指标
- FLASH财神668网络棋牌游戏程序全部完整无错源码
- 79、tensorflow计算一个五层神经网络的正则化损失系数、防止网络过拟合、正则化的思想就是在损失函数中加入刻画模型复杂程度的指标
- 使用tensorflow实现全连接神经网络的简单示例,含源码
- 【TensorFlow实战】2.完整神经网络例子
- TensorFlow搭建神经网络最佳实践样例
- (Tensorflow之三)神经网络程序一
- Tensorflow小样例-神经网络
- 双向循环神经网络tensorflow实现
- 学习笔记TF052:卷积网络,神经网络发展,AlexNet的TensorFlow实现
- TensorFlow 深度学习框架 (2)-- 反向传播优化神经网络
- tensorflow:1)简单的神经网络
- tensorflow 神经网络基本使用
- 基于MNIST数据集使用TensorFlow训练一个包含一个隐含层的全连接神经网络