Tensorflow教程-MNIST 数据下载
2017-05-16 09:51
246 查看
源码:
MNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字,其中数字的范围从0到9.
![](http://wiki.jikexueyuan.com/project/tensorflow-zh/images/mnist_digits.png)
更多详情, 请参考 Chris Olah's visualizations of MNIST.
- 55000 张 训练图片, 5000 张 验证图片
- 10000 张 图片<a rel="nofollow" href="http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz" "="" style="box-sizing: border-box; color: rgb(45, 133, 202); text-decoration: none; background-color: transparent;">
在
文件夹的名字在
这些文件本身并没有使用标准的图片格式储存,并且需要使用
图片数据将被解压成2维的tensor:
从0到图片的像素上限值。
以
数字标签数据被解压称1维的tensor:
底层的源码将会执行下载、解压、重构图片和标签数据来组成以下的数据集对象:
执行
原文地址:btpeter 校对:waiwaizheng
上一篇: 偏微分方程下一篇: 总览
input_data.py下载用于训练和测试的MNIST数据集的源码
准备数据
MNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字,其中数字的范围从0到9.![](http://wiki.jikexueyuan.com/project/tensorflow-zh/images/mnist_digits.png)
更多详情, 请参考 Chris Olah's visualizations of MNIST.
下载
train-images-idx3-ubyte.gz训练集图片
- 55000 张 训练图片, 5000 张 验证图片
t10k-images-idx3-ubyte.gz测试集图片
- 10000 张 图片<a rel="nofollow" href="http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz" "="" style="box-sizing: border-box; color: rgb(45, 133, 202); text-decoration: none; background-color: transparent;">
t10k-labels-idx1-ubyte.gz测试集图片对应的数字标签
在
input_data.py文件中,
maybe_download()函数可以确保这些训练数据下载到本地文件夹中。
文件夹的名字在
fully_connected_feed.py文件的顶部由一个标记变量指定,你可以根据自己的需要进行修改。
解压 与 重构
这些文件本身并没有使用标准的图片格式储存,并且需要使用input_data.py文件中
extract_images()和
extract_labels()函数来手动解压(页面中有相关说明)。
图片数据将被解压成2维的tensor:
[image index, pixel index]其中每一项表示某一图片中特定像素的强度值, 范围从
[0, 255]到
[-0.5, 0.5]。 "image index"代表数据集中图片的编号, 从0到数据集的上限值。"pixel index"代表该图片中像素点得个数,
从0到图片的像素上限值。
以
train-*开头的文件中包括60000个样本,其中分割出55000个样本作为训练集,其余的5000个样本作为验证集。因为所有数据集中28x28像素的灰度图片的尺寸为784,所以训练集输出的tensor格式为
[55000, 784]。
数字标签数据被解压称1维的tensor:
[image index],它定义了每个样本数值的类别分类。对于训练集的标签来说,这个数据规模就是:
[55000]。
数据集 对象
底层的源码将会执行下载、解压、重构图片和标签数据来组成以下的数据集对象:数据集 | 目的 |
---|---|
data_sets.train | 55000 组 图片和标签, 用于训练。 |
data_sets.validation | 5000 组 图片和标签, 用于迭代验证训练的准确性。 |
data_sets.test | 10000 组 图片和标签, 用于最终测试训练的准确性。 |
read_data_sets()函数将会返回一个
DataSet实例,其中包含了以上三个数据集。函数
DataSet.next_batch()是用于获取以
batch_size为大小的一个元组,其中包含了一组图片和标签,该元组会被用于当前的TensorFlow运算会话中。
images_feed, labels_feed = data_set.next_batch(FLAGS.batch_size)
原文地址:btpeter 校对:waiwaizheng
上一篇: 偏微分方程下一篇: 总览
相关文章推荐
- tensorflow教程中的mnist数据下载脚本
- tensorflow教程中的mnist数据下载脚本
- TensorFlow官方文档MNIST 数据下载
- Ubuntu下Tensorflow加载MNIST数据集(数据下载和读取)
- Tensorflow深度学习入门——下载和读取MNIST数据
- tensorflow下载mnist数据时出错
- 神经网络 tensorflow教程 2.2 下载MNIST 数据集(保存所有图片)
- 4000 神经网络 tensorflow教程 2.2 下载MNIST 数据集 (自动版)
- TensorFlow教程01:针对机器学习初学者的MNIST实验——MNIST介绍
- 大数据Spark视频教程下载
- 数据挖掘视频教程全集下载
- tensorflow学习笔记三:实例数据下载与读取
- Android中使用DownloadManager类来管理数据下载的教程
- TensorFlow教程06:MNIST的CNN实现——源码和运行结果
- 使用python读取tensorflow实例中的MNIST模拟数据
- Tensorflow的MNIST进阶教程CNN网络参数理解
- [置顶] TensorFlow 入门之训练 MNIST 数据
- TensorFlow教程02:针对机器学习初学者的MNIST实验——Softmax回归
- 教程下载板块数据层完成!
- ASIHTTPRequest框架使用总结系列之阿堂教程4(下载数据)