深度学习数据集MNIST ImageNet COCO PASCAL VOC介绍
2017-04-18 12:14
876 查看
参考文档
深度学习数据集汇总介绍
1.
深度学习领域的“Hello World!”,入门必备!MNIST是一个手写数字数据库,它有60000个训练样本集和10000个测试样本集,每个样本图像的宽高为28*28。此数据集是以二进制存储的,不能直接以图像格式查看,不过很容易找到将其转换成图像格式的工具。
最早的深度卷积网络LeNet便是针对此数据集的,当前主流深度学习框架几乎无一例外将MNIST数据集的处理作为介绍及入门第一教程,其中Tensorflow关于MNIST的教程非常详细。数据集下载~12MB
1)非空的同义词集总数:21841
2)图像总数:14,197,122
3)边界框注释的图像数:1,034,908
4)具有SIFT特征的同义词集数:1000
5)具有SIFT特征的图像数:120万
Imagenet数据集是目前深度学习图像领域应用得非常多的一个领域,关于图像分类、定位、检测等研究工作大多基于此数据集展开。Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。数据集下载~1TB(ILSVRC2016比赛全部数据)
ImageNet是根据WordNet层次(目前只有名词)组织的一个图像数据库,其中每个节点的层次结构是由成千上万的图像描绘。目前,有平均每个节点超过五百的图像。我们希望对于研究人员,教育工作者,学生和所有分享我们对图片激情的人来说,ImageNet能成为一个有用的资源。
点击这里了解更多关于ImageNet,请点击这里加入ImageNet邮件列表。
COCO(Common Objects in Context)是一个新的图像识别、分割、和字幕数据集,它有如下特点:
1)对象分割
2)上下文识别
3)每个图像的多个对象
4)超过300000幅图像
5)超过200万个实例
6)80个对象类别
7)每个图像5个说明文字
8)100000人的关键点
COCO数据集由微软赞助,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述,COCO数据集的开源使得近两三年来图像分割语义理解取得了巨大的进展,也几乎成为了图像语义理解算法性能评价的“标准”数据集。数据集下载~40GB
4. PASCAL VOC
PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCAL VOC图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。PASCAL VOC挑战赛在2012年后便不再举办,但其数据集图像质量好,标注完备,非常适合用来测试算法性能。数据集下载~2GB
深度学习数据集汇总介绍
1.
MNIST
深度学习领域的“Hello World!”,入门必备!MNIST是一个手写数字数据库,它有60000个训练样本集和10000个测试样本集,每个样本图像的宽高为28*28。此数据集是以二进制存储的,不能直接以图像格式查看,不过很容易找到将其转换成图像格式的工具。最早的深度卷积网络LeNet便是针对此数据集的,当前主流深度学习框架几乎无一例外将MNIST数据集的处理作为介绍及入门第一教程,其中Tensorflow关于MNIST的教程非常详细。数据集下载~12MB
2. ImageNet
ImageNet数据集有1400多万幅图片,涵盖2万多个类别。其中有超过百万的图片有明确的类别标注和图像中物体位置的标注,相关信息如下:1)非空的同义词集总数:21841
2)图像总数:14,197,122
3)边界框注释的图像数:1,034,908
4)具有SIFT特征的同义词集数:1000
5)具有SIFT特征的图像数:120万
Imagenet数据集是目前深度学习图像领域应用得非常多的一个领域,关于图像分类、定位、检测等研究工作大多基于此数据集展开。Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。数据集下载~1TB(ILSVRC2016比赛全部数据)
ImageNet是根据WordNet层次(目前只有名词)组织的一个图像数据库,其中每个节点的层次结构是由成千上万的图像描绘。目前,有平均每个节点超过五百的图像。我们希望对于研究人员,教育工作者,学生和所有分享我们对图片激情的人来说,ImageNet能成为一个有用的资源。
点击这里了解更多关于ImageNet,请点击这里加入ImageNet邮件列表。
3. COCO
COCO(Common Objects in Context)是一个新的图像识别、分割、和字幕数据集,它有如下特点:
1)对象分割
2)上下文识别
3)每个图像的多个对象
4)超过300000幅图像
5)超过200万个实例
6)80个对象类别
7)每个图像5个说明文字
8)100000人的关键点
COCO数据集由微软赞助,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述,COCO数据集的开源使得近两三年来图像分割语义理解取得了巨大的进展,也几乎成为了图像语义理解算法性能评价的“标准”数据集。数据集下载~40GB
4. PASCAL VOC
PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCAL VOC图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。PASCAL VOC挑战赛在2012年后便不再举办,但其数据集图像质量好,标注完备,非常适合用来测试算法性能。数据集下载~2GB相关文章推荐
- 深度学习数据集MNIST ImageNet COCO PASCAL VOC介绍
- 【深度学习】在Mac下安装深度学习框架Caffe并测试Mnist数据集
- Pascal VOC 数据集介绍
- 深度学习数据集——MNIST
- 深度学习torch之四(基于mnist数据集的实战练习实例)
- 深度学习之路:(一)Keras中mnist数据集测试
- 深度学习3番外篇---mnist数据集格式及转换
- 深度学习对话系统理论篇--数据集和评价指标介绍
- 神经网络与深度学习 使用Python实现基于梯度下降算法的神经网络和自制仿MNIST数据集的手写数字分类可视化程序 web版本
- 深度学习文章2:使用MNIST数据集验证Caffe是否安装成功
- TensorFlow【深度学习】MNIST 视觉数据集 初级
- 第二课 深度学习的“hello world”——基于mnist数据集的手写数字识别
- 深度学习框架TensorFlow学习与应用(六)——卷积神经网络应用于MNIST数据集分类
- 深度学习入门教程UFLDL学习实验笔记二:使用向量化对MNIST数据集做稀疏自编码
- 深度学习对话系统理论篇--数据集和评价指标介绍
- Keras_深度学习_MNIST数据集手写数字识别之各种调参
- [置顶] 介绍| 深度学习数据集标注工具
- 介绍Pascal VOC数据集:
- 神经网络与深度学习 1.6 使用Python实现基于梯度下降算法的神经网络和MNIST数据集的手写数字分类程序
- Pascal VOC 数据集介绍