全球最大地标识别数据集问世:包含200万张图片和3万处地标
2018-03-02 00:00
1076 查看
安妮 编译自 Google Research Blog
量子位 出品 | 公众号 QbitAI今天,谷歌推出了目前世界上最大的人造和自然地标识别数据集Google-Landmarks。数据集中包含200万张图片,描述了3万处全球独特地标,量级是普通的数据集的30倍。
△ 数据集中地标的位置分布
谷歌路标识别挑战赛(内含数据集下载): https://www.kaggle.com/c/landmark-recognition-challenge谷歌路标检索挑战赛(内含数据集下载): https://www.kaggle.com/c/landmark-retrieval-challenge地标识别和其他问题比较大的区别在于,即使在一个大型标注过的数据集,对一个不太知名的地标也可能训练得不够。此外,由于地标建筑不会移动并且内部的变化非常小,因此,图像的拍摄条件,如遮挡、不同视角、天气和光线等因素决定了地标图像的变化。但其他的普通数据集(比如萌犬数据集),往往变化多样。这两个Kaggle挑战提供了标注数据,帮助研究人员解决这些问题。路别识别竞赛是在具有挑战性的测试图像数据集中,让参赛者构建识别正确地标的模型。而在路标检索挑战赛中,参与者需要检索包含相同地标的图像。
△ 数据集中部分地标建筑
加入社群量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot5入群;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请加小助手微信号qbitbot5,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
量子位 出品 | 公众号 QbitAI今天,谷歌推出了目前世界上最大的人造和自然地标识别数据集Google-Landmarks。数据集中包含200万张图片,描述了3万处全球独特地标,量级是普通的数据集的30倍。
△ 数据集中地标的位置分布
两场竞赛
和这个数据集一同推出的,还有两场相关的数据竞赛:地标识别(Landmark Recognition)挑战和地标检索(Landmark Retrieval)挑战。谷歌在博客中表示,这将成为Kaggle竞赛的赛题,也设有相应的奖金。这场竞赛的后续消息,还将出现在今年6月份的CVPR 2018会议的Landmarks workshop中。谷歌路标识别挑战赛(内含数据集下载): https://www.kaggle.com/c/landmark-recognition-challenge谷歌路标检索挑战赛(内含数据集下载): https://www.kaggle.com/c/landmark-retrieval-challenge地标识别和其他问题比较大的区别在于,即使在一个大型标注过的数据集,对一个不太知名的地标也可能训练得不够。此外,由于地标建筑不会移动并且内部的变化非常小,因此,图像的拍摄条件,如遮挡、不同视角、天气和光线等因素决定了地标图像的变化。但其他的普通数据集(比如萌犬数据集),往往变化多样。这两个Kaggle挑战提供了标注数据,帮助研究人员解决这些问题。路别识别竞赛是在具有挑战性的测试图像数据集中,让参赛者构建识别正确地标的模型。而在路标检索挑战赛中,参与者需要检索包含相同地标的图像。
△ 数据集中部分地标建筑
开源DELF
讲到这里还没完。为了刺激这个领域的研究,谷歌研究人员还开源了专注本地特征的描述符Deep Local Features(DELF)。关于DELF的论文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相于2016年,一个月前又进行了一次修改。论文地址:https://arxiv.org/abs/1612.06321DELF开源代码和数据集地址:https://github.com/tensorflow/models/tree/master/research/delf最后,附谷歌博客介绍地址:https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html— 完 —加入社群量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot5入群;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请加小助手微信号qbitbot5,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
相关文章推荐
- python爬取人脸识别图片数据集/python爬去图片/python爬虫
- MySql按字段分组取最大值记录 [此博文包含图片]
- 仿微博、微信QQ,包含展示动态(Feed)图片,和识别包含超链接、#字话题、@人的文本效果。
- 高通在obb分包的加载数据集失败,无法识别图片
- FBI拟斥10亿建全球最大公民特征识别数据库
- HZ偶尔会拿些专业问题来忽悠那些非计算机专业的同学。今天测试组开完会后,他又发话了:在古老的一维模式识别中,常常需要计算连续子向量的最大和,当向量全为正数的时候,问题很好解决。但是,如果向量中包含负数
- python爬取人脸识别图片数据集/python爬去图片/python爬虫
- PK/NN/*/SVM:实现手写数字识别(数据集50000张图片)比较3种算法神经网络、灰度平均值、SVM各自的准确率—Jason niu
- FBI拟斥10亿建全球最大公民特征识别数据库
- ORA此博文包含图片-12514 TNS 监听程序当前无法识别连接描述符中请求服务 的解决方法
- 全球最大图片交易网站是怎样炼成的?
- FBI拟斥10亿建全球最大公民特征识别数据库
- Python将自己的图片数据集导入h5py,做识别的预处理
- FBI拟斥10亿建全球最大公民特征识别数据库
- FBI拟斥10亿建全球最大公民特征识别数据库
- caffe 从mnsit示例到自己创建数据集再到识别手写图片
- python爬取人脸识别图片数据集/python爬去图片/python爬虫
- HZ偶尔会拿些专业问题来忽悠那些非计算机专业的同学。今天测试组开完会后,他又发话了:在古老的一维模式识别中,常常需要计算连续子向量的最大和,当向量全为正数的时候,问题很好解决。但是,如果向量中包含负数
- HZ偶尔会拿些专业问题来忽悠那些非计算机专业的同学。今天测试组开完会后,他又发话了:在古老的一维模式识别中,常常需要计算连续子向量的最大和,当向量全为正数的时候,问题很好解决。但是,如果向量中包含负数
- HZ偶尔会拿些专业问题来忽悠那些非计算机专业的同学。今天测试组开完会后,他又发话了:在古老的一维模式识别中,常常需要计算连续子向量的最大和,当向量全为正数的时候,问题很好解决。但是,如果向量中包含负数,是否应该包含某个负数,并期望旁边的正数会弥补它呢?例如:{6,-3,-2,7,-15,1,2,2},连续子向量的最大和为8(从第0个开始,到第3个为止)。你会不会被他忽悠住?