人脸识别数据集之MS-Celeb-1M
2017-06-30 11:30
2271 查看
最近做人脸识别相关,需要用到MS-Celeb-1M数据集,
其微软介绍地址及数据集地址传送门。paper发在ECCV16上。
数据集格式为tsv,将tsv转换为jpg的方法,采用的openface的一个extract文件。
需要注意的是文件为python3格式的,如果使用的是Python2版本的,则需要更改下
然后在命令行中使用,
会在outputDir的同级目录生成jpg格式的文件目录。
将tsv格式转换为jpg之后为:
目录:
目录中图片
Top1M_MidList.Name.tsv中存储的是编号和对应的人名:
在经过两个小时左右的提取后,报错了,
目前已经提取了24106个文件夹,需要与name.tsv里面人名进行比对。
差异很大。
重新在windows下提取,提取结束后,
1980681张图片。
在Linux下提取,
与官网给出的数据一致。
其微软介绍地址及数据集地址传送门。paper发在ECCV16上。
数据集格式为tsv,将tsv转换为jpg的方法,采用的openface的一个extract文件。
需要注意的是文件为python3格式的,如果使用的是Python2版本的,则需要更改下
os.makedirs(saveDir,exist_ok=True),将其做点更改即可
if not os.path.exists(saveDir): os.makedir(saveDir)
然后在命令行中使用,
cd ~/extract.py python extract.py --outputDir=$outputDir $file.tsv
会在outputDir的同级目录生成jpg格式的文件目录。
将tsv格式转换为jpg之后为:
目录:
目录中图片
Top1M_MidList.Name.tsv中存储的是编号和对应的人名:
在经过两个小时左右的提取后,报错了,
目前已经提取了24106个文件夹,需要与name.tsv里面人名进行比对。
tsvName = r'E:\MsCelebV1-Faces\Top1M_MidList.Name.tsv' f = open(tsvName, 'r') nameList = [] for line in f: nameList.append(line.split('\t')[0]) print(len(list(set(nameList)))) # 1000000
差异很大。
重新在windows下提取,提取结束后,
1980681张图片。
在Linux下提取,
与官网给出的数据一致。
相关文章推荐
- Python3解析MS-Celeb-1M人脸数据集中的FaceImageCroppedWithAlignment.tsv文件
- 微软人脸数据库ms-celeb-1m清洗Python Coding #1
- python解析 MS-Celeb-1M 数据库
- 人脸识别数据集fetch_olivetti_faces()导入失败
- python爬取人脸识别图片数据集/python爬去图片/python爬虫
- 人脸识别 数据集 与竞赛
- gabor变换人脸识别的python实现,att_faces数据集平均识别率99%
- 数据挖掘—LDA,PCA特征提取降维与SVM多分类在人脸识别中的应用-数据集ORL
- python解析 MS-Celeb-1M 数据库
- Labeled Faces in the Wild 人脸识别数据集
- [置顶] Tensorflow学习笔记-基于LeNet5结构的ORL数据集人脸识别
- 人脸识别数据集 FACE RECOGNITION DATABASES
- python爬取人脸识别图片数据集/python爬去图片/python爬虫
- Labeled Faces in the Wild 人脸识别数据集 部分测试数据
- python爬取人脸识别图片数据集/python爬去图片/python爬虫
- Labeled Faces in the Wild 人脸识别数据集
- 人脸识别数据集 Face Databases
- AR Face Database 人脸识别数据集
- 解压下载的ms_celeb_1m数据集
- [人脸识别]使用VGG Face Model微调(Fine tune)自己的数据集