您的位置:首页 > 其它

人脸识别数据集之MS-Celeb-1M

2017-06-30 11:30 2271 查看
最近做人脸识别相关,需要用到MS-Celeb-1M数据集,

微软介绍地址数据集地址传送门。paper发在ECCV16上。

数据集格式为tsv,将tsv转换为jpg的方法,采用的openface的一个extract文件。

需要注意的是文件为python3格式的,如果使用的是Python2版本的,则需要更改下
os.makedirs(saveDir,exist_ok=True)
,将其做点更改即可

if not os.path.exists(saveDir):
os.makedir(saveDir)


然后在命令行中使用,

cd ~/extract.py
python extract.py --outputDir=$outputDir $file.tsv


会在outputDir的同级目录生成jpg格式的文件目录。

将tsv格式转换为jpg之后为:

目录:



目录中图片



Top1M_MidList.Name.tsv中存储的是编号和对应的人名:



在经过两个小时左右的提取后,报错了,



目前已经提取了24106个文件夹,需要与name.tsv里面人名进行比对。

tsvName = r'E:\MsCelebV1-Faces\Top1M_MidList.Name.tsv'
f = open(tsvName, 'r')
nameList = []
for line in f:
nameList.append(line.split('\t')[0])
print(len(list(set(nameList))))
# 1000000


差异很大。

重新在windows下提取,提取结束后,



1980681张图片。

在Linux下提取,



官网给出的数据一致。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数据集 人脸识别