您的位置:首页 > 大数据 > 人工智能

TensorFlow 之基于Inception V3的多标签分类 retrain

2017-08-08 22:20 731 查看
本文参考http://blog.csdn.net/Numeria/article/details/73604339

以及参考开源代码github链接: https://github.com/BartyzalRadek/Multi-label-Inception-net

一、准备训练数据

1.下载数据集

本文采用南京大学开源的数据集(点击下载:http://lamda.nju.edu.cn/files/miml-image-data.rar)

数据集中含有2000张图像,5个类,分别为 desert, mountains, sea, sunset , trees。

下载后包含两个压缩文件包:original.rar 以及 processed.rar

original.rar 中包含了2000张图像数据

示例如下:



processed.rar 中包含了图像对应的标签信息。

解压后为matlab文件格式。

本文需要的是标签矩阵 target.mat

示例如下:



2.转换标签文件

本文需将 target.mat 转换为txt格式的标签文件。

对于每一张图像 imagename.jpg, 对应生成一个 imagename.jpg.txt 的标签文件,文件中每一行为图像所含标签。

对于下图左边的图像,有标签 desert,mountains,则对应的标签文件内容如右边所示。



对于 target.mat 文件,转化的matlab脚本如下:

load('miml data.mat');
if ~exist('labeldir')
mkdir labeldir;
end
LabelDir='labeldir/';
for i = 1:2000
stri = num2str(i);
label_file_name = [LabelDir stri '.jpg.txt'];
fid = fopen(label_file_name,'w');
for j = 1:5
if targets(j,i)==1
fprintf(fid,'%s\n',class_name{j});
end
end
fclose(fid);
end


处理后的文件为:https://pan.baidu.com/s/1pLoeC6R

二、多标签分类

本文利用已训练好的权重,将最后一层替换为自定义的数据集的类别数,前面权值不变,只训练最后的一层。

1.将包含所有图像的文件夹放入 Multi-label-Inception-net/images 目录下

2.将labeldir目录拷贝到 Multi-label-Inception-net 目录下,改名为image_labels_dir(替换原同名目录)

3.运行 python 脚本

python retrain.py \
--bottleneck_dir=bottlenecks \
--how_many_training_steps 500 \
--model_dir=model_dir \
--output_graph=retrained_graph.pb \
--output_labels=retrained_labels.txt \
--summaries_dir=retrain_logs \
--image_dir=images


开始训练





训练完成



三、图像预测

利用脚本label_image.py 进行图像预测

调用如下:

python label_image.py images/image/4.jpg


得到输出结果:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: