您的位置：首页 > 大数据 > 人工智能

TensorFlow 之基于Inception V3的多标签分类 retrain

2017-08-08 22:20 731 查看

本文参考http://blog.csdn.net/Numeria/article/details/73604339

以及参考开源代码github链接: https://github.com/BartyzalRadek/Multi-label-Inception-net

一、准备训练数据

1.下载数据集

本文采用南京大学开源的数据集(点击下载:http://lamda.nju.edu.cn/files/miml-image-data.rar)

数据集中含有2000张图像，5个类，分别为 desert, mountains, sea, sunset , trees。

下载后包含两个压缩文件包:original.rar 以及 processed.rar

original.rar 中包含了2000张图像数据

示例如下：

processed.rar 中包含了图像对应的标签信息。

解压后为matlab文件格式。

本文需要的是标签矩阵 target.mat

示例如下：

2.转换标签文件

本文需将 target.mat 转换为txt格式的标签文件。

对于每一张图像 imagename.jpg, 对应生成一个 imagename.jpg.txt 的标签文件，文件中每一行为图像所含标签。

对于下图左边的图像，有标签 desert，mountains，则对应的标签文件内容如右边所示。

对于 target.mat 文件，转化的matlab脚本如下:

load('miml data.mat');
if ~exist('labeldir')
mkdir labeldir;
end
LabelDir='labeldir/';
for i = 1:2000
stri = num2str(i);
label_file_name = [LabelDir stri '.jpg.txt'];
fid = fopen(label_file_name,'w');
for j = 1:5
if targets(j,i)==1
fprintf(fid,'%s\n',class_name{j});
end
end
fclose(fid);
end

处理后的文件为:https://pan.baidu.com/s/1pLoeC6R

二、多标签分类

本文利用已训练好的权重，将最后一层替换为自定义的数据集的类别数，前面权值不变，只训练最后的一层。

1.将包含所有图像的文件夹放入 Multi-label-Inception-net/images 目录下

2.将labeldir目录拷贝到 Multi-label-Inception-net 目录下，改名为image_labels_dir(替换原同名目录)

3.运行 python 脚本

python retrain.py \
--bottleneck_dir=bottlenecks \
--how_many_training_steps 500 \
--model_dir=model_dir \
--output_graph=retrained_graph.pb \
--output_labels=retrained_labels.txt \
--summaries_dir=retrain_logs \
--image_dir=images

开始训练

训练完成

三、图像预测

利用脚本label_image.py 进行图像预测

调用如下：

python label_image.py images/image/4.jpg

得到输出结果：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航