Semi-supervised Learning for Network-Based Cardiac MR Image Segmentation文章解读
2017-10-27 21:27
1016 查看
本文针对全卷积神经网络有大量的参数,同时伴随着需要大量的训练数据集,然而由于医学图像的特殊性,如此大量的有标签数据不好提供,因此本文的贡献点之一是缓解了数据集少的问题。在公式2的目标函数中,通过引入右边第二项来定义这个半监督的优化问题;对于网络优化,这是本文的精髓所在:a.固定网络参数,采用此时的网络去评估未知数据的标签b.第二步,未知数据的标签采用第一步评估的结果固定,然后采用已标注的标签数据和这个未知数据的预测标签去训练网络 对于网络的训练,首先用已知标签数据对网络经过一定数量的迭代的网络参数作为网络的初始参数;步骤a的执行,本文增加了一个技巧就是通过引入一个条件随机场CRF来对softmax预测的概率图进行精细的分割,然后将其当做未知数据的标签;这样步骤1和2交替执行,网络参数在不断的优化,所以对未知数据的预测结果也会变得越来越好;经过一段时间的训练,网络能够达到一个较优的效果。
本文采用的网络基本架构是VGG-16,和DeepLab结构比较相似;主要的不同点就是DeepLab的输出是比原始图像8倍的下采样;同时网络中将不同层的多尺度特征map通过不同尺度的上采样来还原到原始图像的尺寸,然后将这些和原始图像同样尺寸特征map通过concatenation的关联层进行组合为单层输出,最后使用1*1的卷积核对该输出的map进行卷积来得到softmax的概率图谱;
摘要:
由于对于医学图像的标注费时费力,因此本文提出一种半监督的学习方法;
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/c14b0f06ef0750635b7de384e2583c93)
并且这个方法比最好的多图谱的方法分割效果和速度上都有改进;
1引言
我们知道全卷积神经网络有大量的参数,同时伴随着需要大量的训练数据集,然而由于医学图像的特殊性,如此大量的有标签数据不好提供,因此本文的贡献点之一是缓解了数据集少的问题。
1.1相关工作
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/4162a9cf6c60b165da84137a94b267ae)
现有研究针对这个问题的主要的训练方式(采用全监督的方式,用已有的训练数据训练网络,提取精细和粗略的特征,然后组合这些多尺度特征去逐像素或者体素分割);而我们同时使用有标签和无标签的数据都参与网络的训练;
2方法
2.1半监督学习
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/fd3fc5194aa6e87b3c89300d59dde893)
首先定义了符号,然后针对有标签的图像,我们可以采用经典的交叉熵构造代价函数,采用SGD的方式来训练网络;
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/568212422982c14d27971680d85d4a6b)
接下来就是本文的重点了,如何将无标签的数据引进来参与网络的训练
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/fae06d5b90d10d975a46b2b6f9921b4f)
在公式2的目标函数中,通过引入右边第二项来定义这个半监督的优化问题;对于网络优化,这是本文的精髓所在:
a.固定网络参数,采用此时的网络去评估未知数据的标签
b.第二步,未知数据的标签采用第一步评估的结果固定,然后采用已标注的标签数据和这个未知数据的预测标签去训练网络
对于网络的训练,首先用已知标签数据对网络经过一定数量的迭代的网络参数作为网络的初始参数;步骤a的执行,本文增加了一个技巧就是通过引入一个条件随机场CRF来对softmax预测的概率图进行精细的分割,然后将其当做未知数据的标签;这样步骤1和2交替执行,网络参数在不断的优化,所以对未知数据的预测结果也会变得越来越好;经过一段时间的训练,网络能够达到一个较优的效果。
2.2条件随机场
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/b81bbcebd95ae5a413c980fa099f3200)
这里条件随机场优化公式3定义的能量函数;其中式3的第一项作用为使得输出尽可能和softmax的概率图一致;第二项用来惩罚那些位置和强度值相近但是预测标签不同的那些分割点;
2.3网络架构
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/7cfb055d2c4859e1fbc933644397a8b2)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/998c8dd040997d2599a0efd5cae4f015)
本文采用的网络基本架构是VGG-16,和DeepLab结构比较相似;主要的不同点就是DeepLab的输出是比原始图像8倍的下采样;同时网络中将不同层的多尺度特征map通过不同尺度的上采样来还原到原始图像的尺寸,然后将这些和原始图像同样尺寸特征map通过concatenation的关联层进行组合为单层输出,最后使用1*1的卷积核对该输出的map进行卷积来得到softmax的概率图谱;(这里其实比较惊讶1*1的卷积核尽然能够实现softmax map)
3实验和结果
3.1数据和预处理
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/38573f3f9dc5c0037f350c706be21ce8)
设置了两种训练数据集设置:
a.20标注数据,60个未标注数据
b.80标注数据,240未标注数据
3.2参数设置
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/8540ac1ad565cb82d4a8f1369474f1ad)
实现是基于Theano,好像并没有去开源代码
4结果对比和展望
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/fe32bbb109f0b565dfece99e4122031f)
作者对比了最先进的对图谱方法
![](https://oscdn.geek-share.com/Uploads/Images/Content/201909/21/980caca272cfd207eb247cf7e8c56927)
展望和作者以后想改进方向。
本文采用的网络基本架构是VGG-16,和DeepLab结构比较相似;主要的不同点就是DeepLab的输出是比原始图像8倍的下采样;同时网络中将不同层的多尺度特征map通过不同尺度的上采样来还原到原始图像的尺寸,然后将这些和原始图像同样尺寸特征map通过concatenation的关联层进行组合为单层输出,最后使用1*1的卷积核对该输出的map进行卷积来得到softmax的概率图谱;
摘要:
由于对于医学图像的标注费时费力,因此本文提出一种半监督的学习方法;
并且这个方法比最好的多图谱的方法分割效果和速度上都有改进;
1引言
我们知道全卷积神经网络有大量的参数,同时伴随着需要大量的训练数据集,然而由于医学图像的特殊性,如此大量的有标签数据不好提供,因此本文的贡献点之一是缓解了数据集少的问题。
1.1相关工作
现有研究针对这个问题的主要的训练方式(采用全监督的方式,用已有的训练数据训练网络,提取精细和粗略的特征,然后组合这些多尺度特征去逐像素或者体素分割);而我们同时使用有标签和无标签的数据都参与网络的训练;
2方法
2.1半监督学习
首先定义了符号,然后针对有标签的图像,我们可以采用经典的交叉熵构造代价函数,采用SGD的方式来训练网络;
接下来就是本文的重点了,如何将无标签的数据引进来参与网络的训练
在公式2的目标函数中,通过引入右边第二项来定义这个半监督的优化问题;对于网络优化,这是本文的精髓所在:
a.固定网络参数,采用此时的网络去评估未知数据的标签
b.第二步,未知数据的标签采用第一步评估的结果固定,然后采用已标注的标签数据和这个未知数据的预测标签去训练网络
对于网络的训练,首先用已知标签数据对网络经过一定数量的迭代的网络参数作为网络的初始参数;步骤a的执行,本文增加了一个技巧就是通过引入一个条件随机场CRF来对softmax预测的概率图进行精细的分割,然后将其当做未知数据的标签;这样步骤1和2交替执行,网络参数在不断的优化,所以对未知数据的预测结果也会变得越来越好;经过一段时间的训练,网络能够达到一个较优的效果。
2.2条件随机场
这里条件随机场优化公式3定义的能量函数;其中式3的第一项作用为使得输出尽可能和softmax的概率图一致;第二项用来惩罚那些位置和强度值相近但是预测标签不同的那些分割点;
2.3网络架构
本文采用的网络基本架构是VGG-16,和DeepLab结构比较相似;主要的不同点就是DeepLab的输出是比原始图像8倍的下采样;同时网络中将不同层的多尺度特征map通过不同尺度的上采样来还原到原始图像的尺寸,然后将这些和原始图像同样尺寸特征map通过concatenation的关联层进行组合为单层输出,最后使用1*1的卷积核对该输出的map进行卷积来得到softmax的概率图谱;(这里其实比较惊讶1*1的卷积核尽然能够实现softmax map)
3实验和结果
3.1数据和预处理
设置了两种训练数据集设置:
a.20标注数据,60个未标注数据
b.80标注数据,240未标注数据
3.2参数设置
实现是基于Theano,好像并没有去开源代码
4结果对比和展望
作者对比了最先进的对图谱方法
展望和作者以后想改进方向。
相关文章推荐
- Decoupled deep neural network for semi-supervised semantic segmentation 笔记
- Hierarchical Attention Based Semi-supervised Network Representation Learning
- 论文笔记之:Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation
- 论文笔记:An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application
- 论文笔记《IS object localization for free? Weakly-supervised learning with convolutional neural network》
- 论文阅读(Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition)
- Paper-[acmi 2015]Image based Static Facial Expression Recognition with Multiple Deep Network Learning
- Paper notes-Wide Inference Network for Image Denoising viaLearning Pixel-distribution Prior
- 语义分割--Learning Object Interactions and Descriptions for Semantic Image Segmentation
- Learning a Deep Convolutional Network for Image Super-Resolution—Chao Dong_ECCV2014
- Semi-supervised Learning in Gigantic Image Collections
- Supervised Hashing for Image Retrieval via Image Represention Learning-笔记1
- [DIS]Deep Dual Learning for Semantic Image Segmentation
- Learning Deconvolution Network for Semantic Segmentation
- Incoherent dictionary learning for sparse representation based image denoising(一)
- Learning a Deep Convolutional Network for Image Super-Resolution(泛读)
- Deep Residual Learning for Image Recognition(ResNet)残差网络解读
- Deep Learning for Content-Based Image Retrival:A Comprehensive Study 学习笔记
- 深度学习用于基于内容的图像检索 Deep Learning for Content-Based Image Retrieval
- 深度学习论文笔记(七)---Deconvolution network-2016年(Learning Deconvolution Network for Semantic Segmentation )