【论文笔记】Text-Detection_简略版_201604
2016-04-26 17:31
295 查看
最近在研究一个新课题-Text Detection,正在读论文中。。。
这篇文章将局部和全局信息结合,使用了一种coarse-to-fine的方法来定位自然场景中的文本。首先,使用了全卷积的神经网络来训练和预测文字区域的显著图;然后,结合显著图和文字元素来估计文字所在的直线;最后,另一个全卷积模型的分类器用来估计每个字符的中心,从而去掉误检区域。这个系统能够处理不同方向、语言、字体的文本检测,在MSRA-TD500, ICDAR2015和ICDAR2013的评测集上都取得了state-of-the-art的结果。
PS:这篇文章被CVPR 2016收录,在valse 2016会议中见过了作者,也讨论了一些问题,帮我普及了文本检测的基本知识。
2、TextProposals: a Text-specific Selective Search Algorithm for Word Spotting in the Wild.
这篇文章针对文本的特殊属性,将object proposal 的方法用在了文本检测中,形成了text-proposal。
text-proposal也是基于联通区域的组合,但又与之前的方法有所不同:初始化的区域并不对应单个字符,也不需要知道里面的字符数。
代码见:https://github.com/lluisgomez/TextProposals
3、Chen H, Tsai S S, Schroth G, et al. Robust text detection in natural images with edge-enhanced maximally stable extremal regions[C]//Image Processing (ICIP), 2011 18th IEEE International Conference on. IEEE, 2011: 2609-2612.
作者提出了一种叫做最大稳定极值区域(Maximally Stable Extremal Regions,MSER)作为文本候选,再通过几何和笔划宽度信息滤掉非本文区域, 剩余的文本信息形成文本直线,最终可被切分为单个文字。
Matlab代码参见:http://cn.mathworks.com/help/vision/examples/automatically-detect-and-recognize-text-in-natural-images.html
20160426
1、Zhang Z, Zhang C, Shen W, et al. Multi-Oriented Text Detection with Fully Convolutional Networks[J]. arXiv preprint arXiv:1604.04018, 2016.这篇文章将局部和全局信息结合,使用了一种coarse-to-fine的方法来定位自然场景中的文本。首先,使用了全卷积的神经网络来训练和预测文字区域的显著图;然后,结合显著图和文字元素来估计文字所在的直线;最后,另一个全卷积模型的分类器用来估计每个字符的中心,从而去掉误检区域。这个系统能够处理不同方向、语言、字体的文本检测,在MSRA-TD500, ICDAR2015和ICDAR2013的评测集上都取得了state-of-the-art的结果。
PS:这篇文章被CVPR 2016收录,在valse 2016会议中见过了作者,也讨论了一些问题,帮我普及了文本检测的基本知识。
2、TextProposals: a Text-specific Selective Search Algorithm for Word Spotting in the Wild.
这篇文章针对文本的特殊属性,将object proposal 的方法用在了文本检测中,形成了text-proposal。
text-proposal也是基于联通区域的组合,但又与之前的方法有所不同:初始化的区域并不对应单个字符,也不需要知道里面的字符数。
代码见:https://github.com/lluisgomez/TextProposals
3、Chen H, Tsai S S, Schroth G, et al. Robust text detection in natural images with edge-enhanced maximally stable extremal regions[C]//Image Processing (ICIP), 2011 18th IEEE International Conference on. IEEE, 2011: 2609-2612.
作者提出了一种叫做最大稳定极值区域(Maximally Stable Extremal Regions,MSER)作为文本候选,再通过几何和笔划宽度信息滤掉非本文区域, 剩余的文本信息形成文本直线,最终可被切分为单个文字。
Matlab代码参见:http://cn.mathworks.com/help/vision/examples/automatically-detect-and-recognize-text-in-natural-images.html
相关文章推荐
- 自然场景文本识别:基于笔画宽度变换的文本检测
- 使用SSD训练文本检测
- 【翻译】EAST: An Efficient and Accurate Scene Text Detector
- 【AAAI2017】TextBoxes:A Fast Text Detector with a Single Deep Neural Network
- Detecting Texts of Arbitrary Orientations in Natural Images(总结)
- ios使用友盟分享到QQ/微信时时如何判断手机上是否安装了QQ以及微信的客户端
- ubuntu12.04 安装 gcc-4.8
- poj2891 Strange Way to Express Integers(中国剩余定理)
- 数组易错点
- 如何在activity中隐藏导航栏
- Oracle使用存储过程分页
- java面试题剖析
- ACdream 113 The Arrow (概率DP)
- 笔试题39. LeetCode OJ (26)
- Firefox extension 开发之常用XPCOM service
- 作业6-学生成绩录入
- 单例模式的懒汉式和饿汉式实现分析
- RestSharp使用备忘
- 记住密码超简单实现(C#)
- centos7 开启防火墙端口 firewalld