厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩
2018-03-14 10:48
363 查看
摘要: 近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。
原文:http://click.aliyun.com/m/43719/
近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。(竞赛结果页面:http://rrc.cvc.uab.es/?ch=8&com=evaluation&task=1)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201803/d60aa01b01d7de321feda99a5af8318c.png)
据了解,ICDAR(International Conference on Document Analysis and Recognition)具有OCR领域的奥斯卡盛会之称,是全球OCR领域公认最权威的比赛之一。
当前,OCR技术被广泛应用于多个领域。从名片、发票、银行卡等票据的数字化到室外街道商店索引,路标路牌识别;再到图片、视频文字内容理解与内容安全,OCR技术都发挥着越来越重要的作用。
阿里安全图灵实验室研究人员称,在技术上,文本检测和识别需要应付各种考验和挑战,如自然场景下光照的影响,物体的遮挡,文字大小、比例、角度的变化,图像视频中文字的模糊等等。ICDAR2017 MLT竞赛包含了中、日、韩、拉丁(英、法、德、意)、阿拉伯和孟加拉等9种语言,其图像采集自各种各样的场景,其中的文本的长度、字体、尺寸、颜色千变万化,同时还包含了许多真实场景的噪声包括光照、遮挡、倾斜、文字堆叠、文字镶嵌、透视变化等等,这对于OCR算法的适应能力更具挑战性。
为攻克这些难题,阿里安全图灵实验室的研究人员设计了基于深度学习的网络模型和算法。
据介绍,图灵实验室的研究人员在文字检测模型方面,采用深度卷积神经网络获得更深层的图像特征;并利用多尺度特征和非对称卷积核获得更好的感受视野,从而适应各种环境,各种大小、比例、角度的文字。此外,由于框架采用创新性的检测策略,因此相较于传统的RCNN-based方案,在检测速度上有很大提升。在文字识别模型,图灵实验室的研究人员在主流方案的基础上,做了全新的探索和研究,从而获得了更为有效的识别模型,在保证识别准确率的前提下,提高了识别效率。
阿里安全图灵实验室研究人员表示,ATL Cangjie OCR提供在线同步、异步通用OCR文字检测和识别服务,以及离线ODPS服务,为图片文字内容理解与内容安全提供强有力的技术支撑。该模型已经全面支撑阿里生态中的商品内容安全、业务安全、平台治理、评价、交互、认证等多个业务场景,同时,还通过阿里云盾-内容安全(绿网)产品,输出给第三方客户使用。
目前,ATL Cangjie OCR服务日均调用量几亿次,可为客户提供稳定的技术保障。
原文:http://click.aliyun.com/m/43719/
近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。(竞赛结果页面:http://rrc.cvc.uab.es/?ch=8&com=evaluation&task=1)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201803/d60aa01b01d7de321feda99a5af8318c.png)
据了解,ICDAR(International Conference on Document Analysis and Recognition)具有OCR领域的奥斯卡盛会之称,是全球OCR领域公认最权威的比赛之一。
当前,OCR技术被广泛应用于多个领域。从名片、发票、银行卡等票据的数字化到室外街道商店索引,路标路牌识别;再到图片、视频文字内容理解与内容安全,OCR技术都发挥着越来越重要的作用。
阿里安全图灵实验室研究人员称,在技术上,文本检测和识别需要应付各种考验和挑战,如自然场景下光照的影响,物体的遮挡,文字大小、比例、角度的变化,图像视频中文字的模糊等等。ICDAR2017 MLT竞赛包含了中、日、韩、拉丁(英、法、德、意)、阿拉伯和孟加拉等9种语言,其图像采集自各种各样的场景,其中的文本的长度、字体、尺寸、颜色千变万化,同时还包含了许多真实场景的噪声包括光照、遮挡、倾斜、文字堆叠、文字镶嵌、透视变化等等,这对于OCR算法的适应能力更具挑战性。
为攻克这些难题,阿里安全图灵实验室的研究人员设计了基于深度学习的网络模型和算法。
据介绍,图灵实验室的研究人员在文字检测模型方面,采用深度卷积神经网络获得更深层的图像特征;并利用多尺度特征和非对称卷积核获得更好的感受视野,从而适应各种环境,各种大小、比例、角度的文字。此外,由于框架采用创新性的检测策略,因此相较于传统的RCNN-based方案,在检测速度上有很大提升。在文字识别模型,图灵实验室的研究人员在主流方案的基础上,做了全新的探索和研究,从而获得了更为有效的识别模型,在保证识别准确率的前提下,提高了识别效率。
阿里安全图灵实验室研究人员表示,ATL Cangjie OCR提供在线同步、异步通用OCR文字检测和识别服务,以及离线ODPS服务,为图片文字内容理解与内容安全提供强有力的技术支撑。该模型已经全面支撑阿里生态中的商品内容安全、业务安全、平台治理、评价、交互、认证等多个业务场景,同时,还通过阿里云盾-内容安全(绿网)产品,输出给第三方客户使用。
目前,ATL Cangjie OCR服务日均调用量几亿次,可为客户提供稳定的技术保障。
相关文章推荐
- 厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩
- 厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩
- 厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩
- 厉害了!阿里安全图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成绩
- 阿里安全图灵实验室再次刷新世界顶级算法比赛成绩
- 独家探寻阿里安全潘多拉实验室,完美越狱苹果iOS11.2.1
- 阿里安全图灵实验室再次刷新世界顶级算法比赛成绩
- 阿里安全归零实验室招聘各路大牛!offer好说!
- 阿里安全潘多拉实验室首先完美越狱苹果iOS 11.2
- 独家探寻阿里安全潘多拉实验室,完美越狱苹果iOS11.2.1
- 阿里安全潘多拉实验室首先完美越狱苹果iOS 11.2
- 前沿 | 抗击黑产 阿里安全八大实验室首秀技术实力
- 阿里安全潘多拉实验室首先完美越狱苹果iOS 11.2
- 阿里安全潘多拉实验室的研究人员揭秘如何完美越狱苹果iOS11.2.1
- 阿里安全潘多拉实验室的研究人员揭秘如何完美越狱苹果iOS11.2.1
- 阿里安全潘多拉实验室首先完美越狱苹果iOS 11.2
- 本周资讯top3 【越狱苹果】独家探寻阿里安全潘多拉实验室,完美越狱苹果iOS11.2.1 知道如何从攻击的视角去发现漏洞,才能建立更安全的体系,促进了整个生态的良性发展。以阿里安全潘多拉实验室为例
- 12月25日云栖精选夜读:阿里安全潘多拉实验室龙磊:越狱 iOS 11.2,我选了一条最难走的路
- [双语阅读]“世界最好工作”得主携女友赴澳走马上任