字符识别算法SWT实现中的一些经验总结
2016-08-31 15:03
429 查看
自然场景中的文字识别,不得不提SWT算法【 Boris Epshtein , etc. Detecting Text in Natural Scenes with Stroke Width Transform. CVPR, 2010】,
该算法主要思想是通过canny提取边缘和梯度,然后通过梯度方向去搜索相反方向的边缘,搜索过程中的记录的路径长度就是该路径上所有像素对应的笔画宽度
在实现该算法过程中发现在计算中文字符过程中会有很多细节上的问题出现:
1.就是即使在边缘都被准确提取到的情况下,在查找边缘计算像素宽度仍然有问题,
如下图所示,在逐个像素点计算时,会出现跳过边缘点的情况,导致搜索路径长于实际值
2.文章中给定的pi/6阈值来确定搜索方向的一个评估范围对于中文字符来讲,太严苛,造成很多边缘方向定位越界,因为中文字符的笔画远比英文字符复杂的
结合上面2点,中文字符,比较适合从上下左右方向去搜索边缘,确定像素宽度,以最小值作为宽度值
后续有更新在补充
该算法主要思想是通过canny提取边缘和梯度,然后通过梯度方向去搜索相反方向的边缘,搜索过程中的记录的路径长度就是该路径上所有像素对应的笔画宽度
在实现该算法过程中发现在计算中文字符过程中会有很多细节上的问题出现:
1.就是即使在边缘都被准确提取到的情况下,在查找边缘计算像素宽度仍然有问题,
如下图所示,在逐个像素点计算时,会出现跳过边缘点的情况,导致搜索路径长于实际值
2.文章中给定的pi/6阈值来确定搜索方向的一个评估范围对于中文字符来讲,太严苛,造成很多边缘方向定位越界,因为中文字符的笔画远比英文字符复杂的
结合上面2点,中文字符,比较适合从上下左右方向去搜索边缘,确定像素宽度,以最小值作为宽度值
后续有更新在补充
相关文章推荐
- Flex开发的一些经验总结——本地化(多语言)实现
- Atitit 图像清晰度 模糊度 检测 识别 评价算法 源码实现attilax总结
- 字符识别OCR研究三 字符识别,字符区域定位 经验总结:
- 基于PCA的人脸识别_Matlab实现(个人研读之后的一些总结)
- 项目技术经验总结二:系统多风格的实现
- php实现文件上传的一些经验
- ‘年轻’绝对不是‘经验’的对手---- 对一些开发经验的总结
- 总结一些经验(1)
- 关于ASPNET在IIS一些问题的经验总结
- 用BP网络算法实现对含噪声0到9数字的识别
- 关于ASPNET在IIS一些问题的经验总结
- 这是我们公司总结的一些关于中文乱码问题的一些解决方案和经验和大家分享!
- 关于ASP.NET在IIS一些问题的经验总结
- 关于ASP.NET在IIS一些问题的经验总结
- 做了两个月ajax,总结一些小经验
- 一些设计经验要点总结
- 关于ASP.NET在IIS一些问题的经验总结(zz)
- 关于ASP.NET在IIS一些问题的经验总结
- 总结一些经验(2)
- 这是我们公司总结的一些关于中文乱码问题的一些解决方案和经验和大家分享!