Java 图像智能字符识别技术——【专题三】
2017-07-27 00:00
337 查看
对于图像智能字符识别时,我们处理的时候单纯的使用一种算法去识别时识别率是非常低的。而实际上企业或真实项目中的图片都是做过各种处理的,在这种情况下我们单纯的使用一种方法,显得过于苍白。我们在专题一种讲到的图片识别前的准备工作还有很多,只用专题二中的【二值化】、【噪声消除】还远远不够,这节我们看一下【倾斜较正】和【字符切割】处理。
eg:
图 一
图 二
可能图一我们按照一定的比例去切割在识别的时候还是没有问题的。对于图二我们按照一定比例切割时,上面提到的问题将都会出现。对于第二张图需要说一下图中绿色部分,白色是原图的底色,在分隔的时候就像图二一样在最后一次分隔时原图片剩余部分不够分隔比例时,这种图在分隔之前需要在原图上补充扩展底图,让其宽度是分割比例的倍数。这样可防止切割时最后一张图不切割的问题。
这是使用物理切割的方法区识别,还有一些更高明的分隔算法eg:投影分隔、颜色聚类等分隔算法。有兴趣的朋友可以再去研究此类算法,再次就不赘述了。
字符切割
给大家几个例子还拿某互联网公司的电话号码来说,他们选择了红色,而且图片的举例明显离得很近,这样的话明显给识别带来了难度(红色在调整阀值时反差不够明显,文字间距小识别就容易出错),对这种我们可以采用字符切分,按照一定比例去切分图片(该方法适用性不是很强,需要先找到图片的规律,而且切割时容易切割错位。那为什么还要讲,毕竟也是一种方法,在一些特殊情况这种方法还是很有效果的),切分后给各个图片编号。使用其他算法按照顺序单个处理即可。eg:
图 一
图 二
可能图一我们按照一定的比例去切割在识别的时候还是没有问题的。对于图二我们按照一定比例切割时,上面提到的问题将都会出现。对于第二张图需要说一下图中绿色部分,白色是原图的底色,在分隔的时候就像图二一样在最后一次分隔时原图片剩余部分不够分隔比例时,这种图在分隔之前需要在原图上补充扩展底图,让其宽度是分割比例的倍数。这样可防止切割时最后一张图不切割的问题。
这是使用物理切割的方法区识别,还有一些更高明的分隔算法eg:投影分隔、颜色聚类等分隔算法。有兴趣的朋友可以再去研究此类算法,再次就不赘述了。
倾斜较正
在实际项目中如名片识别系统、身份证识别系统、车管系统等都会用到图片识别技术,而车管系统中对车牌照的识别,可能拍摄的角度、司机对车牌照悬挂的方式都有可能产生倾斜,倾斜图片对于图片识别影响很大,对于倾斜矫正有很多现成的方法,如Hough、OpenCV等技术都能实现。Hough
Hough变换可用于一般文档图像的倾斜校正。OpenCV
OpenCV实现基于傅里叶变换的旋转文本校正相关文章推荐
- java 图像智能字符识别技术——【专题二】
- Java 图像智能字符识别技术——【专题一】
- Java OCR tesseract 图像智能字符识别技术 Java代码实现(二)
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- [转]Java OCR 图像智能字符识别技术,可识别中文
- java整理软件--- Java OCR 图像智能字符识别技术,可识别中文,但是验证码不可以识别...已测识别中文效果很好
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR 图像智能字符识别技术,可识别中文
- Java OCR 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR tesseract 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- java整理软件--- Java OCR 图像智能字符识别技术,可识别中文,但是验证码不可以识别...已测识别中文效果很好
- Java OCR tesseract 图像智能字符识别技术
- Java OCR 图像智能字符识别技术,可识别中文
- Java OCR tesseract 图像智能字符识别技术