手写识别软件背景知识
2004-12-14 16:04
260 查看
1.手写识别软件
手写识别软件包括两部分:识别程序和识别字典。
(1)识别程序是指可执行代码和生成这些可执行代码的源程序(也可称为源代码)。这一源代码其实就是程序化的识别算法。
(2)识别字典是在识别程序运行过程中必须要用到的特殊的数据库,它包含可识别字符集中全部字符的手写特征描述(即模板)。识别字典是由字典生成程序对大量的训练样本进行复杂的运算生成的,字典生成程序和识别程序息息相关,但并不一致。识别字典的构造和生成是影响一个识别软件的性能的至关重要的关键部分;不同的公司由于所掌握的训练样本的不同和字典生成程序的不同,不可能生成和使用同样的识别字典。
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
2.识别过程描述
联机手写文字的识别过程即是将通过手写设备采样得到的笔迹数据,经过识别程序的处理,最后转化为计算机所使用的文字代码的过程。通常分为四个阶段:预处理、归一化、特征抽取、特征匹配。见下图
<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />
<?xml:namespace prefix = w ns = "urn:schemas-microsoft-com:office:word" />
3.识别性能指标
通常评价一个识别软件的好坏,主要依据以下几个性能指标:
(1) 识别率:指对特定的某个大规模的测试样本集的识别正确率,通常细分为首选正确率和十选正确率。测试样本集通常分为:工整字、连笔字、自由书写字(即倒插笔字)。(见国家八六三评测)
因此,识别能力(如能否识别连笔字?能否识别倒插笔?)也是识别性能评价的一个重要指标。
(2) 识别速度:每识别一个待测样本(字)所耗费的CPU运行时间。
(3) 可识别字符集的范围大小:通常包括标准汉字(GB2312规定的6763个汉字)、异体字(繁体字和非标准的简化字)、英文字母、阿拉伯数字、标点、符号等。
(4) 识别字典的大小
(5) 对内存(RAM)的需求:即在识别过程中所需要的内存(RAM)的多少。
如果一个识别软件的识别率很高、识别速度很快、可识别字符集范围很全面、识别字典很小、内存需求也很少,那么它就是一个非常好的识别软件了。
识别性能取决于识别程序和识别字典的构造。
手写识别软件包括两部分:识别程序和识别字典。
(1)识别程序是指可执行代码和生成这些可执行代码的源程序(也可称为源代码)。这一源代码其实就是程序化的识别算法。
(2)识别字典是在识别程序运行过程中必须要用到的特殊的数据库,它包含可识别字符集中全部字符的手写特征描述(即模板)。识别字典是由字典生成程序对大量的训练样本进行复杂的运算生成的,字典生成程序和识别程序息息相关,但并不一致。识别字典的构造和生成是影响一个识别软件的性能的至关重要的关键部分;不同的公司由于所掌握的训练样本的不同和字典生成程序的不同,不可能生成和使用同样的识别字典。
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
2.识别过程描述
联机手写文字的识别过程即是将通过手写设备采样得到的笔迹数据,经过识别程序的处理,最后转化为计算机所使用的文字代码的过程。通常分为四个阶段:预处理、归一化、特征抽取、特征匹配。见下图
<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />
<?xml:namespace prefix = w ns = "urn:schemas-microsoft-com:office:word" />
3.识别性能指标
通常评价一个识别软件的好坏,主要依据以下几个性能指标:
(1) 识别率:指对特定的某个大规模的测试样本集的识别正确率,通常细分为首选正确率和十选正确率。测试样本集通常分为:工整字、连笔字、自由书写字(即倒插笔字)。(见国家八六三评测)
因此,识别能力(如能否识别连笔字?能否识别倒插笔?)也是识别性能评价的一个重要指标。
(2) 识别速度:每识别一个待测样本(字)所耗费的CPU运行时间。
(3) 可识别字符集的范围大小:通常包括标准汉字(GB2312规定的6763个汉字)、异体字(繁体字和非标准的简化字)、英文字母、阿拉伯数字、标点、符号等。
(4) 识别字典的大小
(5) 对内存(RAM)的需求:即在识别过程中所需要的内存(RAM)的多少。
如果一个识别软件的识别率很高、识别速度很快、可识别字符集范围很全面、识别字典很小、内存需求也很少,那么它就是一个非常好的识别软件了。
识别性能取决于识别程序和识别字典的构造。
相关文章推荐
- Tegaki:自由的手写识别软件
- 【机器学习实战-kNN:手写识别】python3实现-书本知识【3】
- 【Android】应用程序安全性检测软件1.背景知识搜集
- 介绍的嵌入式软件开发的背景知识,基本逻辑和流程,基本名词、概念和理念
- TensorFlow学习记录-- 5.用lstm对手写数字进行识别(待修改,差增加rnn以及lstm的知识)
- 软件项目开发实践中需要积累哪些知识
- tensorflow学习(4):保存模型Saver.save()的参数命名机制以及restore并创建手写字体识别引擎
- wince开放背景知识
- Deep Learning 4J 学习(二) MNIST(手写数字识别)
- 机器学习xgboost实战—手写数字识别
- TensorFlow实现手写数字识别
- 机器学习实践之手写数字识别 - 数据初识
- PDF可以通过OCR图文识别软件转换为JPEG图像吗
- 深度学习二:自己写java代码,识别手写数字
- 软件开发的一些必备知识————客户
- 软件开发之硬件扫盲篇)固态硬盘需要了解的知识
- Caffe学习-手写数字识别
- “企业知识软件”漫谈
- tomcat源码阅读(三)——ClassLoader背景知识
- TensorFlow学习笔记【二】 手写数字识别入门