您的位置：首页 > 其它

人脑是怎样认知图像的？——特征分析模式（传统模式识别之三）

2011-01-22 14:49 399 查看

前面已经说过，模式是由若干元素或成分按一定关系构成的。这些元素或成分可称为特征，而其关系有时也称为特征。特征说认为，模式可分解为诸特征。

例如，一个大写的英文字母A可以分解为下列特征(见下图)：两条斜线、一条水平线和3个锐角。这3个锐角实际上表明这些线段的关系，即两条斜线相交和水平线与两条斜线相接。
Lindsay和Norman（1977）指出，构成所有26个英文字母的特征共有7种，即垂直线、水平线、斜线、直角、锐角、连续曲线和不连续曲线，如F有一条垂直线、两条水平线和3个直角；P有与F一样的特征，外加一条不连续曲线；R有与P一样的特征，另有一条斜线，等等。
Gibson（1969）也曾就英文字母的特征提出过类似的看法，但区分出12种特征。
照特征说看来，特征和特征分析在模式识别中起着关键的作用。其认为外部刺激在人的长时记忆中，是以其各种特征来表征的，在模式识别过程中，首先要对刺激的特征进行分析，也即抽取刺激的有关特征，然后将这些抽取的特征加以合并，再与长时记忆中的各种刺激的特征进行比较，一旦获得最佳的匹配，外部刺激就被识别了。这就是一般的特征分析模型。

特征说所强调的特征，不管它在长时记忆中的编码形式是怎样的，其地位和作用看起来类似模板说中的模板。
Anderson（1980）指出，这种特征似可看作微型模板。这个看法是有一定道理的。也许可以说，特征是一种局部的部件模板。但是特征说毕竟不同于模板说，并且具有一定的优点。

首先，依据刺激的特征和关系进行识别，就可以不管刺激的大小、方位等其他细节，避开预加工的困难和负担，使识别有更强的适应性。
其次，同样的特征可以出现在许多不同的模式中，必然要极大地减轻记忆的负担。
第三，由于需要获得刺激的组成成分信息，即抽取必要的特征和关系，再加以综合，才能进行识别，这使模式识别过程可带有更多的学习色彩。这一点看来是极重要的。应当说，特征分析模型是含有较多的学习可能性的。
还可以预料，当不同的模式具有一些共同的特征时，就会使识别发生困难，甚至出现错误，将这些模式混淆起来。在人的实际知觉中，确实常常出现这些情况。这方面的事实也是支持特征说的有力的证据。对此曾进行过有关的实验研究。
特征分析模式是根据图像特征实现视觉再现。该模式首先是从图像中提取特征，而特征是依各种图像而千差万别的。因此特征的提取涉及面很广，与识别对象的各种物理、形态的性能都有关系。垂直线、水平线、曲线、角、交点、孔等都可以作为特征，因此产生了各种各样的特殊方法来抽取特征。均值、方差、信息量、相关系数、绝对值等也可以作为特征，这样就涉及到大量的特征计算。
特征分析模式还有两个难以克服的困难问题：一个是如何选取合理的特征去表示自然界的图像；另一个是如何确定所选特征之间的相互关系。
设想识别一只鸟，这时可以定义鸟的特征是：羽毛、翅膀、尾巴、鸟头和鸟脚。问题是识别羽毛、翅膀、尾巴、鸟头和鸟脚之类并不比识别一只完整的鸟容易。当然也可以将垂直线、水平线、曲线、角和圆作为鸟的特征。问题是这时要选取许许多多这类特征，而这类特征也可以用来描述小狗小猫，更何况至今无人用这类特征去描述自然界的复杂景物。
事实上所选取特征之间的相互关系也是个非常复杂的问题.特征所处的位置,特征之间相互形成的走向,特征与特征的相互干扰等等,以及阴影、叠合、掩盖等，都会影响视觉识别的最后结果。
特征分析模式在识别字符和简单几何图形中精度高。尤其是识别人脸；生物学的实验说明，人的头脑中存在选择物体的某些特性的专门机构。

(作者：刘建忠 http://hi.baidu.com/liujianz
）

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航